Publications

3 results for Gabriel Stanovsky

DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation
- - Eliya Habba
  - Ofir Arviv
  - et al.
- 2025
- ACL 2025
GEM2 Workshop: Generation, Evaluation & Metrics
- - Ofir Arviv
  - Miruna Clinciu
  - et al.
- 2025
- ACL 2025
Navigating the Modern Evaluation Landscape: Considerations in Benchmarks and Frameworks for Large Language Models (LLMs)
- - Leshem Choshen
  - Ariel Gera
  - et al.
- 2024
- LREC-COLING 2024