Markus Freitag

Introducing the NewsPaLM MBR and QE Dataset: LLM-Generated High-Quality Parallel Data Outperforms Traditional Web-Crawled Data

Mara Finkelstein

David Vilar Torres

Markus Freitag

2024

Finding Replicable Human Evaluations via Stable Ranking Probability

Parker Riley

Dan Deutsch

George Foster

Viresh Ratnakar

Ali Dabir

Markus Freitag

2024

Mitigating metric bias in minimum bayes risk decoding

Geza Kovacs

Daniel Deutsch

Markus Freitag

Proceedings of the Ninth Conference on Machine Translation (2024), pp. 1063-1094

Are LLMs Breaking MT Metrics? Results of the WMT24 Metrics Shared Task

Markus Freitag

Nitika Mathur

Dan Deutsch

Chi-kiu Lo

Eleftherios Avramidis

Ricardo Rei

Brian Thompson

Frédéric Blain

Tom Kocmi

Jiayi Wang

David Adelani

Marianna Buchicchio

Chrysoula Zerva

Alon Lavie

2024

Beyond Human-Only: Evaluating Human-Machine Collaboration for Collecting High-Quality Translation Data

Zhongtao Liu

Parker Riley

Dan Deutsch

Alison Lui

Mengmeng Niu

Apu Shah

Markus Freitag

2024

Findings of the WMT24 General Machine Translation Shared Task: The LLM Era is Here but MT is Not Solved Yet

Tom Kocmi

Eleftherios Avramidis

Rachel Bawden

Ondrej Bojar

Anton Dvorkovich

Christian Federman

Mark Fishel

Markus Freitag

Thamme Gowda

Roman Grundkiewicz

Barry Haddow

Marzena Karpinska

Philipp Koehn

Benjamin Marie

Christof Monz

Kenton Murray

Masaaki Nagata

Martin Popel

Maja Popovic

Mariya Shmatova

Steinþór Steingrímsson

Vilém Zouhar

2024

Ties Matter: Meta-Evaluating Modern Metrics with Pairwise Accuracy and Tie Calibration

Dan Deutsch

George Foster

Markus Freitag

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Singapore, pp. 12914-12929

Training and Meta-Evaluating Machine Translation Evaluation Metrics at the Paragraph-Level

Dan Deutsch

Jurik Juraska

Mara Finkelstein

Markus Freitag

Proceedings of the Eighth Conference on Machine Translation, Association for Computational Linguistics, Singapore (2023), pp. 996-1013

There's no Data Like Better Data: Using QE Metrics for MT Data Filtering

Jan-Thorsten Peter

David Vilar Torres

Dan Deutsch

Mara Finkelstein

Jurik Juraska

Markus Freitag

Proceedings of the Eighth Conference on Machine Translation, Association for Computational Linguistics, Singapore (2023), pp. 561-577

The Devil is in the Errors: Leveraging Large Language Models for Fine-grained Machine Translation Evaluation

Patrick Fernandes

Dan Deutsch

Mara Finkelstein

Parker Riley

André Martins

Graham Neubig

Ankush Garg

Jon Clark

Markus Freitag

Orhan Firat

Conference on Machine Translation (2023)

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Markus Freitag

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Markus Freitag

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us