Markus Freitag

Finding Replicable Human Evaluations via Stable Ranking Probability

George Foster

Viresh Ratnakar

Ali Dabir

2024

Introducing the NewsPaLM MBR and QE Dataset: LLM-Generated High-Quality Parallel Data Outperforms Traditional Web-Crawled Data

Mara Finkelstein

David Vilar Torres

Markus Freitag

2024

Findings of the WMT24 General Machine Translation Shared Task: The LLM Era is Here but MT is Not Solved Yet

Tom Kocmi

Eleftherios Avramidis

Rachel Bawden

Ondrej Bojar

Anton Dvorkovich

Christian Federman

Mark Fishel

Markus Freitag

Thamme Gowda

Roman Grundkiewicz

Barry Haddow

Marzena Karpinska

Philipp Koehn

Benjamin Marie

Christof Monz

Kenton Murray

Masaaki Nagata

Martin Popel

Maja Popovic

Mariya Shmatova

Steinþór Steingrímsson

Vilém Zouhar

2024

Beyond Human-Only: Evaluating Human-Machine Collaboration for Collecting High-Quality Translation Data

Zhongtao Liu

Parker Riley

Dan Deutsch

Alison Lui

Mengmeng Niu

Apu Shah

Markus Freitag

2024

Mitigating metric bias in minimum bayes risk decoding

Geza Kovacs

Daniel Deutsch

Markus Freitag

Proceedings of the Ninth Conference on Machine Translation (2024), pp. 1063-1094

Are LLMs Breaking MT Metrics? Results of the WMT24 Metrics Shared Task

Markus Freitag

Nitika Mathur

Dan Deutsch

Chi-kiu Lo

Eleftherios Avramidis

Ricardo Rei

Brian Thompson

Frédéric Blain

Tom Kocmi

Jiayi Wang

David Adelani

Marianna Buchicchio

Chrysoula Zerva

Alon Lavie

2024

INSTRUCTSCORE: Towards Explainable Text Generation Evaluation with Automatic Feedback

Wenda Xu

Danqing Wang

Liangming Pan

Zhenqiao Song

Markus Freitag

William Wang

Lei Li

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Singapore, pp. 5967-5994

MetricX-23: The Google Submission to the WMT 2023 Metrics Shared Task

Jurik Juraska

Mara Finkelstein

Dan Deutsch

Aditya Siddhant

Mahdi Mirzazadeh

Markus Freitag

Conference on Machine Translation (2023)

WMT23 Metrics shared task Submission: Quality Estimation using Minimum Bayes Risk

Subhajit Naskar

Dan Deutsch

Markus Freitag

Proceedings of the Eighth Conference on Machine Translation, Association for Computational Linguistics, Singapore (2023), pp. 806-811

Results of WMT23 Metrics Shared Task: Metrics might be Guilty but References are not Innocent

Markus Freitag

Nitika Mathur

Chi-kiu Lo

Eleftherios Avramidis

Ricardo Rei

Brian Thompson

Tom Kocmi

Frédéric Blain

Dan Deutsch

Craig Stewart

Chrysoula Zerva

Sheila Castilho

Alon Lavie

George Foster

Proceedings of the Eighth Conference on Machine Translation, Association for Computational Linguistics, Singapore (2023), pp. 576-626

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Markus Freitag

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Markus Freitag

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us