Ankur Bapna

Multimodal Modeling for Spoken Language Identification

Shikhar Bharadwaj

Min Ma

Shikhar Vashishth

Ankur Bapna

Sriram (Sri) Ganapathy

Vera Axelrod

Sid Dalmia

Wei Han

Yu Zhang

Daan van Esch

Sandy Ritchie

Partha Talukdar

Jason Riesa

Proceedings of 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024) (2024)

Miipher: A Robust Speech Restoration Model Integrating Self-Supervised Speech Representation and Linguistic Features

Yuma Koizumi

Heiga Zen

Shigeki Karita

Yifan Ding

Kohei Yatabe

Nobuyuki Morioka

Yu Zhang

Wei Han

Ankur Bapna

Michiel Adriaan Unico Bacchiani

WASPAA 2023 (2023) (to appear)

Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-to-Speech

Takaaki Saeki

Heiga Zen

Zhehuai Chen

Nobuyuki Morioka

Gary Wang

Yu Zhang

Ankur Bapna

Andrew Rosenberg

Bhuvana Ramabhadran

ICASSP (2023)

Label Aware Speech Representation Learning For Language Identification

Ankur Bapna

Min Ma

Partha Talukdar

Shikhar Bharadwaj

Shikhar Vashishth

Sriram Ganapathy

Vera Axelrod

Wei Han

Proceedings of Interspeech 2023, pp. 5351-5355

Mu2SLAM: Multitask, Multilingual Speech and Language Models

Yong Cheng

Yu Zhang

Melvin Johnson

Wolfgang Macherey

Ankur Bapna

Submission to ACL 2023

LibriTTS-R: Restoration of a Large-Scale Multi-Speaker TTS Corpus

Yuma Koizumi

Heiga Zen

Shigeki Karita

Yifan Ding

Kohei Yatabe

Nobuyuki Morioka

Michiel Adriaan Unico Bacchiani

Yu Zhang

Wei Han

Ankur Bapna

Interspeech 2023 (2023)

Building Machine Translation Systems for the Next Thousand Languages

Ankur Bapna

Isaac Caswell

Julia Kreutzer

Orhan Firat

Daan van Esch

Aditya Siddhant

Mengmeng Niu

Pallavi Nikhil Baljekar

Xavier Garcia

Wolfgang Macherey

Theresa Breiner

Vera Saldinger Axelrod

Jason Riesa

Yuan Cao

Mia Chen

Klaus Macherey

Maxim Krikun

Pidong Wang

Alexander Gutkin

Apu Shah

Yanping Huang

Zhifeng Chen

Yonghui Wu

Macduff Richard Hughes

Google Research (2022)

Multilingual Mix: Example Interpolation Improves Multilingual Neural Machine Translation

Yong Cheng

Ankur Bapna

Orhan Firat

Yuan Cao

Pidong Wang

Wolfgang Macherey

ACL 2022

XTREME-S: Evaluating Cross-lingual Speech Representations

Ankur Bapna

Clara E. Rivera

Daan van Esch

Jason Riesa

Jon Clark

Melvin Johnson

Mihir Sanjay Kale

Min Ma

Orhan Firat

Sandy Ritchie

Sebastian Ruder

Simran Khanuja

Ye Jia

Yu Zhang

Proc. Interspeech 2022

MAESTRO: Matched Speech Text Representations through Modality Matching

Andrew Rosenberg

Ankur Bapna

Bhuvana Ramabhadran

Heiga Zen (Byungha Chun)

Pedro Jose Moreno Mengibar

Yu Zhang

Zhehuai Chen

interspeech 2022 (2022) (to appear)

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Ankur Bapna

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Ankur Bapna

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us