Andrew Rosenberg

Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-to-Speech

Takaaki Saeki

Heiga Zen

Zhehuai Chen

Nobuyuki Morioka

Gary Wang

Yu Zhang

Ankur Bapna

Andrew Rosenberg

Bhuvana Ramabhadran

ICASSP (2023)

Accented Speech Recognition: Benchmarking, Pre-training, and Diverse Data

Alëna Aksënova

Zhehuai Chen

Chung-Cheng Chiu

Daan van Esch

Pavel Golik

Wei Han

Levi King

Bhuvana Ramabhadran

Andrew Rosenberg

Suzan Schwartz

Gary Wang

(2022)

MAESTRO: Matched Speech Text Representations through Modality Matching

Andrew Rosenberg

Ankur Bapna

Bhuvana Ramabhadran

Heiga Zen (Byungha Chun)

Pedro Jose Moreno Mengibar

Yu Zhang

Zhehuai Chen

interspeech 2022 (2022) (to appear)

Maestro-U: Leveraging joint speech-text representation learning for zero supervised speech ASR

Zhehuai Chen

Ankur Bapna

Andrew Rosenberg

Yu Zhang

Bhuvana Ramabhadran

Pedro Moreno Mengibar

Nanxin Chen

IEEE SLT (2022)

Reducing domain mismatch in self-supervised speech pretraining

Murali Karthick Baskar

Andrew Rosenberg

Bhuvana Ramabhadran

Yu Zhang

submission to Interspeech 2022 (2022) (to appear)

Ask2Mask: Guided Data Selection for Masked Speech Modeling

Murali Karthick Baskar

Andrew Rosenberg

Bhuvana Ramabhadran

Pedro Jose Moreno Mengibar

Yu Zhang

IEEE Journal of Selected Topics in Signal Processing (2022)

Extending Parrotron: An End-to-End, Speech Conversion and Speech Recognition Model for Atypical Speech

Rohan Doshi

Youzheng Chen

Liyang Jiang

Xia Zhang

Fadi Biadsy

Bhuvana Ramabhadran

Andrea Chu

Andrew Rosenberg

Pedro Jose Moreno Mengibar

ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

Semi-Supervision in ASR: Sequential Mixmatch and Factorized TTS-Based Augmentation

Zhehuai Chen

Andrew Rosenberg

Yu Zhang

Heiga Zen (Byungha Chun)

Mohammadreza Ghodsi

Yinghui Huang

Jesse Emond

Gary Wang

Bhuvana Ramabhadran

Pedro Jose Moreno Mengibar

(2021)

Improving Speech Recognition Using Consistent Predictions on Synthesized Speech

Gary Wang

Andrew Rosenberg

Zhehuai Chen

Yu Zhang

Bhuvana Ramabhadran

Heiga Zen (Byungha Chun)

Yonghui Wu

Pedro Jose Moreno Mengibar

IEEE ICASSP 2020

Generating diverse and natural text-to-speech samples using quantized fine-grained VAE and autoregressive prosody prior

Guangzhi Sun

Yu Zhang

Ron J. Weiss

Yuan Cao

Heiga Zen

Andrew Rosenberg

Bhuvana Ramabhadran

Yonghui Wu

ICASSP (2020)

Improving Speech Recognition using GAN-based Speech Synthesis and Contrastive Unspoken Text Selection

Zhehuai Chen

Andrew Rosenberg

Yu Zhang

Gary Wang

Bhuvana Ramabhadran

Pedro Jose Moreno Mengibar

Interspeech 2020

SCADA: Stochastic, Consistent and Adversarial Data Augmentation to Improve ASR

Gary Wang

Andrew Rosenberg

Zhehuai Chen

Yu Zhang

Bhuvana Ramabhadran

Pedro Moreno

Proceedings of Interspeech 2020, pp. 2832-2836

Learning to speak fluently in a foreign language: Multilingual speech synthesis and cross-language voice cloning

Yu Zhang

Ron J. Weiss

Heiga Zen

Yonghui Wu

Zhifeng Chen

RJ Skerry-Ryan

Ye Jia

Andrew Rosenberg

Bhuvana Ramabhadran

Interspeech (2019)

Speech Recognition with Augmented Synthesized Speech

Andrew Rosenberg

Bhuvana Ramabhadran

Pedro Moreno

Ye Jia

Yonghui Wu

Yu Zhang

Zelin Wu

ASRU 2019 (to appear)

No Results Found

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations  & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Andrew Rosenberg

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Andrew Rosenberg

Research Areas

Filter by:

Year

Research Area

Team

Join us

AI/ML Foundations  & Capabilities