Bhuvana Ramabhadran

Twenty-Five Years of Evolution in Speech and Language Processing

Michael Picheny

Bhuvana Ramabhadran

Dilek Hakkani-Tur

Heiga Zen

Jan Skoglund

IEEE Signal Processing Magazine, vol. 40 (2023), pp. 27-39

Preview

Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-to-Speech

Takaaki Saeki

Heiga Zen

Zhehuai Chen

Nobuyuki Morioka

Gary Wang

Yu Zhang

Ankur Bapna

Andrew Rosenberg

Bhuvana Ramabhadran

ICASSP (2023)

Full-Sum Distillation: A Robust Knowledge Distillation Method for RNN-T Models With Noisy Training Labels

Bhuvana Ramabhadran

Kartik Audhkhasi

Mohammad Zeineldeen

Murali Karthick Baskar

ICASSP 2023 (2023)

MAESTRO: Matched Speech Text Representations through Modality Matching

Andrew Rosenberg

Ankur Bapna

Bhuvana Ramabhadran

Heiga Zen (Byungha Chun)

Pedro Jose Moreno Mengibar

Yu Zhang

Zhehuai Chen

interspeech 2022 (2022) (to appear)

Maestro-U: Leveraging joint speech-text representation learning for zero supervised speech ASR

Zhehuai Chen

Ankur Bapna

Andrew Rosenberg

Yu Zhang

Bhuvana Ramabhadran

Pedro Moreno Mengibar

Nanxin Chen

IEEE SLT (2022)

Reducing domain mismatch in self-supervised speech pretraining

Murali Karthick Baskar

Andrew Rosenberg

Bhuvana Ramabhadran

Yu Zhang

submission to Interspeech 2022 (2022) (to appear)

Multilingual Second-Pass Rescoring for Automatic Speech RecognitionSystems

Bhuvana Ramabhadran

Ehsan Variani

Neeraj Gaur

Parisa Haghani

Pedro Moreno Mengibar

Tongzhou Chen

ICASSP (2022)

Ask2Mask: Guided Data Selection for Masked Speech Modeling

Murali Karthick Baskar

Andrew Rosenberg

Bhuvana Ramabhadran

Pedro Jose Moreno Mengibar

Yu Zhang

IEEE Journal of Selected Topics in Signal Processing (2022)

On Weight Interpolation of the Hybrid Autoregressive Transducer Model

Bhuvana Ramabhadran

Cyril Allauzen

David Rybach

Ehsan Variani

Michael D. Riley

Tongzhou Chen

Interspeech 2022, Interspeech 2022 (2022) (to appear)

Accented Speech Recognition: Benchmarking, Pre-training, and Diverse Data

Alëna Aksënova

Zhehuai Chen

Chung-Cheng Chiu

Daan van Esch

Pavel Golik

Wei Han

Levi King

Bhuvana Ramabhadran

Andrew Rosenberg

Suzan Schwartz

Gary Wang

(2022)

Mixture Model Attention: Flexible Streaming and Non-Streaming Automatic Speech Recognition

Bhuvana Ramabhadran

Kartik Audhkhasi

Pedro Jose Moreno Mengibar

Tongzhou Chen

Proceedings of Interspeech, 2021 (to appear)

Regularizing Word Segmentation by Creating Misspellings

Bhuvana Ramabhadran

Hainan Xu

Jesse Emond

Kartik Audhkhasi

Yinghui Huang

Interspeech 2021 (2021) (to appear)

Extending Parrotron: An End-to-End, Speech Conversion and Speech Recognition Model for Atypical Speech

Rohan Doshi

Youzheng Chen

Liyang Jiang

Xia Zhang

Fadi Biadsy

Bhuvana Ramabhadran

Andrea Chu

Andrew Rosenberg

Pedro Jose Moreno Mengibar

ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

Self-Adaptive Distillation for Multilingual Speech Recognition: Leveraging Student Independence

Bhuvana Ramabhadran

Brian Farris

Isabel Leal

Manasa Prasad

Neeraj Gaur

Parisa Haghani

Pedro Jose Moreno Mengibar

Yun Zhu

Interspeech 2021 (to appear)

Semi-Supervision in ASR: Sequential Mixmatch and Factorized TTS-Based Augmentation

Zhehuai Chen

Andrew Rosenberg

Yu Zhang

Heiga Zen (Byungha Chun)

Mohammadreza Ghodsi

Yinghui Huang

Jesse Emond

Gary Wang

Bhuvana Ramabhadran

Pedro Jose Moreno Mengibar

(2021)

Convolutional dropout and wordpiece augmentation for end-to-end speech recognition

Bhuvana Ramabhadran

Hainan Xu

Kartik Audhkhasi

Yinghui Huang

Yun Zhu

ICASSP 2021 (2021)

Mixture of Informed Experts for Multilingual Speech Recognition

Neeraj Gaur

Brian Farris

Parisa Haghani

Isabel Leal

Pedro Jose Moreno Mengibar

Manasa Prasad

Bhuvana Ramabhadran

Yun Zhu

ICASSP 2021, IEEE International Conference on Acoustics, Speech and Signal Processing (to appear)

Conformer Parrotron: a Faster and Stronger End-to-end SpeechConversion and Recognition Model for Atypical Speech

Zhehuai Chen

Bhuvana Ramabhadran

Fadi Biadsy

Xia Zhang

Youzheng Chen

Liyang Jiang

Andrea Chu

Rohan Doshi

Pedro Jose Moreno Mengibar

interspeech 2021 (2021)

SCADA: Stochastic, Consistent and Adversarial Data Augmentation to Improve ASR

Gary Wang

Andrew Rosenberg

Zhehuai Chen

Yu Zhang

Bhuvana Ramabhadran

Pedro Moreno

Proceedings of Interspeech 2020, pp. 2832-2836

Language-agnostic Multilingual Modelling

Arindrima Datta

Bhuvana Ramabhadran

Jesse Emond

Anjuli Kannan

Brian Edward Roark

ICASSSP (2020)

Improving Speech Recognition Using Consistent Predictions on Synthesized Speech

Gary Wang

Andrew Rosenberg

Zhehuai Chen

Yu Zhang

Bhuvana Ramabhadran

Heiga Zen (Byungha Chun)

Yonghui Wu

Pedro Jose Moreno Mengibar

IEEE ICASSP 2020

Generating diverse and natural text-to-speech samples using quantized fine-grained VAE and autoregressive prosody prior

Guangzhi Sun

Yu Zhang

Ron J. Weiss

Yuan Cao

Heiga Zen

Andrew Rosenberg

Bhuvana Ramabhadran

Yonghui Wu

ICASSP (2020)

Improving Speech Recognition using GAN-based Speech Synthesis and Contrastive Unspoken Text Selection

Zhehuai Chen

Andrew Rosenberg

Yu Zhang

Gary Wang

Bhuvana Ramabhadran

Pedro Jose Moreno Mengibar

Interspeech 2020

Multilingual Speech Recognition with Self-Attention Structured Parameterization

Yun Zhu

Parisa Haghani

Anshuman Tripathi

Bhuvana Ramabhadran

Brian Farris

Hainan Xu

Han Lu

Hasim Sak

Isabel Leal

Neeraj Gaur

Pedro Jose Moreno Mengibar

Qian Zhang

Interspeech 2020, 21st Annual Conference of the International Speech Communication Association, ISCA

Speech Recognition with Augmented Synthesized Speech

Andrew Rosenberg

Bhuvana Ramabhadran

Pedro Moreno

Ye Jia

Yonghui Wu

Yu Zhang

Zelin Wu

ASRU 2019 (to appear)

Large-Scale Multilingual Speech Recognition with a Streaming End-to-End Model

Yonghui Wu

Ankur Bapna

Zhifeng Chen

Anjuli Kannan

Arindrima Datta

Tara Sainath

Eugene Weinstein

Bhuvana Ramabhadran

Interspeech 2019 (2019) (to appear)

Learning to speak fluently in a foreign language: Multilingual speech synthesis and cross-language voice cloning

Yu Zhang

Ron J. Weiss

Heiga Zen

Yonghui Wu

Zhifeng Chen

RJ Skerry-Ryan

Ye Jia

Andrew Rosenberg

Bhuvana Ramabhadran

Interspeech (2019)

Transliteration based approaches to improve code-switched speech recognition performance

Jesse Emond

Bhuvana Ramabhadran

Brian Roark

Pedro Moreno

Min Ma

IEEE Spoken Language Technology Workshop (SLT) (2018), pp. 448-455

No Results Found

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations  & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Bhuvana Ramabhadran

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Bhuvana Ramabhadran

Research Areas

Filter by:

Year

Research Area

Team

Join us

AI/ML Foundations  & Capabilities