Ron J. Weiss

Multitask Training with Text Data for End-to-End Speech Recognition

Peidong Wang

Tara N Sainath

Ron J. Weiss

Interspeech (2021) (to appear)

Sparse, Efficient, and Semantic MixIT: Taming In-the-Wild Unsupervised Sound Separation

Scott Wisdom

Aren Jansen

Ron J. Weiss

Hakan Erdogan

John Hershey

Proceedings of the IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA) (2021)

WaveGrad: Estimating Gradients for Waveform Generation

Nanxin Chen

Yu Zhang

Heiga Zen (Byungha Chun)

Ron Weiss

Mohammad Norouzi

William Chan

ICLR (2021)

Wave-Tacotron: Spectrogram-free end-to-end text-to-speech synthesis

Ron J. Weiss

RJ Skerry-Ryan

Eric Battenberg

Soroosh Mariooryad

Diederik P. Kingma

ICASSP (2021)

Parallel Tacotron: Non-Autoregressive and Controllable TTS

Isaac Elias

Heiga Zen

Jonathan Shen

Yu Zhang

Ye Jia

Ron J. Weiss

Yonghui Wu

ICASSP (2021)

WaveGrad 2: Iterative Refinement for Text-to-Speech Synthesis

Nanxin Chen

Yu Zhang

Heiga Zen (Byungha Chun)

Ron J. Weiss

Mohammad Norouzi

Najim Dehak

William Chan

Interspeech (2021)

An Attention-Based Joint Acoustic and Text on-Device End-To-End Model

Tara N Sainath

Ruoming Pang

Ron J. Weiss

Yanzhang He

Chung-Cheng Chiu

Trevor Strohman

ICASSP (2020)

Generating diverse and natural text-to-speech samples using quantized fine-grained VAE and autoregressive prosody prior

Guangzhi Sun

Yu Zhang

Ron J. Weiss

Yuan Cao

Heiga Zen

Andrew Rosenberg

Bhuvana Ramabhadran

Yonghui Wu

ICASSP (2020)

Unsupervised Sound Separation Using Mixture Invariant Training

Scott Wisdom

Efthymios Tzinis

Hakan Erdogan

Ron J. Weiss

Kevin Wilson

John R. Hershey

NeurIPS (2020)

Fully-hierarchical Fine-grained Prosody Modeling for Interpretable speech synthesis

Guangzhi Sun

Yu Zhang

Ron J. Weiss

Yuan Cao

Heiga Zen

Yonghui Wu

ICASSP (2020)

Unsupervised Speech Separation Using Mixtures of Mixtures

Scott Wisdom

Efthymios Tzinis

Hakan Erdogan

Ron J. Weiss

Kevin Wilson

John R. Hershey

ICML 2020 Workshop on Self-Supervision for Audio and Speech

Direct speech-to-speech translation with a sequence-to-sequence model

Ye Jia

Ron J. Weiss

Fadi Biadsy

Wolfgang Macherey

Melvin Johnson

Zhifeng Chen

Yonghui Wu

Interspeech (2019)

Leveraging Weakly Supervised Data to Improve End-to-End Speech-to-Text Translation

Ye Jia

Melvin Johnson

Wolfgang Macherey

Ron J. Weiss

Yuan Cao

Chung-Cheng Chiu

Naveen Ari

Stella Marie Laurenzo

Yonghui Wu

ICASSP (2019)

LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech

Heiga Zen

Rob Clark

Ron J. Weiss

Viet Dang

Ye Jia

Yonghui Wu

Yu Zhang

Zhifeng Chen

Interspeech (2019)

Unsupervised speech representation learning using WaveNet autoencoders

Jan Chorowski

Ron Weiss

Samy Bengio

Aäron van den Oord

IEEE Transactions on Audio, Speech, and Language Processing (2019)

Disentangling Correlated Speaker and Noise for Speech Synthesis via Data Augmentation and Adversarial Factorization

Wei-Ning Hsu

Yu Zhang

Ron J. Weiss

Yu-An Chung

Yuxuan Wang

Yonghui Wu

James Glass

ICASSP (2019)

Learning to speak fluently in a foreign language: Multilingual speech synthesis and cross-language voice cloning

Yu Zhang

Ron J. Weiss

Heiga Zen

Yonghui Wu

Zhifeng Chen

RJ Skerry-Ryan

Ye Jia

Andrew Rosenberg

Bhuvana Ramabhadran

Interspeech (2019)

Hierarchical Generative Modeling for Controllable Speech Synthesis

Wei-Ning Hsu

Yu Zhang

Ron Weiss

Heiga Zen

Yonghui Wu

Yuxuan Wang

Yuan Cao

Ye Jia

Zhifeng Chen

Jonathan Shen

Patrick Nguyen

Ruoming Pang

International Conference on Learning Representations (2019)

A spelling correction model for end-to-end speech recognition

Jinxi Guo

Tara Sainath

Ron J. Weiss

ICASSP (2019)

Audio Texture Synthesis with Random Neural Networks: Improving Diversity and Quality

Joseph Antognini

Matthew D. Hoffman

Ron J. Weiss

ICASSP (2019)

Parrotron: An End-to-End Speech-to-Speech Conversion Model and its Applications to Hearing-Impaired Speech and Speech Separation

Fadi Biadsy

Ron J. Weiss

Pedro Moreno

Dimitri Kanvesky

Ye Jia

Interspeech (2019)

State-of-the-art Speech Recognition With Sequence-to-Sequence Models

Chung-Cheng Chiu

Tara Sainath

Yonghui Wu

Rohit Prabhavalkar

Patrick Nguyen

Zhifeng Chen

Anjuli Kannan

Ron J. Weiss

Kanishka Rao

Katya Gonina

Navdeep Jaitly

Bo Li

Jan Chorowski

Michiel Bacchiani

ICASSP (2018) (to appear)

VoiceFilter: Targeted Voice Separation by Speaker-Conditioned Spectrogram Masking

Hannah Raphaelle Muckenhirn

Ignacio Lopez Moreno

John Hershey

Kevin Wilson

Prashant Sridhar

Quan Wang

Rif A. Saurous

Ron Weiss

Ye Jia

Zelin Wu

ICASSP 2019 (2018)

Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron

RJ Skerry-Ryan

Eric Battenberg

Ying Xiao

Yuxuan Wang

Daisy Stanton

Joel Shor

Ron J. Weiss

Rob Clark

Rif A. Saurous

International Conference on Machine Learning (2018)

Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis

Ye Jia

Yu Zhang

Ron Weiss

Quan Wang

Jonathan Shen

Fei Ren

Zhifeng Chen

Patrick Nguyen

Ruoming Pang

Ignacio Lopez Moreno

Yonghui Wu

NeurIPS (2018)

Natural TTS Synthesis By Conditioning WaveNet On Mel Spectrogram Predictions

Jonathan Shen

Ruoming Pang

Ron J. Weiss

Mike Schuster

Navdeep Jaitly

Zongheng Yang

Zhifeng Chen

Yu Zhang

Yuxuan Wang

RJ Skerry-Ryan

Rif A. Saurous

Yannis Agiomyrgiannakis

Yonghui Wu

ICASSP (2018)

ON USING BACKPROPAGATION FOR SPEECH TEXTURE GENERATION AND VOICE CONVERSION

Jan Chorowski

Ron J. Weiss

Rif A. Saurous

Samy Bengio

ICASSP (2018)

Multilingual Speech Recognition with a Single End-to-End Model

Shubham Toshniwal

Tara N. Sainath

Ron Weiss

Bo Li

Pedro Moreno

Eugene Weinsten

Kanishka Rao

ICASSP (2018)

Tacotron: Towards End-to-End Speech Synthesis

Yuxuan Wang

RJ Skerry-Ryan

Daisy Stanton

Yonghui Wu

Ron J. Weiss

Navdeep Jaitly

Zongheng Yang

Ying Xiao

Zhifeng Chen

Samy Bengio

Quoc Le

Yannis Agiomyrgiannakis

Rob Clark

Rif A. Saurous

Interspeech (2017)

Raw Multichannel Processing Using Deep Neural Networks

Tara N. Sainath

Ron J. Weiss

Kevin W. Wilson

Arun Narayanan

Michiel Bacchiani

Bo Li

Ehsan Variani

Izhak Shafran

Andrew Senior

Kean Chin

Ananya Misra

Chanwoo Kim

New Era for Robust Speech Recognition: Exploiting Deep Learning, Springer (2017)

Sequence-to-Sequence Models Can Directly Translate Foreign Speech

Ron J. Weiss

Jan Chorowski

Navdeep Jaitly

Yonghui Wu

Zhifeng Chen

Interspeech (2017)

Multichannel Signal Processing with Deep Neural Networks for Automatic Speech Recognition

Tara Sainath

Ron J. Weiss

Kevin Wilson

Bo Li

Arun Narayanan

Ehsan Variani

Michiel Bacchiani

Izhak Shafran

Andrew Senior

Kean Chin

Ananya Misra

Chanwoo Kim

IEEE /ACM Transactions on Audio, Speech, and Language Processing, vol. 25 (2017), pp. 965 - 979

Acoustic Modeling for Google Home

Bo Li

Tara Sainath

Arun Narayanan

Joe Caroselli

Michiel Bacchiani

Ananya Misra

Izhak Shafran

Hasim Sak

Golan Pundak

Kean Chin

Khe Chai Sim

Ron J. Weiss

Kevin Wilson

Ehsan Variani

Chanwoo Kim

Olivier Siohan

Mitchel Weintraub

Erik McDermott

Rick Rose

Matt Shannon

INTERSPEECH 2017 (2017)

CNN Architectures for Large-Scale Audio Classification

Shawn Hershey

Sourish Chaudhuri

Daniel P. W. Ellis

Jort F. Gemmeke

Aren Jansen

Channing Moore

Manoj Plakal

Devin Platt

Rif A. Saurous

Bryan Seybold

Malcolm Slaney

Ron Weiss

Kevin Wilson

International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE (2017)

Online and Linear-Time Attention by Enforcing Monotonic Alignments

Colin Raffel

Thang Luong

Peter Liu

Ron J. Weiss

Douglas Eck

Thirty-fourth International Conference on Machine Learning (2017)

Reducing the Computational Complexity of Multimicrophone Acoustic Models with Integrated Feature Extraction

Tara N. Sainath

Arun Narayanan

Ron J. Weiss

Ehsan Variani

Kevin W. Wilson

Michiel Bacchiani

Izhak Shafran

Proc. Interspeech, ISCA (2016)

Preview

Factored Spatial and Spectral Multichannel Raw Waveform CLDNNs

Tara N. Sainath

Ron J. Weiss

Kevin W. Wilson

Arun Narayanan

Michiel Bacchiani

International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE (2016)

Preview

Neural Network Adaptive Beamforming for Robust Multichannel Speech Recognition

Bo Li

Tara N. Sainath

Ron J. Weiss

Kevin W. Wilson

Michiel Bacchiani

Proc. Interspeech, ISCA (2016)

Speaker Location and Microphone Spacing Invariant Acoustic Modeling from Raw Multichannel Waveforms

Tara N. Sainath

Ron J. Weiss

Kevin Wilson

Arun Narayanan

Michiel Bacchiani

Andrew Senior

ASRU (2015)

Preview

Speech Acoustic Modeling from Raw Multichannel Waveforms

Yedid Hoshen

Ron Weiss

Kevin W Wilson

International Conference on Acoustics, Speech, and Signal Processing, IEEE (2015)

Learning the Speech Front-end with Raw Waveform CLDNNs

Tara Sainath

Ron J. Weiss

Kevin Wilson

Andrew W. Senior

Oriol Vinyals

Interspeech (2015)

Preview

Affinity Weighted Embedding

Jason Weston

Ron Weiss

Hector Yee

International Conference on Machine Learning (2014)

Learning to Rank Recommendations with the k-Order Statistic Loss

Jason Weston

Hector Yee

Ron Weiss

ACM International Conference on Recommender Systems (RecSys) (2013)

Nonlinear Latent Factorization by Embedding Multiple User Interests

Jason Weston

Ron Weiss

Hector Yee

ACM International Conference on Recommender Systems (RecSys) (2013)

Affinity Weighted Embedding

Jason Weston

Ron Weiss

Hector Yee

International Conference on Learning Representations (2013)

Preview

Latent Collaborative Retrieval

Jason Weston

Chong Wang

Ron Weiss

Adam Berenzweig

International Conference on Machine Learning (2012)

No Results Found

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations  & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Ron J. Weiss

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Ron J. Weiss

Research Areas

Filter by:

Year

Research Area

Team

Join us

AI/ML Foundations  & Capabilities