Ehsan Variani

UserLibri: A Dataset for ASR Personalization with Only Text

Ehsan Variani

Khe Chai Sim

Kilol Gupta

Lara McConnaughey

Mingqing Chen

Rajiv Mathews

Shefali Garg

Swaroop Ramaswamy

Theresa Breiner

2022

On Weight Interpolation of the Hybrid Autoregressive Transducer Model

Bhuvana Ramabhadran

Cyril Allauzen

David Rybach

Ehsan Variani

Michael D. Riley

Tongzhou Chen

Interspeech 2022, Interspeech 2022 (2022) (to appear)

Global Normalization for Streaming Speech Recognition in a Modular Framework

Cyril Allauzen

David Rybach

Ehsan Variani

Ke Wu

Matt Shannon

Michael Riley

arxiv (2022)

Multilingual Second-Pass Rescoring for Automatic Speech RecognitionSystems

Bhuvana Ramabhadran

Ehsan Variani

Neeraj Gaur

Parisa Haghani

Pedro Moreno Mengibar

Tongzhou Chen

ICASSP (2022)

An Efficient Streaming Non-Recurrent On-Device End-to-End Model with Improvements to Rare-Word Modeling

Tara N Sainath

Yanzhang (Ryan) He

Arun Narayanan

Rami Botros

Ruoming Pang

David Johannes Rybach

Cyril Allauzen

Ehsan Variani

James Qin

Quoc-Nam Le-The

Alex Gruenstein

Anmol Gulati

Bo Li

Cal Peyser

Chung-Cheng Chiu

Diamantino A. Caseiro

Emmanuel Guzman

Ian Carmichael McGraw

Jiahui Yu

Michael D. Riley

Pat Rondon

Qiao Liang

Sepand Mavandadi

Shuo-yiin Chang

Trevor Deatrick Strohman

W. Ronny Huang

Wei Li

Yonghui Wu

Yu Zhang

Interspeech (2021) (to appear)

Hybrid Autoregressive Transducer (HAT)

Ehsan Variani

David Rybach

Cyril Allauzen

Michael Riley

ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing, Barcelona, Spain, pp. 6139-6143

WEST: Word Encoded Sequence Transducers

Ananda Theertha Suresh

Ehsan Variani

Mitchel Weintraub

ICASSP 2019, IEEE (2019)

Sampled Connectionist Temporal Classification

Ehsan Variani

Erik McDermott

Kamel Lahouel

Michiel Bacchiani

Tom Bagby

ICASSP 2018 (2018)

Acoustic Modeling for Google Home

Bo Li

Tara Sainath

Arun Narayanan

Joe Caroselli

Michiel Bacchiani

Ananya Misra

Izhak Shafran

Hasim Sak

Golan Pundak

Kean Chin

Khe Chai Sim

Ron J. Weiss

Kevin Wilson

Ehsan Variani

Chanwoo Kim

Olivier Siohan

Mitchel Weintraub

Erik McDermott

Rick Rose

Matt Shannon

INTERSPEECH 2017 (2017)

Multichannel Signal Processing with Deep Neural Networks for Automatic Speech Recognition

Tara Sainath

Ron J. Weiss

Kevin Wilson

Bo Li

Arun Narayanan

Ehsan Variani

Michiel Bacchiani

Izhak Shafran

Andrew Senior

Kean Chin

Ananya Misra

Chanwoo Kim

IEEE /ACM Transactions on Audio, Speech, and Language Processing, 25 (2017), pp. 965 - 979

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Ehsan Variani

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Ehsan Variani

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us