Hasim Sak

Turn-To-Diarize: Online speaker diarization constrained by transformer transducer speaker turn detection

Anshuman Tripathi

Han Lu

Hasim Sak

Ignacio Lopez Moreno

Quan Wang

Wei Xia

Submitted to ICASSP 2022, IEEE (2021)

Multilingual Speech Recognition with Self-Attention Structured Parameterization

Yun Zhu

Parisa Haghani

Anshuman Tripathi

Bhuvana Ramabhadran

Brian Farris

Hainan Xu

Han Lu

Hasim Sak

Isabel Leal

Neeraj Gaur

Pedro Jose Moreno Mengibar

Qian Zhang

Interspeech 2020, 21st Annual Conference of the International Speech Communication Association, ISCA

Adversarial Training for Multilingual Acoustic Modeling

Kevin Hu

Hasim Sak

Hank Liao

(2019)

Speech recognition for medical conversations

Chung-Cheng Chiu

Anshuman Tripathi

Kat Chou

Chris Co

Navdeep Jaitly

Diana Jaunzeikare

Anjuli Kannan

Patrick Nguyen

Hasim Sak

Ananth Sankar

Justin Jesada Tansuwan

Nathan Wan

Yonghui Wu

Frank Zhang

Interspeech 2018 (2018)

Multi-Accent Speech Recognition with Hierarchical Grapheme Based Models

Hasim Sak

Kanishka Rao

ICASSP 2017 (to appear)

Acoustic Modeling for Google Home

Bo Li

Tara Sainath

Arun Narayanan

Joe Caroselli

Michiel Bacchiani

Ananya Misra

Izhak Shafran

Hasim Sak

Golan Pundak

Kean Chin

Khe Chai Sim

Ron J. Weiss

Kevin Wilson

Ehsan Variani

Chanwoo Kim

Olivier Siohan

Mitchel Weintraub

Erik McDermott

Rick Rose

Matt Shannon

INTERSPEECH 2017 (2017)

Exploring Architectures, Data and Units For Streaming End-to-End Speech Recognition with RNN-Transducer

Hasim Sak

Kanishka Rao

Rohit Prabhavalkar

ASRU 2017 (2017)

Neural Speech Recognizer: Acoustic-to-Word LSTM Model for Large Vocabulary Speech Recognition

Hagen Soltau

Hank Liao

Hasim Sak

ArXiv e-prints (2016)

Personalized Speech Recognition On Mobile Devices

Ian McGraw

Rohit Prabhavalkar

Raziel Alvarez

Montse Gonzalez Arenas

Kanishka Rao

David Rybach

Ouais Alsharif

Hasim Sak

Alexander Gruenstein

Françoise Beaufays

Carolina Parada

Proceedings of International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE (2016)

Flatstart-CTC: a new acoustic model training procedure for speech recognition

Andrew Senior

Hasim Sak

Kanishka Rao

ICASSP 2016

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Hasim Sak

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Hasim Sak

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us