Michiel Bacchiani

Miipher: A Robust Speech Restoration Model Integrating Self-Supervised Speech Representation and Linguistic Features

Yuma Koizumi

Heiga Zen

Shigeki Karita

Yifan Ding

Kohei Yatabe

Nobuyuki Morioka

Yu Zhang

Wei Han

Ankur Bapna

Michiel Adriaan Unico Bacchiani

WASPAA 2023(2023) (to appear)

LibriTTS-R: Restoration of a Large-Scale Multi-Speaker TTS Corpus

Yuma Koizumi

Heiga Zen

Shigeki Karita

Yifan Ding

Kohei Yatabe

Nobuyuki Morioka

Michiel Adriaan Unico Bacchiani

Yu Zhang

Wei Han

Ankur Bapna

Interspeech 2023(2023)

Knowledge Transfer from Large-Scale Pretrained Language Models to End-to-end Speech Recognizers

Michiel Adriaan Unico Bacchiani

Shigeki Karita

Yotaro Kubo

(2022) (to appear)

WaveFit: An Iterative and Non-autoregressive Neural Vocoder based on Fixed-Point Iteration

Yuma Koizumi

Kohei Yatabe

Heiga Zen (Byungha Chun)

Michiel Adriaan Unico Bacchiani

Proc. IEEE Spoken Language Technology Workshop (SLT)(2022) (to appear)

SNRi Target Training for Joint Speech Enhancement and Recognition

Yuma Koizumi

Shigeki Karita

Arun Narayanan

Sankaran Panchapagesan

Michiel Adriaan Unico Bacchiani

Proc. Interspeech(2022) (to appear)

SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with Adaptive Noise Spectral Shaping

Yuma Koizumi

Heiga Zen

Kohei Yatabe

Nanxin Chen

Michiel Adriaan Unico Bacchiani

Proc. Interspeech(2022) (to appear)

A Comparative Study on Neural Architectures and Training Methods for Japanese Speech Recognition

Lion Jones

Michiel Adriaan Unico Bacchiani

Shigeki Karita

Yotaro Kubo

Interspeech 2021(2021) (to appear)

DF-Conformer: Integrated architecture of Conv-TasNet and Conformer using linear complexity self-attention for speech enhancement

Yuma Koizumi

Shigeki Karita

Scott Wisdom

Hakan Erdogan

John Hershey

Lion Jones

Michiel Adriaan Unico Bacchiani

Proc. IEEE Workshop Appl. Signal Process. Audio Acoust. (WASPAA)(2021)

JOINT PHONEME-GRAPHEME MODEL FOR END-TO-END SPEECH RECOGNITION

Yotaro Kubo

Michiel Bacchiani

Proc. ICASSP 2020 (to appear)

Spectral distortion model for training phase-sensitive deep-neural networks for far-field speech recognition

Chanwoo Kim

Tara Sainath

Arun Narayanan

Ananya Misra

Rajeev Nongpiur

Michiel Bacchiani

ICASSP 2018(2018)

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations  & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Michiel Bacchiani

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Michiel Bacchiani

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us

AI/ML Foundations  & Capabilities