Heiga Zen

Translatotron 3: Speech to Speech Translation with Monolingual Data

Eliya Nachmani

Alon Levkovitch

Yifan Ding

Chulayuth Asawaroengchai

Heiga Zen

Michelle Tadmor Ramanovich

2024

Twenty-Five Years of Evolution in Speech and Language Processing

Michael Picheny

Bhuvana Ramabhadran

Dilek Hakkani-Tur

Heiga Zen

Jan Skoglund

IEEE Signal Processing Magazine, 40 (2023), pp. 27-39

Preview

LibriTTS-R: Restoration of a Large-Scale Multi-Speaker TTS Corpus

Yuma Koizumi

Heiga Zen

Shigeki Karita

Yifan Ding

Kohei Yatabe

Nobuyuki Morioka

Michiel Adriaan Unico Bacchiani

Yu Zhang

Wei Han

Ankur Bapna

Interspeech 2023 (2023)

Miipher: A Robust Speech Restoration Model Integrating Self-Supervised Speech Representation and Linguistic Features

Yuma Koizumi

Heiga Zen

Shigeki Karita

Yifan Ding

Kohei Yatabe

Nobuyuki Morioka

Yu Zhang

Wei Han

Ankur Bapna

Michiel Adriaan Unico Bacchiani

WASPAA 2023 (2023) (to appear)

Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-to-Speech

Takaaki Saeki

Heiga Zen

Zhehuai Chen

Nobuyuki Morioka

Gary Wang

Yu Zhang

Ankur Bapna

Andrew Rosenberg

Bhuvana Ramabhadran

ICASSP (2023)

Extracting Representative Subset from Massive Raw Texts for Training Pre-trained Neural Language Models

Jun Suzuki

Heiga Zen

Hideto Kazawa

Information Processing & Management Conference, 60 (2023) (to appear)

CVSS Corpus and Massively Multilingual Speech-to-Speech Translation

Ye Jia

Michelle Tadmor Ramanovich

Quan Wang

Heiga Zen (Byungha Chun)

arXiv (2022)

Training Text-To-Speech Systems From Synthetic Data: A Practical Approach For Accent Transfer Tasks

Lev Finkelstein

Heiga Zen

Norman Casagrande

Chun-an Chan

Ye Jia

Tom Kenter

Alexey Petelin

Jonathan Shen

Vincent Wan

Yu Zhang

Yonghui Wu

Rob Clark

Interspeech (2022)

MAESTRO: Matched Speech Text Representations through Modality Matching

Andrew Rosenberg

Ankur Bapna

Bhuvana Ramabhadran

Heiga Zen (Byungha Chun)

Pedro Jose Moreno Mengibar

Yu Zhang

Zhehuai Chen

interspeech 2022 (2022) (to appear)

WaveFit: An Iterative and Non-autoregressive Neural Vocoder based on Fixed-Point Iteration

Yuma Koizumi

Kohei Yatabe

Heiga Zen (Byungha Chun)

Michiel Adriaan Unico Bacchiani

Proc. IEEE Spoken Language Technology Workshop (SLT) (2022) (to appear)

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Heiga Zen

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Heiga Zen

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us