Austin Waters

PaLI-X: On Scaling up a Multilingual Vision and Language Model

Xi Chen

Josip Djolonga

Piotr Padlewski

Basil Mustafa

Beer Changpinyo

Jialin Wu

Carlos Riquelme

Sebastian Goodman

Xiao Wang

Yi Tay

Siamak Shakeri

Mostafa Dehghani

Daniel Salz

Mario Lučić

Michael Tschannen

Arsha Nagrani

Hexiang (Frank) Hu

Mandar Joshi

Bo Pang

Ceslee Montgomery

Paulina Pietrzyk

Marvin Ritter

AJ Piergiovanni

Matthias Minderer

Filip Pavetić

Austin Waters

Gang Li

Ibrahim Alabdulmohsin

Lucas Beyer

Julien Amelot

Kenton Lee

Andreas Steiner

Yang Li

Daniel Keysers

Anurag Arnab

Yuanzhong Xu

Keran Rong

Alexander Kolesnikov

Mojtaba Seyedhosseini

Anelia Angelova

Xiaohua Zhai

Neil Houlsby

Radu Soricut

Computer Vision and Pattern Recognition Conference (CVPR) (2024)

Simple and Effective Synthesis of Indoor 3D Scenes

Jing Yu Koh

Harsh Agrawal

Dhruv Batra

Richard Tucker

Austin Waters

Honglak Lee

Yinfei Yang

Jason Baldridge

Peter Anderson

AAAI (2023) (to appear)

A New Path: Scaling Vision-and-Language Navigation with Synthetic Instructions and Imitation Learning

Aishwarya Kamath

Peter Anderson

Su Wang

Jing Yu Koh

Alex Ku

Austin Waters

Yinfei Yang

Jason Baldridge

Zarana Parekh

CVPR (2023)

Less is More: Generating Grounded Navigation Instructions from Landmarks

Su Wang

Ceslee Montgomery

Jordi Orbay

Vighnesh Birodkar

Aleksandra Faust

Izzeddin Gur

Natasha Jaques

Austin Waters

Jason Baldridge

Peter Anderson

CVPR (2022) (to appear)

Leveraging Language ID in Multilingual End-to-End Speech Recognition

Austin Waters

Delia Qu

Neeraj Gaur

Parisa Haghani

Pedro Jose Moreno Mengibar

IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2019 (2019)

From audio to semantics: Approaches to end-to-end spoken language understanding

Parisa Haghani

Arun Narayanan

Michiel Adriaan Unico Bacchiani

Galen Chuang

Neeraj Gaur

Pedro Jose Moreno Mengibar

Delia Qu

Rohit Prabhavalkar

Austin Waters

Spoken Language Technology Workshop (SLT), 2018 IEEE

Towards Acoustic Model Unification Across Dialects

Austin Waters

Meysam Bastani

Mohamed G. Elfeky

Pedro Moreno

Xavier Velez

2016 IEEE Workshop on Spoken Language Technology

Distilling Knowledge from Ensembles of Neural Networks for Speech Recognition

Austin Waters

Yevgen Chebotar

Interspeech (2016)

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Austin Waters

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Austin Waters

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us