Mostafa Dehghani

PaLI-X: On Scaling up a Multilingual Vision and Language Model

Xi Chen

Josip Djolonga

Piotr Padlewski

Basil Mustafa

Beer Changpinyo

Jialin Wu

Carlos Riquelme

Sebastian Goodman

Xiao Wang

Yi Tay

Siamak Shakeri

Mostafa Dehghani

Daniel Salz

Mario Lučić

Michael Tschannen

Arsha Nagrani

Hexiang (Frank) Hu

Mandar Joshi

Bo Pang

Ceslee Montgomery

Paulina Pietrzyk

Marvin Ritter

AJ Piergiovanni

Matthias Minderer

Filip Pavetić

Austin Waters

Gang Li

Ibrahim Alabdulmohsin

Lucas Beyer

Julien Amelot

Kenton Lee

Andreas Steiner

Yang Li

Daniel Keysers

Anurag Arnab

Yuanzhong Xu

Keran Rong

Alexander Kolesnikov

Mojtaba Seyedhosseini

Anelia Angelova

Xiaohua Zhai

Neil Houlsby

Radu Soricut

Computer Vision and Pattern Recognition Conference (CVPR) (2024)

DSI++: Updating Transformer Memory with New Documents

Sanket Vaibhav Mehta

Jai Gupta

Yi Tay

Mostafa Dehghani

Vinh Tran

Jinfeng Rao

Marc Najork

Emma Strubell

Don Metzler

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing

Scaling Vision Transformers to 22 Billion Parameters

Mostafa Dehghani

Josip Djolonga

Basil Mustafa

Piotr Padlewski

Jonathan Heek

Justin Gilmer

Andreas Steiner

Mathilde Caron

Robert Geirhos

Ibrahim Alabdulmohsin

Rodolphe Jenatton

Lucas Beyer

Michael Tschannen

Anurag Arnab

Xiao Wang

Carlos Riquelme

Matthias Minderer

Joan Puigcerver

Utku Evci

Manoj Kumar

Sjoerd van Steenkiste

Gamaleldin Elsayed

Aravindh Mahendran

Fisher Yu

Avital Oliver

Fantine Huot

Jasmijn Bastings

Mark Collier

Alexey Gritsenko

Vighnesh Birodkar

Cristina Vasconcelos

Yi Tay

Thomas Mensink

Alexander Kolesnikov

Filip Pavetić

Dustin Tran

Thomas Kipf

Mario Lučić

Xiaohua Zhai

Daniel Keysers

Jeremiah Harmsen

Neil Houlsby

Arxiv (2023)

Dual PatchNorm

Manoj Kumar

Mostafa Dehghani

Neil Houlsby

Transactions on Machine Learning Research (2023) (to appear)

How (not) to ensemble LVLMs for VQA

Lisa Alazraki

Lluis Castrejon

Mostafa Dehghani

Fantine Huot

Jasper Uijlings

Thomas Mensink

"I Can't Believe It's Not Better: Failure Modes in the Age of Foundation Models" at NeurIPS 2023 Workshops

UL2: Unifying Language Learning Paradigms

Yi Tay

Mostafa Dehghani

Vinh Tran

Xavier Garcia

Jason Wei

Xuezhi Wang

Hyung Won Chung

Dara Bahri

Tal Schuster

Steven Zheng

Denny Zhou

Neil Houlsby

Don Metzler

ICLR (2023)

Transformer Memory as a Differentiable Search Index

Yi Tay

Vinh Q. Tran

Mostafa Dehghani

Jianmo Ni

Dara Bahri

Harsh Mehta

Zhen Qin

Kai Hui

Zhe Zhao

Jai Gupta

Tal Schuster

William W. Cohen

Don Metzler

NeurIPS 2022

Scale Efficiently: Insights from Pre-training and Fine-tuning Transformers

Ashish Teku Vaswani

Dani Yogatama

Don Metzler

Hyung Won Chung

Jinfeng Rao

Liam B. Fedus

Mostafa Dehghani

Samira Abnar

Sharan Narang

Yi Tay

ICLR (2022)

Simple Open-Vocabulary Object Detection with Vision Transformers

Matthias Minderer

Alexey Alexeevich Gritsenko

Austin Stone

Maxim Neumann

Dirk Weissenborn

Alexey Dosovitskiy

Aravindh Mahendran

Anurag Arnab

Mostafa Dehghani

Zhuoran Shen

Xiao Wang

Xiaohua Zhai

Thomas Kipf

Neil Houlsby

ECCV (Poster) (2022)

Exploring the Limits of Large Scale Pre-training

Samira Abnar

Mostafa Dehghani

Behnam Neyshabur

Hanie Sedghi

ICLR Spotlight (2022)

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Mostafa Dehghani

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Mostafa Dehghani

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us