Alexander Kolesnikov

PaLI-X: On Scaling up a Multilingual Vision and Language Model

Xi Chen

Josip Djolonga

Piotr Padlewski

Basil Mustafa

Beer Changpinyo

Jialin Wu

Carlos Riquelme

Sebastian Goodman

Xiao Wang

Yi Tay

Siamak Shakeri

Mostafa Dehghani

Daniel Salz

Mario Lučić

Michael Tschannen

Arsha Nagrani

Hexiang (Frank) Hu

Mandar Joshi

Bo Pang

Ceslee Montgomery

Paulina Pietrzyk

Marvin Ritter

AJ Piergiovanni

Matthias Minderer

Filip Pavetić

Austin Waters

Gang Li

Ibrahim Alabdulmohsin

Lucas Beyer

Julien Amelot

Kenton Lee

Andreas Steiner

Yang Li

Daniel Keysers

Anurag Arnab

Yuanzhong Xu

Keran Rong

Alexander Kolesnikov

Mojtaba Seyedhosseini

Anelia Angelova

Xiaohua Zhai

Neil Houlsby

Radu Soricut

Computer Vision and Pattern Recognition Conference (CVPR) (2024)

Scaling Vision Transformers to 22 Billion Parameters

Mostafa Dehghani

Josip Djolonga

Basil Mustafa

Piotr Padlewski

Jonathan Heek

Justin Gilmer

Andreas Steiner

Mathilde Caron

Robert Geirhos

Ibrahim Alabdulmohsin

Rodolphe Jenatton

Lucas Beyer

Michael Tschannen

Anurag Arnab

Xiao Wang

Carlos Riquelme

Matthias Minderer

Joan Puigcerver

Utku Evci

Manoj Kumar

Sjoerd van Steenkiste

Gamaleldin Elsayed

Aravindh Mahendran

Fisher Yu

Avital Oliver

Fantine Huot

Jasmijn Bastings

Mark Collier

Alexey Gritsenko

Vighnesh Birodkar

Cristina Vasconcelos

Yi Tay

Thomas Mensink

Alexander Kolesnikov

Filip Pavetić

Dustin Tran

Thomas Kipf

Mario Lučić

Xiaohua Zhai

Daniel Keysers

Jeremiah Harmsen

Neil Houlsby

Arxiv (2023)

PaLI: A Jointly-Scaled Multilingual Language-Image Model

Xi Chen

Xiao Wang

Soravit Changpinyo

AJ Piergiovanni

Piotr Padlewski

Daniel Salz

Sebastian Alexander Goodman

Adam Grycner

Basil Mustafa

Lucas Beyer

Alexander Kolesnikov

Joan Puigcerver

Nan Ding

Keran Rong

Hassan Akbari

Gaurav Mishra

Linting Xue

Ashish Thapliyal

James Bradbury

Weicheng Kuo

Mojtaba Seyedhosseini

Chao Jia

Burcu Karagol Ayan

Carlos Riquelme

Andreas Steiner

Anelia Angelova

Xiaohua Zhai

Neil Houlsby

Radu Soricut

International Conference on Learning Representations (ICLR) (2023)

Knowledge distillation: A good teacher is patient and consistent

Lucas Beyer

Xiaohua Zhai

Amélie Royer

Larisa Markeeva

Rohan Anil

Alexander Kolesnikov

CVPR 2022

Scaling Vision Transformers

Xiaohua Zhai

Alexander Kolesnikov

Neil Houlsby

Lucas Beyer

CVPR (2022)

Better plain ViT baselines for ImageNet-1k

Lucas Beyer

Xiaohua Zhai

Alexander Kolesnikov

arxiv (2022)

MLP-Mixer: An All-MLP Architecture for Vision

Ilya Tolstikhin

Neil Houlsby

Alexander Kolesnikov

Lucas Beyer

Xiaohua Zhai

Thomas Unterthiner

Jessica Yung

Andreas Steiner

Daniel Martin Keysers

Jakob Uszkoreit

Mario Lučić

Alexey Dosovitskiy

NeurIPS 2021 (poster)

On Robustness and Transferability of Convolutional Neural Networks

Josip Djolonga

Jessica Yung

Michael Tschannen

Rob Romijnders

Lucas Beyer

Alexander Kolesnikov

Joan Puigcerver

Matthias Minderer

Alexander Nicholas D'Amour

Dan Moldovan

Sylvain Gelly

Neil Houlsby

Xiaohua Zhai

Mario Lučić

Conference on Computer Vision and Pattern Recognition (2021)

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

Alexander Kolesnikov

Alexey Dosovitskiy

Dirk Weissenborn

Georg Heigold

Jakob Uszkoreit

Lucas Beyer

Matthias Minderer

Mostafa Dehghani

Neil Houlsby

Sylvain Gelly

Thomas Unterthiner

Xiaohua Zhai

ICLR (2021)

Big Transfer (BiT): General Visual Representation Learning

Alexander Kolesnikov

Jessica Yung

Joan Puigcerver

Lucas Beyer

Neil Houlsby

Sylvain Gelly

Xiaohua Zhai

ECCV (2020) (to appear)

The Open Images Dataset V4: Unified image classification, object detection, and visual relationship detection at scale

Alina Kuznetsova

Mohamad Hassan Mohamad Rom

Neil Alldrin

Jasper Uijlings

Ivan Krasin

Jordi Pont-Tuset

Shahab Kamali

Stefan Popov

Matteo Malloci

Alexander Kolesnikov

Tom Duerig

Vittorio Ferrari

IJCV (2020) (to appear)

Revisiting Self-Supervised Visual Representation Learning

Alexander Kolesnikov

Xiaohua Zhai

Lucas Beyer

CVPR (2019)

S4L: Self-Supervised Semi-Supervised Learning

Xiaohua Zhai

Avital Oliver

Alexander Kolesnikov

Lucas Beyer

ICCV (Oral) (2019)

No Results Found

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations  & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Alexander Kolesnikov

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Alexander Kolesnikov

Research Areas

Filter by:

Year

Research Area

Join us

AI/ML Foundations  & Capabilities