Jordi Pont-Tuset

I am a research scientist at Google Research, Zurich, working in Vittorio Ferrari's team. I am also at the advisory board of Vilynx. Previously, I worked at ETHZ and Disney Research, and I collaborated with Prof. J. Malik’s vision group and with the startup Fezoo. I am a mathematician, engineer, and PhD in computer vision by UPC Barcelonatech.

Research Areas

Authored Publications

Google Publications

Other Publications

DOCCI: Descriptions of Connected and Contrasting Images

Alex Ku

Garrett Tanzer

Jaemin Cho

Jason Baldridge

Jordi Pont-Tuset

Roopal Garg

Su Wang

Sunayana Rane

Yasumasa Onoe

Yonatan Bitton

Zack Berger

Zarana Parekh

(2024)

Rich Human Feedback for Text to Image Generation

Katherine Collins

Nicholas Carolan

Yang Li

Junjie Ke

Youwei Liang

Peizhao Li

Jordi Pont-Tuset

Vidhya Navalpakkam

Feng Yang

Dj Dvijotham

Deepak Ramachandran

Junfeng He

Gang Li

Sarah Young

Yiwen Luo

Jiao Sun

Kai Kohlhoff

Arseniy Klimovskiy

Imagen Editor and EditBench: Advancing and Evaluating Text-Guided Image Inpainting

Su Wang

Chitwan Saharia

Ceslee Montgomery

Jordi Pont-Tuset

Shai Noy

Stefano Pellegrini

Yasumasa Onoe

Sarah Laszlo

David Fleet

Radu Soricut

Jason Baldridge

Mohammad Norouzi

Peter Anderson

William Chan

CVPR(2023)

Connecting Vision and Language with Video Localized Narratives

Paul Voigtlaender

Beer Changpinyo

Jordi Pont-Tuset

Radu Soricut

Vittorio Ferrari

IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR) 2023 (to appear)

Crossmodal-3600: A Massively Multilingual Multimodal Evaluation Dataset

Ashish Thapliyal

Jordi Pont-Tuset

Xi Chen

Radu Soricut

EMNLP(2022) (to appear)

Adversarially Robust Panoptic Segmentation (ARPaS) Benchmark

Laura Alexandra Daza Barragan

Jordi Pont-Tuset

Pablo Arbelaez

Adversarial Robustness in the Real World (ECCV 2022 Workshop) (to appear)

PanGEA: The Panoramic Graph Environment Annotation Toolkit

Alex Ku

Peter Anderson

Jordi Pont-Tuset

Jason Baldridge

2nd Workshop on Advances in Language and Vision Research (ALVR)(2021)

Telling the What while Pointing to the Where: Multimodal Queries for Image Retrieval

Beer Changpinyo

Jordi Pont-Tuset

Vittorio Ferrari

Radu Soricut

ICCV(2021)

Panoptic Narrative Grounding

Cristina González

Nicolas Ayobi Mendoza

Isabela Hernandez

José Hernández

Jordi Pont-Tuset

Pablo Arbelaez

ICCV(2021)

The Open Images Dataset V4: Unified image classification, object detection, and visual relationship detection at scale

Alina Kuznetsova

Mohamad Hassan Mohamad Rom

Neil Alldrin

Jasper Uijlings

Ivan Krasin

Jordi Pont-Tuset

Shahab Kamali

Stefan Popov

Matteo Malloci

Alexander Kolesnikov

Tom Duerig

Vittorio Ferrari

IJCV(2020) (to appear)

Connecting Vision and Language with Localized Narratives

Jordi Pont-Tuset

Jasper Uijlings

Beer Changpinyo

Radu Soricut

Vittorio Ferrari

ECCV(2020)

No Results Found

Search on Google Scholar

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations  & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Jordi Pont-Tuset

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Jordi Pont-Tuset

Research Areas

Filter by:

Year

Research Area

Join us

AI/ML Foundations  & Capabilities