Ming-Hsuan Yang

Beyond SOT: Tracking Multiple Generic Objects at Once

Christoph Mayer

Martin Danelljan

Ming-Hsuan Yang

Vittorio Ferrari

Luc Van Gool

Alina Kuznetsova

WACV'24 (2024)

VideoPoet: A Large Language Model for Zero-Shot Video Generation

Dan Kondratyuk

Lijun Yu

Xiuye Gu

José Lezama

Jonathan Huang

Grant Schindler

Rachel Hornung

Vighnesh Birodkar

Jimmy Yan

Ming-Chang Chiu

Krishna Somandepalli

Hassan Akbari

Yair Alon

Yong Cheng

Josh Dillon

Agrim Gupta

Meera Hahn

Anja Hauth

David Hendon

Alonso Martinez

David Minnen

Mikhail Sirotenko

Kihyuk Sohn

Xuan Yang

Hartwig Adam

Ming-Hsuan Yang

Irfan Essa

Huisheng Wang

David Ross

Bryan Seybold

Lu Jiang

ICML (2024)

Language Model Beats Diffusion -- Tokenizer is Key to Visual Generation

Lijun Yu

José Lezama

Nitesh Bharadwaj Gundavarapu

Luca Versari

Kihyuk Sohn

David Minnen

Yong Cheng

Agrim Gupta

Xiuye Gu

Alex Hauptmann

Boqing Gong

Ming-Hsuan Yang

Irfan Essa

David Ross

Lu Jiang

ICLR (2024)

SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs

Lijun Yu

Yong Cheng

Zhiruo Wang

Vivek Kumar

Wolfgang Macherey

Yanping Huang

David Ross

Irfan Essa

Yonatan Bisk

Ming-Hsuan Yang

Kevin Murphy

Alex Hauptmann

Lu Jiang

NeurIPS (2023)

Unified Visual Relationship Detection with Vision and Language Models

Long Zhao

Liangzhe Yuan

Boqing Gong

Yin Cui

Florian Schroff

Ming-Hsuan Yang

Hartwig Adam

Ting Liu

International Conference on Computer Vision (ICCV) (2023)

MAGVIT: Masked Generative Video Transformer

Lijun Yu

Yong Cheng

Kihyuk Sohn

José Lezama

Han Zhang

Huiwen Chang

Alex Hauptmann

Ming-Hsuan Yang

Yuan Hao

Irfan Essa

Lu Jiang

CVPR (2023)

Contextualized Spatial-Temporal Contrastive Learning with Self-Supervision

Liangzhe Yuan

Rui Qian

Yin Cui

Boqing Gong

Florian Schroff

Ming-Hsuan Yang

Hartwig Adam

Ting Liu

Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2022), pp. 13977-13986

Regularizing Generative Adversarial Networks under Limited Data

Hung-Yu Tseng

Lu Jiang

Ce Liu

Ming-Hsuan Yang

Weilong Yang

CVPR (2021)

COMISR: Compression-Informed Video Super-Resolution

Yinxiao Li

Pengchong Jin

Feng Yang

Ce Liu

Ming-Hsuan Yang

Peyman Milanfar

IEEE/CVF International Conference on Computer Vision (ICCV) (2021)

Neural Design Network: Graphic Layout Generation with Constraints

Hsin-ying Lee

Lu Jiang

Irfan Essa

Madison Le

Haifeng Gong

Ming-Hsuan Yang

Weilong Yang

ECCV (2020)

Explore our many areas of focus

Building a collaborative ecosystem

Shaping the future together

Translating discovery into real-world impact

Ming-Hsuan Yang

Research Areas

Join us

Google AI

Google Cloud

Google DeepMind

Google Labs

Ming-Hsuan Yang

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us