Arjun Reddy Akula

I am a Research Scientist at Google DeepMind in Mountain View. My research interests are in computer vision, natural language processing (NLP), statistical modeling and inference, and deep learning. Prior to this, I got my PhD from UCLA in Jan 2022, advised by Prof. Song-Chun Zhu. During my PhD, I interned at Amazon Alexa AI (Sunnyvale, CA), Google Research (Los Angeles, CA), Amazon AI (Palo Alto, CA) and Mila (Montreal). Prior to my PhD, I worked as a research software engineer at IBM Research AI (India) for 2.5 years. I did my Bachelors and Masters in Computer Science and Engineering from IIIT Hyderabad, India. I am an active member of the academic community serving as a reviewer/program committee member of ACL, CVPR, ARR, EMNLP, ICCV, AAAI, ECCV, NeurIPS and NAACL. Outside of work, I enjoy hiking, traveling, and playing Table Tennis. Here is a link to my personal website: www.arjunakula.com

Research Areas

Authored Publications

PRISM: A New Lens for Improved Color Understanding

Arjun Akula

Garima Pruthi

Inderjit Dhillon

Pradyumna Narayana

Sugato Basu

Varun Jampani

EMNLP (2024)

KAFA: Rethinking Image Ad Understanding with Knowledge-Augmented Feature Adaptation of Vision-Language Models

Zhiwei Jia

Pradyumna Narayana

Arjun Akula

Garima Pruthi

Hao Su

Sugato Basu

Varun Jampani

ACL 2023 (Industry Track) (2023)

Discriminative Diffusion Models as Few-shot Vision and Language Learners

Xuehai He

Weixi Feng

Tsu-Jui Fu

Varun Jampani

Arjun Akula

Pradyumna Narayana

Sugato Basu

William Yang Wang

Xin Eric Wang

ArXiv (2023)

Training-Free Structured Diffusion Guidance for Compositional Text-to-Image Synthesis

Weixi Feng

Xuehai He

Tsu-Jui Fu

Varun Jampani

Arjun Akula

Pradyumna Narayana

Sugato Basu

Xin Eric Wang

William Yang Wang

ICLR (2023)

MetaCLUE: Towards Comprehensive Visual Metaphors Research

Arjun R. Akula

Brendan Driscoll

Pradyumna Narayana

Soravit Changpinyo

Zhiwei Jia

Suyash Damle

Garima Pruthi

Sugato Basu

Leonidas Guibas

William T. Freeman

Yuanzhen Li

Varun Jampani

CVPR (2023)

LayoutGPT: Compositional Visual Planning and Generation with Large Language Models

Weixi Feng

Wangrong Zhu

Tsu-Jui Fu

Varun Jampani

Arjun Akula

Xuehai He

Sugato Basu

Xin Eric Wang

William Wang

NeurIPS (2023)

CPL: Counterfactual Prompt Learning for Vision and Language Models

Xuehai He

Diji Yang

Weixi Feng

Tsu-Jui Fu

Arjun R. Akula

Varun Jampani

Pradyumna Narayana

Sugato Basu

William Yang Wang

Xin Eric Wang

Conference on Empirical Methods in Natural Language Processing (EMNLP) (2022)

ALFRED-L: Investigating the Role of Language for Action Learning in Interactive Visual Environments

Arjun R. Akula

Spandana Gella

Aishwarya Padmakumar

Mahdi Namazifar

Mohit Bansal

Jesse Thomason

Dilek Hakkani-Tur

Conference on Empirical Methods in Natural Language Processing (EMNLP) (2022)

Robust Visual Reasoning via Language Guided Neural Module Networks

Arjun R. Akula

Varun Jampani

Beer Changpinyo

Song-Chun Zhu

NeurIPS (2021)

CrossVQA: Scalably Generating Benchmarks for Systematically Testing VQA Generalization

Arjun R. Akula

Beer Changpinyo

Boqing Gong

Piyush Sharma

Song-Chun Zhu

Radu Soricut

EMNLP (2021)

Search on Google Scholar

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Arjun Reddy Akula

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Arjun Reddy Akula

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us