Bo Dai

Diffusion Controller: Framework, Algorithms and Parameterization

Tong Yang

Moonkyung Ryu

Chih-wei Hsu

Guy Tennenholtz

Yuejie Chi

Craig Boutilier

Bo Dai

Proceedings of the 43rd International Conference on Machine Learning (ICML-26), Seoul, South Korea (2026)

Reinforcement Learning with Discrete Diffusion Policies for Combinatorial Action-Spaces

Haitong Ma

Ofir Nabati

Aviv Rosenberg

Bo Dai

Oran Lang

Craig Boutilier

Na Li

Shie Mannor

Lior Shani

Guy Tennenholtz

Proceedings of the 43rd International Conference on Machine Learning (ICML-26), Seoul, South Korea (2026)

Inference-Aware Fine-Tuning for Best-of-N Sampling in Large Language Models

Yinlam Chow

Guy Tennenholtz

Izzeddin Gur

Vincent Zhuang

Bo Dai

Aviral Kumar

Rishabh Agarwal

Sridhar Thiagarajan

Craig Boutilier

Aleksandra Faust

Proceedings of the 13th International Conference on Learning Representations (ICLR-25), Singapore (2025)

Judging with Confidence: Calibrating Autoraters to Preference Distributions

Hamid Palangi

Guowang Li

Bo Dai

Paul Zhou

Emily Xue

Yiwen Song

Kati Goshvadi

Murat Kantarcioglu

Dale Schuurmans

Palash Goyal

Xiaowei Li

CHENGYU HUANG

Bradley Malin

Zhuohang Li

2025

UQE: A Query Engine for Unstructured Databases

Hanjun Dai

Bethany Wang

Xingchen Wan

Bo Dai

Sherry Yang

Azade Nova

Pengcheng Yin

Phitchaya Mangpo Phothilimthana

Charles Sutton

Dale Schuurmans

Advances in Neural Information Processing Systems (NeurIPS) (2024)

Neural Stochastic Dual Dynamic Programming

Hanjun Dai

Emily Xue

Zia M Syed

Dale Schuurmans

Bo Dai

ICLR 2022 (2022)

Can Small Heads Help? Understanding and Improving Multi-Task Generalization

Bo Dai

Christopher Fifty

Dong Lin

Ed H. Chi

Li Wei

Lichan Hong

Yuyan Wang

Zhe Zhao

the WebConf 2022 (2022)

Score-based Continuous-time Discrete Diffusion Models

Haoran Sun

Lijun Yu

Bo Dai

Dale Schuurmans

Hanjun Dai

ICLR (2022)

Towards Automatic Multi-Turn Turing Test for Dialog System: A DICE-Based Off-Policy Evaluation Approach

Haoming Jiang

Bo Dai

Sherry Yang

Tuo Zhao

Wei Wei

EMNLP 2021 (2021)

On the Optimality of Batch Policy Optimization Algorithms

Chenjun Xiao

Yifan Wu

Tor Lattimore

Bo Dai

Jincheng Mei

Lihong Li

Csaba Szepesvari

Dale Schuurmans

ICML 2021 (2021)

Explore our many areas of focus

Building a collaborative ecosystem

Shaping the future together

Translating discovery into real-world impact

Bo Dai

Research Areas

Join us

Google AI

Google Cloud

Google DeepMind

Google Labs

Bo Dai

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us