Csaba Szepesvari

Research Areas

Authored Publications

Google

Regularization and Variance-Weighted Regression Achieves Minimax Optimality in Linear MDPs: Theory and Practice

Toshinori Kitamura

Tadashi Kozuno

Yunhao Tang

Nino Vieillard

Michal Valko

Wenhao Yang

Jincheng Mei

Pierre Menard

Mo Azar

Remi Munos

Olivier Pietquin

Matthieu Geist

Csaba Szepesvari

Wataru Kumagai

Yutaka Matsuo

International Conference on Machine Learning (ICML) (2023)

No Regrets for Learning the Prior in Bandits

Branislav Kveton

Csaba Szepesvari

Manzil Zaheer

Soumya Basu

NeurIPS 2021

On the Optimality of Batch Policy Optimization Algorithms

Chenjun Xiao

Yifan Wu

Tor Lattimore

Bo Dai

Jincheng Mei

Lihong Li

Csaba Szepesvari

Dale Schuurmans

ICML 2021 (2021)

Meta-Thompson Sampling

Branislav Kveton

Michael Konobeev

Manzil Zaheer

Martin Mladenov

Craig Boutilier

Chih-wei Hsu

Csaba Szepesvari

Proceedings of the 38th International Conference on Machine Learning (ICML 2021), pp. 5884-5893

Leveraging Non-uniformity in First-order Non-convex Optimization

Jincheng Mei

Yue Gao

Bo Dai

Csaba Szepesvari

Dale Schuurmans

ICML 2021 (2021)

Understanding the Effect of Stochasticity in Policy Optimization

Bo Dai

Chenjun Xiao

Csaba Szepesvari

Dale Schuurmans

Jincheng Mei

2021

Escaping the Gravitational Pull of Softmax

Jincheng Mei

Chenjun Xiao

Bo Dai

Lihong Li

Csaba Szepesvari

Dale Schuurmans

Advances in Neural Information Processing Systems 33 (NeurIPS 2020)

CoinDICE: Off-Policy Confidence Interval Estimation

Bo Dai

Ofir Nachum

Yinlam Chow

Lihong Li

Csaba Szepesvari

Dale Schuurmans

NeurIPS 2020 (2020)

Differentiable Meta-Learning of Bandit Policies

Craig Boutilier

Chih-wei Hsu

Branislav Kveton

Martin Mladenov

Csaba Szepesvari

Manzil Zaheer

Advances in Neural Information Processing Systems 33 (NeurIPS 2020), pp. 2122-2134

Randomized Exploration in Generalized Linear Bandits

Branislav Kveton

Manzil Zaheer

Csaba Szepesvari

Lihong Li

Mohammad Ghavamzadeh

Craig Boutilier

23rd International Conference on Artificial Intelligence and Statistics (2020)

Search on Google Scholar

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Csaba Szepesvari

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Csaba Szepesvari

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us