Csaba Szepesvari

Research Areas

Authored Publications

Regularization and Variance-Weighted Regression Achieves Minimax Optimality in Linear MDPs: Theory and Practice

Toshinori Kitamura

Tadashi Kozuno

Yunhao Tang

Nino Vieillard

Michal Valko

Wenhao Yang

Jincheng Mei

Pierre Menard

Mo Azar

Remi Munos

Olivier Pietquin

Matthieu Geist

Csaba Szepesvari

Wataru Kumagai

Yutaka Matsuo

International Conference on Machine Learning (ICML)(2023)

On the Optimality of Batch Policy Optimization Algorithms

Chenjun Xiao

Yifan Wu

Tor Lattimore

Bo Dai

Jincheng Mei

Lihong Li

Csaba Szepesvari

Dale Schuurmans

ICML 2021(2021)

Understanding the Effect of Stochasticity in Policy Optimization

Bo Dai

Chenjun Xiao

Csaba Szepesvari

Dale Schuurmans

Jincheng Mei

No Regrets for Learning the Prior in Bandits

Branislav Kveton

Csaba Szepesvari

Manzil Zaheer

Soumya Basu

NeurIPS 2021

Leveraging Non-uniformity in First-order Non-convex Optimization

Jincheng Mei

Yue Gao

Bo Dai

Csaba Szepesvari

Dale Schuurmans

ICML 2021(2021)

Meta-Thompson Sampling

Branislav Kveton

Michael Konobeev

Manzil Zaheer

Martin Mladenov

Craig Boutilier

Chih-wei Hsu

Csaba Szepesvari

Proceedings of the 38th International Conference on Machine Learning (ICML 2021), pp. 5884-5893

Escaping the Gravitational Pull of Softmax

Jincheng Mei

Chenjun Xiao

Bo Dai

Lihong Li

Csaba Szepesvari

Dale Schuurmans

Advances in Neural Information Processing Systems 33 (NeurIPS 2020)

On the Global Convergence Rates of Softmax Policy Gradient Methods

Jincheng Mei

Chenjun Xiao

Csaba Szepesvari

Dale Schuurmans

International Conference on Machine Learning (ICML)(2020)

CoinDICE: Off-Policy Confidence Interval Estimation

Bo Dai

Ofir Nachum

Yinlam Chow

Lihong Li

Csaba Szepesvari

Dale Schuurmans

NeurIPS 2020(2020)

Differentiable Meta-Learning of Bandit Policies

Craig Boutilier

Chih-wei Hsu

Branislav Kveton

Martin Mladenov

Csaba Szepesvari

Manzil Zaheer

Advances in Neural Information Processing Systems 33 (NeurIPS 2020), pp. 2122-2134

Search on Google Scholar

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations  & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Csaba Szepesvari

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Teams

AI/ML Foundations & Capabilities

Algorithms & Optimization

Computing Paradigms

Responsible Human-Centric Technology

Science & Societal Impact

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Csaba Szepesvari

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us

AI/ML Foundations  & Capabilities