Zachary Nado

A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs

Vlad Feinberg

Sanjiv Kumar

Ankit Singh Rawat

Wittawat Jitkrittum

Afshin Rostamizadeh

Ayan Chakrabarti

Nikunj Saunshi

Seungyeon Kim

Veeru Sadhanala

Rakesh Shivanna

Sashank Reddi

Rohan Anil

Zack Nado

Aditya Menon

Hrayr Harutyunyan

ArXiv (2024)

A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs

Vlad Feinberg

Sanjiv Kumar

Ankit Singh Rawat

Wittawat Jitkrittum

Ayan Chakrabarti

Nikunj Saunshi

Veeru Sadhanala

Rakesh Shivanna

Sashank Reddi

Rohan Anil

Seungyeon Kim

Zack Nado

Aditya Menon

Hrayr Harutyunyan

Afshin Rostamizadeh

arXiv (2024)

Plex: Towards Reliability using Pretrained Large Model Extensions

Dustin Tran

Jeremiah Liu

Michael W. Dusenberry

Du Phan

Mark Patrick Collier

Jie Jessie Ren

Kehang Han

Zi Wang

Zelda Mariet

Clara Huiyi Hu

Neil Band

Tim G. J. Rudner

Karan Singhal

Zachary Nado

Joost van Amersfoort

Andreas Christian Kirsch

Rodolphe Jenatton

Nithum Thain

Honglin Yuan

Kelly Buchanan

Kevin Patrick Murphy

D. Sculley

Yarin Gal

Zoubin Ghahramani

Jasper Roland Snoek

Balaji Lakshminarayanan

ICML 2022 Pre-training Workshop (2022)

A Simple Approach to Improve Single-Model Deep Uncertainty via Distance-Awareness

Jeremiah Liu

Shreyas Padhy

Jie Ren

Zi Lin

Yeming Wen

Ghassen Jerfel

Zack Nado

Jasper Snoek

Dustin Tran

Balaji Lakshminarayanan

Journal of Machine Learning Research (2022)

Adaptive Gradient Methods at the Edge of Stability

Behrooz Ghorbani

Daniel Suo

David Cardoze

George Dahl

Jeremy Cohen

Justin Gilmer

Naman Agarwal

Shankar Krishnan

Sourabh Medapati

Zack Nado

NeuRIPS 2022 (2022) (to appear)

A Loss Curvature Perspective On Training Instability in Deep Learning

Justin Gilmer

Behrooz Ghorbani

Ankush Garg

Sneha Reddy Kudugunta

Behnam Neyshabur

David Cardoze

George Edward Dahl

Zachary Nado

Orhan Firat

ICLR (2022)

Revisiting One-vs-All Classifiers for Predictive Uncertainty and Out-of-Distribution Detection in Neural Networks

Shreyas Padhy

Zachary Nado

Jie Jessie Ren

Jeremiah Liu

Jasper Roland Snoek

Balaji Lakshminarayanan

(2020)

Underspecification Presents Challenges for Credibility in Modern Machine Learning

Alexander Nicholas D'Amour

Katherine Heller

Dan Moldovan

Ben Adlam

Babak Alipanahi

Alex Beutel

Christina Chen

Jon Deaton

Jacob Eisenstein

Matthew D. Hoffman

Farhad Hormozdiari

Shaobo Hou

Neil Houlsby

Ghassen Jerfel

Alan Karthikesalingam

Mario Lučić

Yian Ma

Cory McLean

Diana Mincu

Akinori Mitani

Andrea Montanari

Zachary Nado

Vivek Natarajan

Christopher Nielsen

Thomas Osborne

Rajiv Raman

Kim Ramasamy

Rory Abbott Sayres

Jessica Schrouff

Martin Gamunu Seneviratne

Shannon Sequeira

Harini Suresh

Victor Veitch

Max Vladymyrov

Xuezhi Wang

Kellie Webster

Steve Yadlowsky

Taedong Yun

Xiaohua Zhai

D. Sculley

Journal of Machine Learning Research (2020)

Which Algorithmic Choices Matter at Which Batch Sizes? Insights From a Noisy Quadratic Model

Guodong Zhang

Lala Li

Zack Nado

James Martens

Sushant Sachdeva

George Dahl

Chris Shallue

Roger Grosse

2019 Conference on Neural Information Processing Systems (2019)

Can You Trust Your Model’s Uncertainty? Evaluating Predictive Uncertainty Under Dataset Shift

Yaniv Ovadia

Emily Amanda Fertig

Jie Jessie Ren

Zack Nado

D. Sculley

Sebastian Nowozin

Josh Dillon

Balaji Lakshminarayanan

Jasper Roland Snoek

Advances in Neural Information Processing Systems (2019)

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Zachary Nado

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Research areas

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Zachary Nado

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us