NeurIPS 2024

Workshop

The Crucial Role of Samplers in Online Direct Preference Optimization
Ruizhe Shi · Runlong Zhou · Simon Du

Workshop

Preference-based Multi-Objective Bayesian Optimization with Gradients
Joshua Hang Sai Ip · Ankush Chakrabarty · Ali Mesbah · Diego Romeres

Poster

Fri 11:00

Direct Preference-Based Evolutionary Multi-Objective Optimization with Dueling Bandits
Tian Huang · Shengbo Wang · Ke Li

Workshop

Optimizing Reward Models with Proximal Policy Exploration in Preference-Based Reinforcement Learning
Yiwen Zhu · Jinyi Liu · Yifu Yuan · Wenya Wei · Zhenxing Ge · qianyi fu · Zhou Fang · Yujing Hu · Bo An

Workshop

Pareto-Optimal Learning from Preferences with Hidden Context
Ryan Boldi · Li Ding · Lee Spector · Scott Niekum

Workshop

Accelerating Direct Preference Optimization with Prefix Sharing
Franklin Wang · Sumanth Hegde

Workshop

Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization
Noam Razin · Sadhika Malladi · Adithya Bhaskar · Danqi Chen · Sanjeev Arora · Boris Hanin

Workshop

Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization
Noam Razin · Sadhika Malladi · Adithya Bhaskar · Danqi Chen · Sanjeev Arora · Boris Hanin

Workshop

The Crucial Role of Samplers in Online Direct Preference Optimization
Ruizhe Shi · Runlong Zhou · Simon Du

Poster

Wed 16:30

On Softmax Direct Preference Optimization for Recommendation
Yuxin Chen · Junfei Tan · An Zhang · Zhengyi Yang · Leheng Sheng · Enzhi Zhang · Xiang Wang · Tat-Seng Chua

Workshop

Large Language Model Detoxification: Data and Metric Solutions
SungJoo Byun · HYOPIL SHIN

Workshop

Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization
Noam Razin · Sadhika Malladi · Adithya Bhaskar · Danqi Chen · Sanjeev Arora · Boris Hanin

Main Navigation

55 Results