liushunyu/awesome-direct-preference-optimization

A Survey of Direct Preference Optimization (DPO)

/ 100

Experimental

Curates 250+ peer-reviewed papers organized by a novel taxonomy that decomposes DPO methodologies across four dimensions: data strategy, learning framework, constraint mechanisms, and model properties. Provides systematic categorization of DPO variations spanning data quality and preference feedback approaches, learning paradigms and objectives, reference model constraints and safety mechanisms, and generation/optimization properties. Bridges foundational DPO work with recent extensions including heterogeneous preference handling, dynamic weighting schemes, and robustness improvements.

No commits in the last 6 months.

No License Stale 6m No Package No Dependents

Maintenance 2 / 25

Adoption 9 / 25

Maturity 8 / 25

Community 0 / 25

How are scores calculated?

Stars

Forks

—

Language

—

License

—

Higher-rated alternatives

codelion/pts

Pivotal Token Search

RLHFlow/Directional-Preference-Alignment

Directional Preference Alignment

dannylee1020/openpo

Building synthetic data for preference tuning

DtYXs/Pre-DPO

Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model

Rahulkumar010/microDPO

microDPO: A minimalist, pure PyTorch implementation of Direct Preference Optimization. Inspired...

Explore LLM Tools

All categories Trending LLM Tool directory Insights