casinca/GRPO-classic-RL

Open-source implementation/adaptation of DeepSeek GRPO applied to Reinforcement Learning control problems. Example on LunarLander-V3.

/ 100

Experimental

No Package No Dependents

Maintenance 6 / 25

Adoption 0 / 25

Maturity 9 / 25

Community 0 / 25

Stars

—

Forks

—

Language

Jupyter Notebook

License

MIT

Category

Last pushed

Dec 06, 2025

Commits (30d)

Get this data via API

curl "https://pt-edge.onrender.com/api/v1/quality/ml-frameworks/casinca/GRPO-classic-RL"

Open to everyone — 100 requests/day, no key needed. Get a free key for 1,000/day.

Higher-rated alternatives

vietnh1009/Super-mario-bros-PPO-pytorch

Proximal Policy Optimization (PPO) algorithm for Super Mario Bros

taherfattahi/ppo-rocket-landing

Proximal Policy Optimization (PPO) algorithm using PyTorch to train an agent for a rocket...

fvalka/atc-reinforcement-learning

Reinforcement learning for an air traffic control task. OpenAI gym based simulation.

sdsubhajitdas/Rocket_Lander_Gym

💥💥 This is a easy installable extension for OpenAi Gym Environment. This simulates SpaceX Falcon landing.

juliankappler/lunar-lander

Implementation of deep reinforcement learning algorithms for training an agent to play the game...