raymond-usst/Eight-in-a-Row
本项目是一个基于 MuZero 和 Gumbel 搜索构建的三人八子棋(Eight-in-a-Row)AI 训练与对弈系统。该系统采用了 DeepSeek MLA 作为网络骨干,并深度集成了课程学习(Curriculum Learning)、联赛机制(League)、基于种群的训练(PBT)、Engram 情节记忆以及 EfficientZero 的一致性损失等高级强化学习技术。此外,项目支持同步与多进程异步训练,并提供了基于 FastAPI 的实时对弈服务以及基于 WebSocket 的可视化训练监控台。
Stars
—
Forks
—
Language
Python
License
—
Last pushed
Mar 10, 2026
Commits (30d)
0
Get this data via API
curl "https://pt-edge.onrender.com/api/v1/quality/agents/raymond-usst/Eight-in-a-Row"
Open to everyone — 100 requests/day, no key needed. Get a free key for 1,000/day.
Higher-rated alternatives
killop/anything_about_game
A wonderful list of Game Development resources.
mohdibrahimaiml/epi-recorder
The PDF for AI Evidence
liyupi/mianshiya
持续维护的企业面试题库网站,帮你拿到满意 offer!⭐️ 2026年最新Java面试题、前端面试题、AI大模型面试题、AI...
shipstatic/ship
The simplest way to publish a static site.
lintsinghua/claude-code-book
《御舆:解码 Agent Harness》42万字拆解 AI Agent 的Harness骨架与神经 —— Claude Code 架构深度剖析,15 章从对话循环到构建你自己的 Agent...