freshcrate — #grpo

Home > #grpo

Tag: #grpo

3 packages • ⭐ 783 total stars

Agentic-RAG-R1dev@2026-06-29🌿 Growing⭐413

Agentic RAG R1 Framework via Reinforcement Learning

unsloth-buddymain@2026-06-28🌿 Growing⭐230

Zero-friction LLM fine-tuning skill for Claude Code, Gemini CLI & any ACP agent. Unsloth on NVIDIA · TRL+MPS/MLX on Apple Silicon. Automates env setup, LoRA training (SFT, DPO, GRPO, vision), post-hoc

apple-silicon claude-code dpo fine-tuning gaslamp grpo huggingface lora pythonby TYH-labs

llm-rl-environments-lil-coursemain@2026-05-27🌿 Growing⭐140

🌱 A little course on Reinforcement Learning Environments for evaluating and training Language Models

course grpo language-models llm llm-agent python reinforcement-learning reinforcement-learning-environments rlvrby anakin87

Tag: #grpo

Trending in #grpo