Reinforcement Learning - a darylmooreNC Collection

darylmooreNC 's Collections

Multi-Agent Infrastructure

LLM Training Methodologies

LLM Architectures

Agentic AI Training and Tuning

Reinforcement Learning

Sports Predictive Modeling

Large Language Models

Reinforcement Learning

updated 21 days ago

Demystifying Reinforcement Learning in Agentic Reasoning

Paper • 2510.11701 • Published Oct 13 • 31
LoongRL:Reinforcement Learning for Advanced Reasoning over Long Contexts

Paper • 2510.19363 • Published Oct 22 • 61
Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning

Paper • 2510.25992 • Published Oct 29 • 45
Teaching Pretrained Language Models to Think Deeper with Retrofitted Recurrence

Paper • 2511.07384 • Published about 1 month ago • 16
MarsRL: Advancing Multi-Agent Reasoning System via Reinforcement Learning with Agentic Pipeline Parallelism

Paper • 2511.11373 • Published 27 days ago • 12
TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework

Paper • 2511.05385 • Published Nov 7
Souper-Model: How Simple Arithmetic Unlocks State-of-the-Art LLM Performance

Paper • 2511.13254 • Published 24 days ago • 134