Topics tagged reinforcement-learni

Topic	Replies	Views	Activity
Reinforcement Fine Tuning Job Failed on Math Problem Dataset Due to Policy Safety Usage Bugs fine-tuning , reinforcement-learni	4	144	November 5, 2025
Modernizing Spinning Up for Today’s Reinforcement Learning Researchers Community reinforcement-learni	0	592	September 14, 2025
Feature Request: Support for Custom Graders Using Prolog or External Logic Solvers in OpenAI Evals API feature-request , logic , reinforcement-learni	0	78	July 3, 2025
Are there any plans to use SF fine-tuned models as a grader in reinforcement learning? Feedback fine-tuning , rl , reinforcement-learni	0	83	May 10, 2025