ReinforcementLearning - NotesByLex.com

Notes tagged ReinforcementLearning

Learning to Reason without External Rewards

May 28, 2025 reference/papers ReinforcementLearning RewardModeling LargeLanguageModels

aka Self-Confidence is All You Need

Read More
Absolute Zero: Reinforced Self-play Reasoning with Zero Data

May 12, 2025 reference/papers ReinforcementLearning ReasoningModels LargeLanguageModels

learn to reason without any human-annotated data.

Read More
Playing Atari with Deep Reinforcement Learning

May 05, 2025 reference/papers ReinforcementLearning GamePlayingAI

a classic paper applying neural networks to RL for game playing

Read More
Q-Learning

Apr 18, 2025 note ReinforcementLearning

a reinforcement learning algorithm for finding optimal policies

Read More
Markov Decision Process (MDP)

Mar 29, 2025 note ReinforcementLearning

A mathematical framework for modelling decision-making under uncertainty

Read More