LOGO
  • Wellcome Visitor
  • Update
  • Logout
  • Admin
  • Login
  • Register
  • Main
  • HTML & CSS
  • JAVASCRIPT
  • ASP.Net
  • SQL
  • ADO
  • השתלמות מורים
  • Razor Pages
  • Python
  • PyGame
  • Machine Learning with PyTorch
  • Reinforcement Learning
  • Reinforcement Learning
  • Intro & MDP
  • Policy Iteration
  • Value Iteration
  • Monte Carlo
  • Temporal Difference
  • Deep Reinforcement
  • Reversi DQN
  • DDQN-Space Invaders

  • Policy Gradient Intro
  • Policy Gradient Method
  • REINFORCE MC
  • Entropy Regulazation
  • REINFORCE MC - Continuous
  • Actor Critic
  • Actor Critic n-steps
  • PPO Method
Prev
Next

Model Free - Temporal Difference

בשיעור זה נלמד אלגורתמים נוספים לסביבה בה המודל אינו ידוע.
האלגוריתמים שייכים לשיטה המכונה Temporal Difference, והם:
SARSA
Q-learning

Github: Tic Tac Toe - SARSA

שיעור


לינק לוידיאו
PDF לינק ל


הדגמה עם משחק איקס עיגול

לינק לוידיאו
PDF לינק ל
Prev
Next