DDQN - Reversi

Double Deep Q-Learning Network

בשיעור זה נלמד מודל משופר של DQN המכונה DDQN - Double Deep Q-Learning Network
נדגים את מימוש המודל באמצעות בניית סוכן הלומד לשחק את משחק Space Invaders
בהבדל מהמשחקים הקודמים המשחק אינו מבוסס על לוח משחק אלא מדובר במשחק גרפי. ה state נוצר באמצעות פונקציה הממירה את מצב השחקנים במסך לערכים המייצגים את המצב.
הדגמנו את המימוש הגרפי של המשחק בשיעורים קודמים בפרק PyGame והנכם מוזמנים לצפות בסרטונים אילו באתר זה.

1 שיעור




המשך ההרצאות