Deep Reinforcement

Deep Q-learning - למידת חיזוק עמוקה

בשיעור זה נלמד כיצד לבצע למידת חיזוק באמצעות רשתות נוירונים.
בדרך זו אנחנו יכולים לבנות סוכנים שיפעלו בסביבה הכוללת מספר רב מאוד של מצבים, שלא ניתן לשמור אותם בזיכרון המחשב.
אנחנו נלמד את האלגורתמים שפותחו על ידי קבוצת Google Deep Mind במאמרים שלהם בשנת 2013 ו- 2015
לאחר הלימוד החומר התיאורתי נדגים את יישום האלגוריתם על סוכן AI הלומד לשחק משחק איקס-עיגול.

שיעור




הדגמה עם משחק איקס עיגול