Deep Reinforcement

Deep Q-learning - למידת חיזוק עמוקה

בשיעור זה נלמד כיצד לבצע למידת חיזוק באמצעות רשתות נוירונים.
בדרך זו אנחנו יכולים לבנות סוכנים שיפעלו בסביבה הכוללת מספר רב מאוד של מצבים, שלא ניתן לשמור אותם בזיכרון המחשב.
אנחנו נלמד את האלגורתמים שפותחו על ידי קבוצת Google Deep Mind במאמרים שלהם בשנת 2013 ו- 2015
לאחר הלימוד החומר התיאורתי נדגים את יישום האלגוריתם על סוכן AI הלומד לשחק משחק איקס-עיגול.

Playing Atari with Deep Reinforcement Learning, V. Mnih (NIPS-DLW 2013)
Human-level Control Through Deep Reinforcement Learning, V. Mnih et all. (Nature 2015)

Github: Tic Tac Toe - DQN

שיעור

לינק לוידיאו

PDF לינק ל

הדגמה עם משחק איקס עיגול

חלק א

לינק לוידיאו

חלק ב

לינק לוידיאו

מצגת

PDF לינק ל