Reversi DQN

הדגמת בניית סוכן AI ללימוד משחק Reversi

בשיעור זה נדגים את מימוש האלגוריתם DQN ללימוד משחק REVERSI.
אנו נלמד כיצד ניתן לאמן את רשת הנוירונים באמצעות משחק כנגד סוכן רנדומלי או סוכן קבוע (Fix Agent)
בנוסף, נלמד כיצד לאמן רשת נוירונים אחת אשר תשחק את שני השחקנים. אימון רשת הנוירונים במקרה האחרון נעשית באמצעות שני סוכני AI המשחקים האחד כנגד השני, ומאמנים רשת משותפת.

1 שיעור




המשך הרצאות