מבוא ללמידת חיזוק - MDP

שיעור זה כולל מבוא ללמידת מכונה והסבר על מודל MDP - Markov Decision Process
נכיר את המרכיבים של המודל: סביבה, סוכן, פעולה, תגמול, מדיניות, פונקציית ערך ועוד