מבוא ללמידת חיזוק - MDP שיעור זה כולל מבוא ללמידת מכונה והסבר על מודל MDP - Markov Decision Process נכיר את המרכיבים של המודל: סביבה, סוכן, פעולה, תגמול, מדיניות, פונקציית ערך ועוד לינק לוידיאו PDF לינק ל