HE

יסודות הלמידה העמוקה המודרנית

על הקורס

  • קהל יעד: מהנדסי תוכנה, דאטה סיינטיסטים, חוקרים ומפתחים עם רקע בפייתון, המעוניינים לרכוש בסיס חזק בלמידה עמוקה ולעבוד עם מודלים עדכניים בתעשייה
  • משך הקורס: כ־10 שעות (23 שיעורים קצרים בני 4–5 דקות + תרגול)
  • מה מקבלים
    • שליטה מלאה ביסודות של רשתות נוירונים ובאימון מודלים בפועל
    • תרגול של ארכיטקטורות מרכזיות כמו CNN, LSTM ו־Vision Transformers
    • הבנה מעשית של פונקציית מחיר, מדדים והטמעה בארגון
    • קבצי קוד פתוחים, סביבות עבודה מוכנות ב־Colab, והנחיות שלב אחר שלב
    • תרגול בשתי הספריות המרכזיות: PyTorch ו-TensorFlow
  • נושאים מרכזיים
    • למידת מכונה מול למידה עמוקה  – הבחנה
    • נוירון, שכבות, פונקציות אקטיבציה, FeedForward
    • Backpropagation, פונקציית מחיר, אופטימיזציה ואימון בפועל
    • בעיות Overfitting, שיטות Regularization ובחירת מדדי ביצוע
    • CNNs ו־RNNs, הורדת מימד, Transformers
    • תשתיות תעשייתיות: Colab, שמירת מודלים, בניית API עם FastAPI
    • הכנה להמשך התמחות בעולמות CV, Tabular Data, TimeSeries ו־LLMs
  • יתרונות
    • שילוב אידאלי בין תיאוריה, תרגול וקוד פתוח
    • מבנה קצר וממוקד – מתאים לשילוב תוך כדי עבודה
    • פרויקטים להתנסות עצמית בסביבת Colab עם מדדי הצלחה ברורים
הצג עוד

תוכן הקורס

מודול 1: עקרונות למידה עמוקה
המודול הראשון בקורס עוסק בהנחת היסודות להבנה עמוקה של רשתות נוירונים ולמידה עמוקה. הוא פותח בהבחנה בין למידת מכונה (Machine Learning) ללמידה עמוקה (Deep Learning), ומסביר את היתרון של רשתות עומק ביכולתן ללמוד ייצוגים מופשטים היישר מהנתונים, ללא צורך בהגדרה ידנית של מאפיינים. לאחר מכן, נבנה מושג ה"נוירון המלאכותי", ונבחנת חשיבותן של פונקציות אקטיבציה לא-ליניאריות בהפיכת הרשתות למודלים עוצמתיים ומייצגים. פונקציית המחיר (Loss Function) מוצגת בפירוט, יחד עם מנגנון הלמידה באמצעות Backpropagation והאלגוריתם Gradient Descent. נבחנים גם תפקידם של קצב הלמידה (Learning Rate), אופטימיזציה והבחירה באצוות (Mini-Batch Training) להשגת שיפור יציב ויעיל של המודל לאורך אפוקים. המודול מתעמק במדדים להערכת ביצועי המודל - הן בסיווג (כגון דיוק, Precision, Recall, AUC) והן ברגרסיה (MAE, MSE, R²) תוך הדגמה של מגבלות המדדים, במיוחד במקרים של חוסר איזון בין המחלקות. לבסוף, מוצגת בעיית התאמת היתר (Overfitting), יחד עם שלוש שיטות מרכזיות להתמודדות איתה: Dropout, Early Stopping ו־Weight Decay. בסיום המודול, נבין כיצד רשתות נוירונים לומדות, איך למדוד את איכות הלמידה, ומהם הסיכונים העיקריים הכרוכים באימון מודלים מורכבים מדי. כל שיעור נבנה באופן מדורג, עם שילוב של דוגמאות מתמטיות, הדמיות, ומקרי בוחן מעשיים.

  • שיעור 1: ההבדל בין למידת מכונה ללמידה עמוקה
    05:04
  • שיעור 2: מהי רשת נוירונים?
    06:32
  • שיעור 3: פונקציית מחיר ואופטימיזציה
    08:00
  • שיעור 4: איך מאמנים רשת?
    04:33
  • שיעור 5: מדדים להערכת ביצועים
    07:11
  • שיעור 6: התאמת יתר ורגולריזציה
    03:28
  • שאלון 1
  • תרגיל #1 – MLP on MNIST

מודול 2: ארכיטקטורות מרכזיות
במודול זה נעמיק במבני הרשתות המרכזיים בלמידה עמוקה, ונסביר כיצד הארכיטקטורה הנכונה מאפשרת למודל להבין טוב יותר את מבנה הנתונים. הוא פותח בצורך בקונבולוציה - מנגנון יעיל ללמידה מתוך מידע חזותי ומסביר כיצד רשתות CNN מנצלות תכונות של תמונות כמו מקומיות, שיתוף משקל והזזה, כדי לזהות תבניות כגון קצוות, מרקמים וצורות במיקומים שונים. לאחר מכן, נציג את התמונה המלאה של רשת CNN מודרנית: מושגי stride, padding ו־pooling מוסברים לעומק, כולל השפעתם על גודל הפלט, יעילות המודל והקשר בין שכבות. המושג "שדה קלט" (Receptive Field) מציג איך הרשת לומדת הקשרים רחבים יותר מתוך תמונה. בהמשך, המודול עובר למידע רציף - טקסט, סאונד או אותות - ומציג את משפחת הרשתות בזמן (RNN, GRU, LSTM). מוסבר כיצד רשתות אלו משמרות זיכרון של מידע קודם, ומה היתרונות של מנגנוני השערים (Gates) בניהול זרימת המידע. כמו כן, נידון השימוש ברשתות דו-כיווניות (Bi-LSTM) להבנת הקשר לשני הכיוונים. לבסוף, מוצגת ארכיטקטורת ה־Transformer, מהפכת העשור האחרון. מוסבר כיצד מנגנון ה־Self-Attention מאפשר לכל רכיב ברצף "להתייחס" לכל רכיב אחר, ובכך מחליף את הצורך ברציפות של RNN. נבחנים יתרונות ה־Transformer כמו מקביליות, קיבולת הקשרים הרחוקים והפיכתו לסטנדרט בעיבוד שפה ובחלק מהמודלים הוויזואליים. מודול זה מעניק שליטה באבני הבניין הארכיטקטוניות של רשתות עומק – מ־CNN דרך LSTM ועד Transformer - תוך הבנה של העקרונות המתמטיים, האינטואיציה שמאחוריהם, והקשרים למקרי שימוש אמיתיים.

מודול 3: טכניקות מתקדמות לאימון והבנת המודל
במודול זה נלמד טכניקות מתקדמות שמאפשרות למודלים עמוקים להתאמן מהר יותר, להיות יציבים יותר ולהפוך לשקופים וברורים יותר. תחילתו בהצגת חשיבות הנירמול והאתחול - BatchNorm, LayerNorm ושיטות אתחול כמו Xavier ו־He - המבטיחים זרימת מידע חלקה ושימור גרדיאנטים יציבים. לאחר מכן, המיקוד עובר לדאטא עצמו בעזרת Augmentation, שבו טרנספורמציות פשוטות אך חכמות מעשירות את הדאטאסט ומגבירות את יכולת ההכללה. בהמשך מוצגות שיטות אופטימיזציה מתקדמות כמו AdamW, Lion ו־Adafactor, המספקות איזון בין מהירות, יציבות ויעילות חישובית בהתאם לדרישות המודל. לבסוף, נדון בחשיבות השקיפות (Explainability) ונציג כלים כמו GradCAM, SHAP ו־Feature Importance, המאפשרים להבין מה הוביל את המודל להחלטותיו. מודול זה מעניק סט כלים המשלב יציבות מתמטית, עיבוד דאטא חכם ושקיפות תפעולית - מרכיבים חיוניים לעבודה מקצועית בתעשייה.

מודול 4: כלים תעשייתיים והטמעה
במודול זה מתמקדים בהיבט התעשייתי של למידה עמוקה - איך להפוך מודל מאומן לכלי עבודה אמיתי שמשרת משתמשים ומערכות. תחילה נלמד להבדיל בין שתי הספריות המרכזיות בתחום, TensorFlow ו־PyTorch, ולהבין את יתרונותיהן השונים במחקר מול פרודקשן. לאחר מכן נתנסה בעבודה נכונה עם Google Colab - סביבת ענן זמינה וחינמית - ונראה כיצד לנצל את היכולות של GPU, לנהל קבצים ולשלב ניטור בזמן אמת. המודול ממשיך בהצגת Mixed Precision Training, שיטה שמאפשרת להאיץ את תהליך האימון ולחסוך בזיכרון מבלי לפגוע בביצועים. בהמשך נלמד כיצד לבצע Transfer Learning ו־Fine-Tuning - שימוש במודלים מאומנים מראש והתאמתם למשימות חדשות באופן מהיר ויעיל. לאחר מכן נעסוק בניהול חיי המודל: שמירה, טעינה וניהול גרסאות בעזרת פורמטים כמו TorchScript, SavedModel ו־ONNX. לבסוף, נסיים במימוש תעשייתי בסיסי - הפיכת מודל לשירות REST API באמצעות FastAPI, כולל דוגמאות להרצה בענן ולשיקולים של יציבות וסקיילינג. מודול זה מעניק את התמונה המלאה של שלב ההטמעה - משלב האימון ועד הפעלה רציפה בסביבות אמיתיות - ומכין את הלומד לעבודה מקצועית עם מערכות AI בקנה מידה תעשייתי.

מודול 5: המשך הדרך והתמחות
במודול זה מסכמים את יסודות הלמידה העמוקה המודרנית ומכוונים להמשך הדרך המקצועית. הוא פותח במיפוי תחומי ההתמחות המרכזיים - ראייה ממוחשבת, עיבוד שפה טבעית, דאטה טבלאי וסדרות זמן –- תוך הצגת האתגרים הייחודיים בכל תחום והמודלים המובילים המתאימים אליו. בהמשך, נבנית מפת דרכים למהנדס למידה עמוקה תעשייתי, הכוללת עקרונות עבודה נכונים: תיעוד, ניהול גרסאות, ניטור, אתיקה ושקיפות. השיעורים משלבים דוגמאות ליישומים תעשייתיים ומעניקים בסיס לחשיבה מערכתית: בניית תשתית אמינה שמחזיקה לאורך זמן. מודול זה משלים את המסע מן היסודות התיאורטיים ועד לתפיסה כוללת של מקצוענות תעשייתית.

דירוגים וסקירות של תלמידים

אין ביקורת עדיין
אין ביקורת עדיין