הסבר קצר AI - Deep Learning

הסבר קצר על AI-Deep Learning

16 בנובמבר 2024

מותאם לקוראים שאינם מתמטיקאים או אנשי מחשבים.

בטכנולוגיה AI-Deep learning מחברים נתונים לרשת. הרשת כמו רשת של עכביש, בנויה מקורים שנקראים קשתות (החיצים האפורים בציור למטה) ונקודות החיבור של הקורים שנקראים צמתים (העיגולים הצבעוניים בציור למטה. השמות צמתים וקשתות, מתורת הגרפים). ב Deep learning הנתונים הם מספרים, לקשתות יש תפקיד ולצמתים יש תפקיד. לכל קשת יש משקל שהוא מספר (יכול להיות גדול קטן או שלילי) ששיך לקשת. לכל קשת יש גם כיוון שבו היא מעבירה נתונים מצומת המקור שלה לצומת היעד שלה. תפקיד הקשת לקבל נתון מצומת המקור, להכפיל את הנתון במשקל של הקשת עצמה (הכפלה חשבונית פשוטה). את תוצאת המכפלה להעביר לצומת היעד. כל הנתונים שמגיעים לצומת יעד מסוימת מחוברים (בחיבור חשבוני פשוט). באם תוצאת החיבור של כל הקשתות שנכנסות לצומת גדול או שווה ל-1, הצומת תוציא את הנתון (מספר) 1 לכל הקשתות שיוצאות ממנה. אם תוצאת החיבור קטנה מ-1 הצומת תוציא 0 לכל הקשתות היוצאות ממנה.

ניתן דוגמא, של AI שצריך לזהות האם בתמונה שחור לבן כלשהי, מופיע כלב או חתול.
כל תמונה היא בעצם אוסף של נקודות צפופות שמסודרות בשורות ועמודות ונקראות פיקסלים. כל אחד מהפיקסלים בתמונה הוא נתון שיכול להיות שחור או לבן כלומר במחשב או 0 או 1. כמו שרשום מעלה כל מקור כזה מחובר בטופולוגיה, בדרך כלל של מספר שכבות. שלא כמו בתמונה שממחישה שכבה בודדת בלבד.

העיגולים הירוקים בתמונה מקבלים כל אחד פיקסל אחד מהתמונה ומכאן יכולים להיות או 0 או 1 (שמסמנים נקודה שחורה או לבנה בהתאמה). בטופולוגיה בתמונה יש רק שכבה אחת ואין בה משוב חוזר. לכל קשת (חץ) בתמונה יש משקל. אם בסוף הפעולה, אחרי שהמידע עבר בקשתות (בחיצים) והוכפל במשקלות (משקל השתות), הצומת (העיגול) האדום הוציא "1", סימן שה AI "חושב" שבתמונה מוצג כלב, אחרת הוא "חושב" שבתמונה מוצג חתול.
אנחנו מציגים ל-AI אלפי או מיליוני תמונות של כלבים וחתולים. בכל פעם שה-AI טועה, לדוגמא מוציא בעיגול האדום 1 כאשר בעצם בתמונה היה חתול, אנחנו מענישים אותו עלי ידי כך שאנו משנים את המשקלות של הקשתות בכיוון ההפוך. בכל פעם שה-AI צדק אנחנו נותנים לו חיזוק חיובי על ידי חיזוק המשקלות שהביאו למסקנה הנכונה.
חינוך בשיטת המקל והגזר.
תהליך זה נקרא שלב הלימוד.

אחר שלב הלימוד אנחנו מציגים ל-AI תמונה חדשה של כלב או חתול?
למרבה הפלא, ה-AI יענה מהר יותר ומדויק יותר מאשר האדם הממוצע, לשאלה האם בתמונה יש כלב או חתול?

קורא שרצה הסבר קצר שייתן תחושה על מה זה אינטליגנציה מלאכותית (AI),
יכול בהחלט להסתפק בכך, ואין צורך שימשיך לקרוא.

בעצם בניסוח אחר אנחנו יכולים לומר שה-AI לא "חושב" שבתמונה יש כלב או חתול, אלא שהוא מנחש שבתמונה יש כלב או חתול. באותה מידה אנחנו יכולים לאמן את ה-AI לזהות (לנחש) אם בתמונה יש גבר או אישה. בטופולוגיה של CNN (אחת הטופולוגיות המקובלות, שפותחה בשנות ה-90) יש גם פעולות חשבון נוספות בין השכבות כמו קונבולוציה. במערכת עם 3 או 4 שכבות בטופולוגיה של CNN, ה-AI ינחש נחוש נכון, כנראה מעל מ-99% מהמקרים (בהנחה שביצענו אימון טוב עם מספיק דוגמאות).

נסביר עכשיו מדוע ה-AI טועה

נניח שאנו מאמנים את ה-AI שלנו לפתור בעיות חשבון. כמו שהסברנו קודם אנחנו מציגים לו בעיה חשבונית והוא מנחש פתרון. כמו קודם אנחנו מלמדים אותו בשיטת המקל והגזר. עכשיו מתחילים לתת לו בעיות חדשות והוא מנחש פתרונות. כמו קודם אם בנינו אותו בטופולוגיה מתאימה ואימנו אותו טוב הוא כנראה ייתן תשובה נכונה ב-99% מהמקרים.
האם זה יעיל או חכם?
ממש לא. מכונת חישוב פשוטה או תוכנה פשוטה, שצורכת פרומיל מהאנרגיה שצורך ה-AI לצורך "הפתרון" של החישוב, תענה תשובה נכונה ב-100% מהמקרים ובפחות זמן מה-AI.

מצד שני לפני שנים רבות בקורס חשבון דיפרנציאלי בטכניון, הסביר המרצה, שכל פתרון משוואה, בטח פתרון משוואה דיפרנציאלית, הוא ניחוש אינטליגנטי. כלומר להשתמש ב-AI במקרים רבים יכול להצביע (בניחוש אינטליגנטי) על כוון שלא יכולנו לפתור ללא AI.

בבסיסו ה-AI הוא מסווג. כלומר במקרה של הכלב או החתול, הוא מסווג את התמונות, בהתאם האם מופיע בהן כלב או חתול, גבר או אישה. לכן AI פשוט הוא classifier פשוט. ChatGPT יודע לענות לנו תשובות על שאלות מורכבות. אבל בסופו של דבר, הוא בנוי על ביצוע המון סיווגים שונים, על הטקסט שאנו שולחים לו. בהתאם הוא מסווג תשובה שאותה הוא מחזיר לנו. לכן נאמר ש-ChatGPT הוא classifier מורכב.

ישנן נקודות רבות שבהם החברה והאנושות צריכה לפחד מ-AI.

אנחנו כבני אדם בכלל ומהנדסים בפרט יודעים לבנות מודל שיודע בדייקנות רבה יחסית לנבא מה יקרה במערכת שאותה אנחנו בונים. המערכת יכולה להיות בניין שמהנדס אזרחי מתכנן. הוא יודע באיזה רעידות אדמה הבניין יחזיק מעמד ומול איזה עוצמת רוח. מהנדס מכונות שמתכנן מנוע סילון מתקדם ומורכב במיוחד, יודע לבנות מודל שייתן תוצאות מדויקות למדי לגבי ביצועי המנוע ובאיזה תנאים המנוע יכול לעמוד.

לא כך ב-AI. יש מודלים מדויקים למדי שמתארים רשת מאוד פשוטה כמו פרספטרון (קולטן, צומת בודד בשכבה אחת). אבל כשאנחנו עוברים לרשת אמתית עם מספר שכבות ופעולות קונבולוציה ביניהן המודלים הופכים לא רלוונטיים. בעיקרון אם הינו יודעים לבצע מודל נכון, היינו יכולים מראש לתת את המשקולות המתאימות לכל קו ברשת כדי לקבל את התוצאה הרצויה. כך היינו חוסכים את שלב הלימוד.

האינטליגנציה המלאכותית כשמה כן היא – אינטליגנטית. כלומר אינטליגנטית יותר מכל בן אנוש, וכפי שהסברתי קודם, אנחנו בהכרח איננו שולטים בה. כלומר אנחנו חושבים שבשיטת המקל והגזר לימדנו אותה משהו בכיוון שרצינו. אבל היא בהכרח, תוך כדי התהליך, למדה דברים נוספים.
חלק מהדברים הנוספים, אנחנו מבינים את מקורם. לדוגמא, בדוגמאות ההיסטוריות השונות רוב המדענים היו לבנים. מכאן אם נפתח מכון מחקר חדש, ונבקש ממערכת AI לבחור עבורנו מדענים, היא כנראה תעדיף מדענים שצבע עורם לבן על פני מדענים שצבע עורם שחור.
זו דוגמא נאיבית, אבל מערכות AI מוזנות במיליוני ומיליארדי נתונים. אין אפשרות אמתית לדעת מה בדיוק הן לומדות…

עדו