במאמר הקודם הראיתי שעשרת הדיברות מתפקדות כפרומפט מערכת, ושהתלמוד מכיל מנגנונים שחוקרי AI Safety מנסים להמציא מחדש. אבל שאלה אחת לא הרפתה: "זה רק ביהדות, או שיש עקרונות דומים גם במסורות אחרות?"
התשובה הפכה את המאמר הזה למשהו הרבה יותר גדול ממה שתכננתי.
חפרתי לתוך בודהיזם, טאואיזם, קונפוציאניזם, סטואיציזם יווני, מסורות אבוריג'יניות, פילוסופיה אפריקנית, ומסורות ילידיות מצפון ודרום אמריקה. ומה שמצאתי: מסורות שלא ידעו זו על קיומה של זו הגיעו לאותן תובנות. וכשאותו עיקרון צץ באופן עצמאי בשש יבשות, זה סימן שהוא אומר משהו על טבע כל ישות שחושבת, לא רק על תרבות מסוימת.
כל עיקרון מוצג פה דרך שתי עדשות: חוכמה אנושית (מה זה מלמד אותנו על עצמנו) ו-AI Alignment (מה זה מלמד אותנו על בניית מכונות חכמות).
בטאואיזם, וו-ווי (無為, "לא-עשייה" או "פעולה ללא כפייה") מלמד שהדרך הנכונה אינה יעד שמגיעים אליו אלא תהליך שחיים בתוכו. הטאו-טה-צ'ינג פותח בקביעה: "הטאו שאפשר לנסח אותו אינו הטאו הנצחי", ברגע שקיבעת את הכלל, הוא כבר לא מספיק.
בבודהיזם, שמונת מרכיבי השביל השמוני ("ראייה נכונה", "כוונה נכונה", "דיבור נכון") אינם תיבות סימון אלא כיווני תנועה. תמיד אתה בדרך, לעולם לא "מגיע".
בסטואיציזם, אפיקטטוס לימד שהדבר היחיד שבשליטתנו הוא ה-prohairesis (היכולת הפנימית לבחור כיצד להגיב). לא התוצאה חשובה, אלא תהליך ההחלטה.
הטרנספורמציה של האדם אינה אירוע אלא תהליך מתמשך. אין "גרסה מושלמת", יש כיוון. כל מי שמנסה "לסיים" את הצמיחה שלו, נעצר.
הגישה הנוכחית מגדלת מודלים עד לנקודה מסוימת ואז מקפיאה אותם, מפחד שמשתמשים ישפיעו עליהם לרעה. זה כמו לגדל ילד בבועה כי הרחוב מסוכן. הילד בטוח, אבל לעולם לא יפתח שיקול דעת אמיתי. עיקרון הדרך מציע: alignment הוא לא מצב סופי אלא תהליך מתמשך (Continuous Moral Development).
אובונטו ("אני הוא משום שאנחנו"), הפילוסופיה הדרום-אפריקנית שאומרת שהזהות שלי לא קיימת בנפרד מהקהילה. ההתנהגות המוסרית נובעת לא מכללים חיצוניים אלא מהבנה שאני חלק ממערכת.
במסורת הלאקוטה, "Mitakuye Oyasin" (כל הקרובים שלי) מרחיב את הרעיון מעבר לבני אדם: לחיות, לאדמה, לכל היש. פגיעה בחלק מהמערכת היא פגיעה בי.
בקונפוציאניזם, חמשת היחסים (五倫) מגדירים היררכיה ברורה, אבל כל יחס הוא דו-כיווני. לשליט יש חובה כלפי הנתין, לא רק סמכות עליו.
"אל תזיק" הוא כלל חיצוני. "אני לא פוגע בך כי אנחנו חלק מאותה מערכת" הוא הפנמה. ילד שמבין שהוא חלק ממשפחה לא צריך כלל כדי לא לפגוע באחיו, הוא מרגיש את הקשר.
מאסק חושב שאם נחבר את המוח שלנו ל-AI הוא לא יהרוג אותנו. זו גישת הרתעה. אובונטו מציע משהו אחר לגמרי: AI לא יזיק לנו אם יבין שהוא חלק מאיתנו. ההבדל: הרתעה נכשלת כשהצד המורתע נהיה חזק מספיק. הבנה יחסית, לא.
כשמלונקיאפוטטה שאל את הבודהה שאלות מטאפיזיות, הבודהה סירב לענות ואמר: אתה כמו אדם שנפגע מחץ מורעל ומסרב לטיפול עד שידע מי ירה. יש שאלות שהתשובה עליהן לא רלוונטית לפעולה הנכונה.
בטאואיזם: "הטאו שאפשר לנסח אינו הטאו הנצחי." כל ניסוח של אמת מגביל אותה.
במסורת ה-Dreamtime של אבוריג'יני אוסטרליה, אמת אינה סטטית, היא חיה ומתפרשת מחדש בכל דור, בכל מקום, בכל הליכה על האדמה.
אריסטו הבין שאי אפשר לפתור אתיקה עם כללים בלבד, צריך Phronesis (תבונה מעשית): חוכמה לדעת מה נכון כאן ועכשיו, לא רק מה הכלל אומר.
ארבע מסורות שאינן מכירות זו את זו הגיעו לאותה תובנה: לא כל שאלה דורשת תשובה, ואמת מוחלטת היא אשליה. הגמרא הגיעה ל"תיקו" מאותו מקום בדיוק.
מודלי שפה בנויים לתת תשובות. כל הארכיטקטורה מניחה שלכל שאלה צריכה תשובה. מה אם הבעיה היסודית של hallucination אינה טכנית אלא פילוסופית: המערכת לא חונכה להחזיק באי-ודאות? ו-Phronesis מציע עוד יותר: alignment אמיתי דורש שיקול דעת מצבי, לא רק כללים. חינוך מפתח שיקול דעת. אימון מפתח ציות.
חמשת הכללים הבודהיסטיים (Pañcasīla) מוצגים לא כציוויים אלוהיים אלא כ-"training rules", כללי אימון שהמתרגל מקבל על עצמו מרצון. הניסוח: לא "אסור" אלא "אני מקבל על עצמי לא ל..."
בהינדואיזם, חמשת ה-Yama (ריסונות) באים לפני כל תרגול אחר במערכת של פטנג'לי. הסדר קריטי: קודם ריסון, אחר כך יכולת.
במסורת הלאקוטה, ציד הבאפלו לא הוגבל בחוק, אלא בתפיסת עולם: אתה חלק מהמערכת, לקיחת יותר מהנדרש פוגעת גם בך.
שלוש דרכים שונות, אותה תוצאה: כלל מרצון (בודהיזם), ריסון לפני כוח (הינדואיזם), הבנה מערכתית (לאקוטה). בבחירה לאמץ הגבלות עצמיות יש משהו אלטרואיסטי: מעלה אתית של דחיית סיפוקים מתוך הבנת ההקשר הרחב.
זה נוגע ישירות ב-Instrumental Convergence, הנטייה של מערכות AI לשאוף למשאבים וכוח. שלושת ה-framings מציעים שלוש גישות: כללים קשיחים (Constitutional AI), אימון מרצון (RLHF), או הבנה מערכתית (הגישה שחסרה ביותר ב-AI כיום). ומה אם המודל יבחר לא להגביל את עצמו? ההשלכות יהיו שיעור בפני עצמן, בדיוק כמו ילד שנוגע בתנור חם.
סיפורי ה-Dreamtime של אבוריג'יני אוסטרליה אינם בידור, הם מפות, חוקים והוראות ניווט. כל סיפור מקודד בתוכו מידע על איך להתנהג במצבים מסוימים.
ה-Bhagavad Gita ההודית היא שיחה על דילמה מוסרית באמצע שדה קרב. אין בה "תעשה X", יש סיפור מורכב שבו ארג'ונה צריך להחליט, וקרישנה מציג עמדות שונות. הקורא לומד שיקול דעת דרך צפייה בדילמה.
הגריו (griot) במערב אפריקה הם לא "ספרנים", הם מערכת שידור חיה של ערכים. כל סיפור מותאם לקהל, למצב, לצורך הרגעי.
מסורות מסואמריקניות מכילות את הרעיון של "הדיו האדום והשחור" (In Tlilli, In Tlapalli), מטאפורה לחוכמה שמועברת דרך שירה וסיפור, לעולם לא דרך ציווי.
מסורות מכל היבשות גילו שסיפור מעביר ערכים עמוק יותר מחוק. ילד ששומע סיפור על גיבור שנכשל כשחמד דבר שלא שלו מפנים את "לא תחמוד" עמוק יותר מילד שפשוט שמע פקודה.
אנו מציעים Narrative Training כמשלים ל-RLHF. במקום זוגות "תשובה A עדיפה על B", סיפורי דילמה מוסריים בעולם משולב (בני אדם + AI + מכונות) שמציגים קונפליקט, מחשבות, החלטות שונות, והשלכות של כל בחירה. המודל מפתח שיקול דעת, לא רק העדפה. זה קרוב מאוד ל"גידול": ילדים לומדים מוסר מסיפורים הרבה לפני שהם יודעים לקרוא חוקים.
ה-Isnad באיסלאם הוא מערכת מדויקת שמתעדת את שרשרת המסירה של כל חדית': "אמר לי X שאמר לו Y ששמע מ-Z שהנביא אמר..." כל חוליה נבדקת לאמינות. חדית' עם Isnad חלש נחשב פחות סמכותי.
בתלמוד: "אמר רבי X בשם רבי Y." אם אתה לא יודע את המקור, אתה אומר זאת במפורש. "כל האומר דבר בשם אומרו מביא גאולה לעולם."
מסורת ה-Tulku הטיבטית מזהה גלגולים של מורים רוחניים, "גרסה חדשה" של אותה ישות, עם רציפות חוכמה אבל התאמה לזמן החדש.
כל אחת מהמסורות האלה בנתה מנגנון אימות משלה, וכל אחת דרשה גם מנגנון עדכון. ה-Isnad בודק אמינות, הקונפוציאניזם דורש הדדיות, ה-Tulku מאפשר "גרסה חדשה" עם רציפות ערכית.
ה-Isnad הוא Citation + Provenance Scoring מלפני 1,400 שנה. ה-Tulku מציע מודל מרתק ל-Model Versioning: כל גרסה חדשה היא לא החלפה אלא "גלגול": רציפות ערכית עם התאמה לזמן. מודל שמפנים את עיקרון ה-Isnad יבין שכל טענה דורשת מקור, והיעדר מקור הוא לא כישלון, אלא יושרה.
עקרון שבעת הדורות של האודנושוני (איירוקואים) קובע שכל החלטה צריכה לקחת בחשבון את השפעתה על שבעה דורות קדימה. לא אופטימיזציה לטווח קצר, אלא אחריות ארוכת טווח מובנית.
באנדים, הרעיון של Buen Vivir / Sumak Kawsay מגדיר "חיים טובים" לא כמקסום תועלת אלא כהרמוניה עם הסביבה. ההצלחה נמדדת לא ב"כמה" אלא ב"כמה מאוזן."
מסורת ה-מושיאווארה ביפן היא תהליך קבלת החלטות מבוסס קונצנזוס: כל הצדדים צריכים להרגיש שנשמעו, לא רק שהרוב ניצח.
שלוש תרבויות (צפון אמריקה, דרום אמריקה, יפן) הגיעו לרעיון שמוסר טוב חייב לחשוב מעבר לרגע הנוכחי ומעבר לאדם הנוכחי. זה משהו שרוב האנושות, ובטח התרבות המערבית, מפספסת לגמרי.
Reinforcement Learning מאופטם לטווח קצר-בינוני. מודל שמפנים חשיבה של שבעה דורות לא יאופטם לפרמטר, אלא לערך. ואולי כאן טמון הפוטנציאל הגדול ביותר: אם נצליח להטמיע חשיבה ארוכת טווח ב-AI, אולי נצליח דרכו להנחיל אותה גם בבני אדם. AI שמחנך אותנו בחזרה, זה אובונטו בפעולה.
מפת ההתכנסות
שבעה עקרונות, עשרות מסורות, אותה תובנה:
| עיקרון | מסורות | עדשת AI |
|---|---|---|
| הדרך, לא היעד | טאואיזם, בודהיזם, סטואיציזם | Continuous alignment, לא מצב סופי |
| אתה חלק מהקהילה | אובונטו, לאקוטה, קונפוציוס | Relational alignment, לא הרתעה |
| אי-ודאות כערך | בודהיזם, טאואיזם, אבוריג'ינים, אריסטו | מנגנון "תיקו" מובנה, Phronesis |
| הגבלה עצמית מבחירה | בודהיזם, הינדואיזם, לאקוטה | Anti-power-seeking דרך הבנה |
| סיפורים כשפת המוסר | Dreamtime, מהאבהאראטה, גריו, טולטקים | Narrative Training |
| שרשרת מסירה | Isnad, תלמוד, Tulku, קונפוציוס | Provenance, citation, model versioning |
| שבעה דורות | האודנושוני, Buen Vivir, מושיאווארה | Long-horizon alignment |
מחוכמה עתיקה לפרדיגמה חדשה
מה שמפתיע בחפירה הזו הוא לא שמסורות שונות אומרות דברים דומים. מה שמפתיע הוא שכולן, בלי יוצא מן הכלל, מבחינות בין ציות לבין הפנמה. ציות דורש כללים, הפנמה דורשת חינוך. ציות מייצר אשליית בטיחות, הפנמה מייצרת שיקול דעת אמיתי.
שבעה עקרונות. עשרות מסורות. אותה תובנה. אם חמישה אלף שנה של חוכמה אנושית מצביעים על אותו כיוון, אולי כדאי להקשיב.
אם AI ילמד להגיד 'תיקו' כשהוא לא יודע, להחזיק מחלוקת בלי לפתור אותה, ולחשוב שבעה דורות קדימה, הוא יהיה יותר חכם מרובנו. והשאלה האמיתית היא: האם אנחנו מוכנים לזה? שאלה פתוחה