איור של שני מודלי בינה מלאכותית, גדול וקטן, שמחוברים ביניהם באמצעות גשר של סימנים דיגיטליים שזורחים ביניהם, עם סמלים כמו 'בננה' ו'אינטרנט' מודגשים.
איור של שני מודלי בינה מלאכותית, גדול וקטן, שמחוברים ביניהם באמצעות גשר של סימנים דיגיטליים שזורחים ביניהם, עם סמלים כמו 'בננה' ו'אינטרנט' מודגשים.

האצת ביצועים של בינה מלאכותית ללא פגיעה באיכות יכולה להפוך את השימוש בה לנגישה יותר גם לסטארט-אפים קטנים. אם יש לך חבר או קולגה שמתעניין בטכנולוגיה או בפיתוח AI, אפשר לשלוח לו את זה בשקט.

מודלים של בינה מלאכותית יוכלו לתקשר גם אם 'מדברים' שפות שונות מהלך הסיפור ועובדות מרכזיות

חוקרים מהמכון למדע ויצמן ומעבדות אינטל פיתחו אלגוריתמים שמאפשרים למודלי בינה מלאכותית של חברות שונות לתקשר ולשתף פעולה, גם כשכל מודל משתמש בשפה דיגיטלית שונה. עד כה, שיטות להאצת ביצועים של מודלי שפה גדולים (LLMs), כמו ChatGPT או Gemini, פעלו רק כששני המודלים – קטן ומהיר וגדול ואיטי – השתמשו באותה שפה של סימנים (tokens). הפער הזה מנע מסטארט-אפים קטנים או מפתחים עצמאיים להפיק תועלת מהשיטה, מכיוון שלא היה להם גישה למודל קטן שמדבר באותה שפה. הפתרון החדש, שצויין בכנס ICML 2025, פותח את הדרך לשיתוף פעולה גלובלי בין מודלים.

האלגוריתמים מבוססים על שני פתרונות: הראשון מאפשר למודל גדול לתרגם את תוצאותיו לשפה שמודלים אחרים יכולים להבין. השני מסתמך על שימוש ב-tokens שמשותפים למודלים שונים – מה שדומה ל-cognates בשפות אנושיות, כמו "אינטרנט" או "בננה". כך ניתן לשלב כל מודל קטן עם כל מודל גדול, ללא צורך באימון מחדש. המערכת כבר זמינה בפלטפורמת Hugging Face, ונמצאת בשימוש על ידי מיליוני מפתחים.

השיפור בביצועים הוא משמעותי: האצה ממוצעת של פי 1.5, עם שיא של פי 2.8, ללא פגיעה באיכות התוצאות. זה חשוב במיוחד למכשירים חכמים שפועלים בתנאי חישוב מוגבלים – כמו טלפונים ניידים, רחפנים או מכוניות אוטונומיות. במקרה כזה, ההחלטה מהירה יכולה להיות עניין של חיים ומוות. הפיתוח עשוי להאיץ את דיפוזיית הטכנולוגיה, להפחית הוצאות על תשתיות עיבוד, ולפתוח שוק חדש של יישומי AI חכמים ויעילים.

עובדות

  • חוקרים מאינטל ומכון ויצמן פיתחו אלגוריתמים שמאפשרים למודלי בינה מלאכותית של חברות שונות לתקשר ולשתף פעולה, גם כשמשתמשים בשפות דיגיטליות שונות.
  • האלגוריתמים שימשו בשיפור של פי 1.5 בממוצע בביצועים של מודלי שפה גדולים (LLMs), עם שיא של פי 2.8, ללא פגיעה באיכות.
  • הפיתוח נבחר להצגה בכנס ICML 2025, שרק 1% מהמאמרים המוגשים אליו זוכים להצגה.
  • האלגוריתמים פורסמו ב-Hugging Face ומשמשים כבר מיליוני מפתחים.
  • השימוש בהם חשוב במיוחד למכשירים קצה כמו מכוניות אוטונומיות, שבהן מהירות החלטה קריטית.

הסבר חדשות חזותי של Canto. כלי AI עשויים לסייע בהפקה. מדיניות עריכה