צפו במה שקורה כאשר בינה מלאכותית מלמדת רובוט 'יד' לסובב עט

התוצאות טובות יותר ממה שרוב בני האדם יכולים לנהל.

חוקרים הם אימון רובוטים לבצע א הולך וגדלמספר משימות באמצעות ניסוי וטעייה לימוד עם חיזוקים, וזה לעתים קרובות חָרוּץ ו דורש זמן רב. כדי לעזור, בני אדם מגייסים כעת מודל שפה גדול של AI כדי להאיץ את תהליך אימון. בניסוי שנערך לאחרונה, זה הביא לכמה רובוטים מיומנים להפליא אם כי מדומים.

צוות ב NVIDIA מחקר ביים פרוטוקול AI המופעל על ידי GPT-4 של OpenAI ללמד סימולציה של א יד רובוטית כמעט 30 משימות מורכבות, כולל הטלת כדור, דחיפת בלוקים, לחיצה על מתגים וכמה יכולות סחרור עט מרשימות.

[קָשׁוּר: זרועות הרובוט המונעות בינה מלאכותית עדינות מספיק כדי לאסוף שבבי פרינגלס.]

"סוכן AI" החדש של Eureka של NVIDIA משתמש ב-GPT-4 על ידי שואל את מודל שפה גדול (LLM) לכתוב קוד תוכנה ללימוד חיזוק מבוסס תגמול משלה. לטענת החברה, Eureka לא צריך הנחיה מורכבת או אפילו תבניות כתובות מראש; במקום זאת, הוא פשוט מתחיל לחדד תוכנית, ואז נצמד לכל משוב אנושי חיצוני.

בתוך ה הודעת החברה, Linxi "Jim" Fan, מדען מחקר בכיר ב-NVIDIA, תיאר את Eureka כ"שילוב ייחודי" של LLMs ותכנות סימולציה מואצות ב-GPU. "אנו מאמינים ש-Eureka תאפשר שליטה ברובוטים מיומנת ותספק דרך חדשה לייצר אנימציות מציאותיות פיזית לאמנים", הוסיף פאן.

אם לשפוט על פי סרטון ההדגמה של NVIDIA, יד רובוטית מאומנת ב-Eureka יכולה לשלוף טריקים של סיבוב עט כדי להתחרות, אם לא לנצח, בני אדם זריזים ביותר.

לאחר בדיקת פרוטוקול האימון שלו בתוך תוכנית סימולציה מתקדמת, Eureka מנתחת את הנתונים שנאספו ומנחה את ה-LLM לשפר עוד יותר את העיצוב שלו. התוצאה הסופית היא פרוטוקול בינה מלאכותית כמעט עצמית המסוגלת לקודד בהצלחה מגוון רובוטים עיצובים ביד כדי לתפעל מספריים, עטים סיבוביים וארונות פתוחים בתוך סימולציה מדויקת לפיזיקה סביבה.

האלטרנטיבות של יוריקה לתוכניות לימוד ניסוי וטעייה שנכתבו על ידי אדם אינן רק יעילות - ברוב המקרים, הן למעשה טוב יותר מאלה שכתבו בני אדם. אצל הקבוצה ממצאי עבודת מחקר בקוד פתוח, תכניות תגמול שתוכננה על ידי Eureka הצליחו על הקוד של בני אדם בלמעלה מ-80 אחוז מהמשימות - והסתכמו בשיפור ביצועים ממוצע של למעלה מ-50 אחוז בסימולציות הרובוטיות.

[קָשׁוּר: איך חוקרים אימנו כלב רובוט תקציבי לעשות טריקים.]

"למידת חיזוק אפשרה ניצחונות מרשימים בעשור האחרון, אך עדיין קיימים אתגרים רבים, כמו עיצוב תגמול, שנותר ניסוי וטעייה תהליך", אמרה אנימה אננדקומאר, מנהלת בכירה לחקר בינה מלאכותית במנהל הבכיר של מחקר בינה מלאכותית של NVIDIA ואחד מחברי המאמר של Eureka, בכתבה של החברה הַכרָזָה. "Eureka היא צעד ראשון לקראת פיתוח אלגוריתמים חדשים המשלבים שיטות למידה יצירתיות וחיזוקים לפתרון משימות קשות."

ההודעה האחרונה בבלוג

מדענים מהנדסים עכברים שלא יכולים להרגיש את הקור
September 02, 2023

וזה יכול להיות משככי כאבים טובים יותר. במעמקי החורף, שום דבר לא נראה מפתה כמו חוסר היכולת להרגיש כמה כוויות קור באצבעות הרגליים שלך. הודות לקבוצה ...

אל תחמיצו את ההזדמנות שלכם להבקיע את סימולטור הגולף הביתי בעל הדירוג הגבוה ביותר עבור $60 הנחה
September 02, 2023

תהיו טובים בגולף בכל זמן ובכל מקום. אנו עשויים להרוויח הכנסות מהמוצרים הזמינים בדף זה ולהשתתף בתוכניות שותפים. למד עוד >לדברי מומחים, ללמוד לשח...

עיראק מטיסה מל"טים מתוצרת סינית
September 02, 2023

מזל"ט CH-4 זה נושא שתי פצצות מונחות לווין על העמודים הפנימיים שלו, ושני טילי נ"ט כחול 7/9 על העמודים החיצוניים. צריח החיישן האלקטרו-אופטי של ה-CH-4...