שדרוגים בבינה מלאכותית

שדרוגים חדשניים מבית Anthropic: Claude 3.5

Anthropic מוציאה לאור גרסאות משופרות של Claude עם יכולות חדשניות

בתחום הבינה המלאכותית, Anthropic, החברה החלוצית בתחום, הציגה לאחרונה שדרוגים מרשימים לדגמי הבינה המלאכותית שלה, הכוללים את הדגם המתקדם Claude 3.5 Sonnet והדגם החדשני Claude 3.5 Haiku. במקביל, החברה השיקה את יכולת “שליטה במחשב” של Claude בגרסת ביתא ציבורית, מהלך חלוצי המעניק לבינה המלאכותית יכולות חדשות להשתלב עם ממשקי מחשב.

Claude 3.5 Sonnet – שיאים חדשים ביכולות הקידוד

הדגם המשודרג Claude 3.5 Sonnet מציג שיפורים מרחיקי לכת בכל התחומים, אך בולט במיוחד בתחום הקידוד. בהצלחה מרשימה, הדגם השיג ציון של 49.0% במבחן SWE-bench Verified, ביצוע העולה על כל הדגמים הזמינים לציבור הרחב, לרבות דגמים של OpenAI ומערכות קידוד מתמחות. התקדמות זו מסמנת נקודת ציון חשובה בשילוב בינה מלאכותית בתהליכי פיתוח תוכנה.

שליטה במחשב – יכולת חדשנית להשתלבות עם ממשקים

בצעד חלוצי, Anthropic השיקה את יכולת ‘שליטה במחשב’ של Claude בגרסת ביתא ציבורית. יכולת זו מאפשרת לבינה המלאכותית להשתלב באופן ישיר עם ממשקי מחשב, כמו צפייה במסכים, שליטה בסמן העכבר, לחיצות והקלדה – בדיוק כפי שמשתמש אנושי היה פועל. Claude 3.5 Sonnet הוא הדגם הראשון המציע פונקציונליות כזו, פותחת צוהר לשילוב בינה מלאכותית בתהליכים ממוחשבים.

חברות טכנולוגיה מובילות כבר החלו ליישם את היכולות החדשות הללו. לדוגמה, GitLab ציינה ‘קפיצה משמעותית עבור קידוד באמצעות בינה מלאכותית’ עם שיפור של עד 10% ביכולות החשיבה, ללא עיכובים נוספים.

Claude 3.5 Haiku – ביצועים גבוהים עם יעילות תפעולית

בנוסף לדגם המשודרג, Anthropic צפויה לשחרר בקרוב את הדגם החדש Claude 3.5 Haiku. דגם זה מציג ביצועים דומים לדגם Claude 3 Opus הקודם, עם ציון של 40.6% במבחן SWE-bench Verified, אך עושה זאת תוך שמירה על יעילות תפעולית וחיסכון במשאבים. ביצועים אלו ממקמים את Claude 3.5 Haiku מעל דגמים מתחרים רבים, כולל את Claude 3.5 Sonnet ואת GPT-4 של OpenAI.

גישה זהירה ובטוחה לפיתוח בינה מלאכותית

למרות ההתקדמות המרשימה, Anthropic נוקטת בגישה זהירה ומודעת לסיכונים הפוטנציאליים של יכולות חדשניות אלו. בבדיקת OSWorld, המעריכה את יכולת הניווט בממשקי מחשב, Claude 3.5 Sonnet השיג ציון של 14.9% בצילומי מסך בלבד – תוצאה מרחיקת לכת לעומת הדגם הבא בתור עם 7.8% בלבד.

בהתאם למדיניות הגדילה האחראית של Anthropic, הדגמים החדשים עברו הערכות בטיחות קפדניות בשיתוף עם מכוני הבטיחות של הבינה המלאכותית בארצות הברית ובממלכה המאוחדת. החברה ממשיכה לעמוד בתקן ASL-2 Standard שקבעה עבור עצמה.

סיכום

עם השקת Claude 3.5 Sonnet והכנסת יכולות שליטה במחשב חדשניות, ובקרוב גם השחרור של Claude 3.5 Haiku, Anthropic ממשיכה להוביל את החזית בפיתוח בינה מלאכותית משופרת ויעילה. תוך שמירה על גישה זהירה ובטוחה, החברה מרחיבה את גבולות האפשר בתחום הבינה המלאכותית ופותחת צוהר לשילובה בתחומי חיים נוספים.

השאר תגובה