הבינה המלאכותית מתקדמת שלב חדש ואולי מעט מבהיל: חברת OpenAI הציגה לעולם את ה-ChatGPT החדש שלה, שיכול לקבל ולהגיב לפקודות קוליות, לתמונות וסרטונים. לדברי החברה, האפליקציה החדשה, שנקראת GPT-4o, מטפלת בקול, תמונה או וידאו מהר יותר משמעותית מאשר גרסאות קודמות. האפליקציה זמינה ללא תשלום גם לסמארטפונים וגם למחשבים נייחים.

לדבר עם בינה מלאכותית: עשרה פרומפטים ראשונים

"אנחנו בוחנים את העתיד של האינטראקציה בינינו לבין מכונות", אמרה מירה מוראטי, מנהלת הטכנולוגיה הראשית של החברה. במהלך אירוע ששודר באינטרנט, מוראטי ועמיתיה הדגימו את השימוש באפליקציה החדשה כשהיא מגיבה לפקודות קוליות בשיחה, השתמשו בפיד וידאו חי כדי לנתח בעיות מתמטיות שנכתבו על דף והקראו בקול. 

האפליקציה החדשה היא חלק ממאמץ רחב יותר לשלב צ'אטבוטים לשיחה כמו ChatGPT עם עוזרים קוליים כמו Google Assistant ו-Siri של אפל. בזמן שגוגל ממזגת את הצ'אטבוט Gemini שלה עם Google Assistant, אפל מכינה גרסה חדשה של Siri שתדמה יותר לשיחה. 

OpenAI אמרה שהיא תשתף בהדרגה את הטכנולוגיה עם המשתמשים "במהלך השבועות הקרובים". זו הפעם הראשונה שהיא מציעה את ChatGPT כיישום שולחן עבודה. החברה הציעה בעבר טכנולוגיות דומות מתוך מוצרים שונים בחינם ובתשלום. 

האפליקציה החדשה לא יכולה ליצור וידאו. אבל היא יכולה ליצור תמונות סטילס מתוך פריימים של סרטון. בתגובה להודעות טקסט לשיחה, יכול הצ'ט לענות על שאלות, לכתוב עבודות ואפילו ליצור קוד מחשב.

ChatGPT לא נבנה על סמך מערכת כללים, אלא למד על ידי ניתוח כמויות אדירות של טקסט שנאסף מרחבי האינטרנט כולל מאמרים בוויקיפדיה, ספרים ויומני צ'אט. אלא שכיוון שצ'אטבוטים לומדים את כישוריהם מנתוני אינטרנט, הם נוטים לטעויות. לפעמים, הם מרכיבים את כל המידע מאתרים שונים באינטרנט שנבנים לכדי תוצאה שגויה ואף הזויה.

כאמור הגרסה החדשה יכולה לקרוא ולהבין תמונות, לתרגם שפות ולזהות רגשות מביטויים חזותיים. יש לצ'ט גם זיכרון כך שהוא יכול לזכור הנחיות קודמות. קצב השיחה מהיר יותר, בלי עיכוב משמעותי בין שאילת השאלה לבין קבלת תשובה. בשל האינטראקציה הקרובה לאנושית, יכול הצ'ט החדש פוטנציאלית "לפלרטט" בשיחות בדרך לדייט רומנטי, במקומכם.

במהלך ההדגמה חיה באמצעות גרסת הקול של GPT-4o, סיפק הצ'ט הצעות כיצד לפתור משוואה פשוטה שנכתבה על פיסת נייר - במקום פשוט לפתור אותה. הצ'ט ניתח קצת קוד מחשב, תרגם בין איטלקית לאנגלית ופרש את הרגשות בסלפי של גבר חייכן. באמצעות קול נשי אמריקאי הוא בירך את המשתתפים ושאל לשלומם. כשניתנה לו מחמאה הוא הגיב: "תפסיק, אתה גורם לי להסמיק!".

זה לא היה מושלם - בשלב מסוים הצ'ט חשב שהאיש החייכן הוא משטח עץ, או שהחל לפתור משוואה שעדיין לא הוצגה. התקלות הללו הוכיחו שיש לצ'ט עוד דרך ארוכה לעבור לפני שניתן יהיה לסמוך בוודאות על הבינה המלאכותית ותוצאותיה. 

מה שכן הראתה OpenAI, הוא את כיוון העתיד של העולם הטכנולוגי: הבינה המלאכותית ממשיכה לתפוס מקום משמעותי בחיינו, והצ'טים החדישים הצפויים, כולל זה של OpenAI יהפכו לדור הבא של העוזרת הדיגיטלית שיכולה לקיים אינטראקציה של ממש, ולא רק למלא פקודות פשוטות.