ג'מיני של גוגל הולך ומשתפר: גוגל הכריזה על עדכון למנוע הבינה המלאכותית שלה Gemini, שיוכל לסכם במהירות שיחות, להבין תמונות, כתוביות וסרטונים ולחלץ נתונים ממסמכים וטבלאות גדולים.

החשיפה מגיעה כאשר חברות טכנולוגיה מתקדמות יותר ויותר פיתוח מוצרי הבינה המלאכותית שלה. הכלים החדשים של ג'מיני, הבינה המלאכותית השכיח מאוד בישראל בשל יכולתו "להבין עברית" טוב יותר ממנועי בינה מלאכותית מקבילים, יעניק למשתמשים דרכים מתקדמות ויצירתיות יותר לגשת למידע מקוון בהשוואה לחיפוש אינטרנט מסורתי.

הדגם המשופר של ג'מיני שיקרא Gemini 1.5 יוכל להכיל מסמכים גדולים יותר – עד 1,500 עמודים מהם יוכל להכין תמצות, או לסכם 100 מיילים. המנוע יתמודד בקרוב גם עם שעה של תוכן וידאו, או בסיסי קוד של יותר מ-30 אלף שורות.

הבינה המלאכותית תאפשר לדברי גוגל לתת במהירות תשובות ותובנות לגבי מסמכים עמוסים, להבין פרטים של הסכמי חוזים למשל, טיעונים מפסקי דין או לסכם עבודות מחק ארוכות. ג'מיני יוכל לתמוך ב-35 שפות, יבין הקשרים בין המשפטים ויציע ניתוחים ועיבודים מדוייקים ככל האפשר לכל חומר אפשרי. ג'מיני 1.5 פרו יהיה זמין תחילה למפתחים, ובהמשך ייפתח לקהל הרחב. 

כאמור אתמול חברת OpenAI הציגה לעולם את ה- ChatGPT החדש שלה שיכול לקבל ולהגיב לפקודות קוליות, לתמונות וסרטונים. לדברי החברה האפליקציה החדשה שנקראת GPT-4o מטפלת בקול, תמונה או וידאו מהר יותר משמעותית מאשר גרסאות קודמות. האפליקציה זמינה ללא תשלום גם לסמרטפונים וגם למחשבים נייחים.

"אנחנו בוחנים את העתיד של האינטראקציה בינינו לבין מכונות", אמרה מירה מוראטי, מנהלת הטכנולוגיה הראשית של החברה. במהלך אירוע ששודר באינטרנט, מוראטי ועמיתיה הדגימו את השימוש באפליקציה החדשה כשהיא מגיבה לפקודות קוליות בשיחה, השתמשו בפיד וידאו חי כדי לנתח בעיות מתמטיות שנכתבו על דף והקראו בקול. 

האפליקציה החדשה היא חלק ממאמץ רחב יותר לשלב צ'אטבוטים לשיחה כמו ChatGPT עם עוזרים קוליים כמו Google Assistant ו-Siri של אפל. בזמן שגוגל ממזגת את הצ'אטבוט Gemini שלה עם Google Assistant, אפל מכינה גרסה חדשה של Siri שתדמה יותר לשיחה. 

OpenAI אמרה שהיא תשתף בהדרגה את הטכנולוגיה עם המשתמשים "במהלך השבועות הקרובים". זו הפעם הראשונה שהיא מציעה את ChatGPT כיישום שולחן עבודה. החברה הציעה בעבר טכנולוגיות דומות מתוך מוצרים שונים בחינם ובתשלום. 

ChatGPT לא נבנה על סמך מערכת כללים, אלא למד על ידי ניתוח כמויות אדירות של טקסט שנאסף מרחבי האינטרנט כולל מאמרים בוויקיפדיה, ספרים ויומני צ'אט. אלא שכיוון שצ'אטבוטים לומדים את כישוריהם מנתוני אינטרנט, הם נוטים לטעויות. לפעמים, הם מרכיבים את כל המידע מאתרים שונים באינטרנט שנבנים לכדי תוצאה שגויה ואף הזויה.

במהלך הדגמה חיה באמצעות גרסת הקול של GPT-4o, סיפק הצ'ט הצעות כיצד לפתור משוואה פשוטה שנכתבה על פיסת נייר - במקום פשוט לפתור אותה. הצ'ט ניתח קצת קוד מחשב, תרגם בין איטלקית לאנגלית ופרש את הרגשות בסלפי של גבר חייכן. באמצעות קול נשי אמריקאי הוא בירך את המשתתפים ושאל לשלומם. כשניתנה לו מחמאה הוא הגיב: "תפסיק, אתה גורם לי להסמיק!".

זה לא היה מושלם - בשלב מסוים הצ'ט חשב שהאיש החייכן הוא משטח עץ, או שהחל לפתור משוואה שעדיין לא הוצגה. התקלות הללו הוכיחו שיש לצ'ט עוד דרך ארוכה לעבור לפני שניתן יהיה לסמוך בוודאות על הבינה המלאכותית ותוצאותיה. 

מה שכן הראתה OpenAI הוא את כיוון העתיד של העולם הטכנולוגי: הבינה המלאכותית ממשיכה לתפוס מקום משמעותי בחיינו, והצ'טים החדישים הצפויים, כולל זה של OpenAI יהפכו לדור הבא של העוזרת הדיגיטלית שיכולה לקיים אינטראקציה של ממש, ולא רק למלא פקודות פשוטות.