הארגון OpenAI חולל מהפכה בתחום ה-AI (הבינה המלאכותית), כאשר הציג את המודל שפה - ChatGPT המסוגל ליצור טקסט בצורה דומה לאנושית ואת Dall-E - מערכת ליצירת תמונה מטקסט, עכשיו הוא הציג את Sora - מודל ליצירת וידיאו מטקסט.
בדקנו את מוצר הדגל של סמסונג: מה מסתתר מאחורי "מכשיר ה-AI"?
ב-OpenAI אומרים שהם מלמדים את ה-AI לחקות את התנועה בעולם הפיזי, כאשר המטרה היא לאמן מודלים שעוזרים לאנשים לפתור בעיות הדורשות אינטראקציה עם העולם האמיתי. Sora יכולה לייצר (לג׳נרט) סרטונים עד לאורך של דקה על סמך ההנחיות של המשתמש, כולל סצנות מורכבות עם מספר דמויות, תזוזה מסוימת שלהן, פרטים מדויקים של אובייקטים ברקע ואפילו זוויות שונות. המודל לא מבין רק את מה שהמשתמש ביקש ממנו, אלא גם איך האנשים או החפצים אמורים להתקיים בעולם האמיתי.
המודל עדיין לא מושלם, הוא לא מבין תוצאות של פעולה מסוימת, למשל, בסרטון שאדם נוגס בעוגיה, לאחר מכן, היא עדיין תישאר שלמה. Sora גם יכול להתבלבל בין ימין ושמאל או בסצנות שנמשכות לאורך זמן.
המודל Sora לא זמין (לפחות כרגע) לציבור הרחב, OpenAI מציע אותו לקבוצת חוקרים שתעריך את הסיכונים הקיימים בו. בנוסף, הוא גם פנה לקבוצה של מעצבי ויוצרי סרטים בכדי לקבל מהם פידבק שיעזור לקדם את המודל, כך שהוא יהיה טוב יותר ליוצרים. לדברי OpenAI, הסיבה שהם חשפו את Sora בשלב ההתחלתי הזה, מכיוון שהם רוצים פידבקים מחוץ לארגון וגם שהציבור יוכל לראות את העתיד של תחום ה-AI.
הסרטונים ש-OpenAI שיחרר מרשימים מאוד, הם כוללים צילום של בית ליד הים מהאוויר, אסטרונאוט הולך בחלל, פילים דוהרים בשלג ואישה הולכת בלילה ברחוב גשום.