השבוע האחרון היה גדוש בחידושים ופיתוחים מרתקים בתחום הבינה המלאכותית. בפוסט זה, נסקור כמה מהנושאים הבולטים ביותר.
פרשנות ספורט לייב בזמן אמת
צוות מחקר מאוניברסיטת סינגפור פיתח מודל בשם Live CC-7B המסוגל לצפות במשחק ספורט בזמן אמת, לעבד את פיד הכתוביות האוטומטיות ולספק פרשנות מפורטת כמעט מיידית. המודל לומד ממשפטים לא גמורים וחלקיים, מה שמאפשר לו זמן תגובה מהיר במיוחד.
פתרון חדשני ליצירת סרטים של עליבאבא
עליבאבא הציגה את Uni3C, מערכת המאפשרת תיאום מושלם בין המצלמה לשחקן בסרטים. המערכת יוצרת מפת עומק, הופכת אותה לענן נקודות ומעבירה אותה למודול היגוי. מודול זה מנחה את מודל דיפוזיית הווידאו כיצד להזיז את המצלמה הווירטואלית, ובמקביל מאניש את הדמויות. התוצאה היא סרטון באיכות גבוהה עם תנועות מצלמה מורכבות. (קראו עוד על חידושי יצירת וידאו)
יצירת וידאו ארוך עם SAND AI
SAND AI הציגה את MAGI1, מחולל וידאו המיועד ליצירת סרטונים ארוכים. MAGI1 מחלק את ציר הזמן לחלקים קטנים יותר ומעבד אותם במקביל, מה שמאפשר יצירת סרטונים ארוכים מבלי להקריס את המערכת.
הסוכנים החדשים של מיקרוסופט ב-365 Copilot
מיקרוסופט הציגה סוכנים חדשים וחכמים בתוך 365 Copilot. הראשון, Researcher, מסוגל לבצע חיפושים מורכבים באינטרנט. השני, Analyst, מתפקד כדאטה סיינטיסט בתוך גליונות אלקטרוניים. בנוסף, Copilot Search יכול כעת לסרוק מקורות מידע רבים, כולל Slack ו-Google Drive, ולספק תשובות מקיפות עם ציטוטים.
סיוע קולי לאייפון מבית Perplexity
Perplexity השיקה סוף סוף את הסיוע הקולי שלה למשתמשי אייפון. הסיוע יכול לבחור מבין מודלים שונים של שפה, כמו GPT-4o ו-Gemini 2.5, ולתקשר ישירות עם אפליקציות אחרות.
מודלים מהירים וזולים מבית BYU
Baidu הסינית השיקה מודלים חדשים ומהירים במחירים נוחים. Ernie X1 Turbo מיועד לבעיות חשיבה, בעוד Ernie 4.5 Turbo מטפל בתמונות ובטקסט. המטרה של BYU היא להפוך את הבינה המלאכותית המתקדמת לנגישה לכולם.
בינה מלאכותית שולטת במחשב באמצעות צילומי מסך
ByteDance פתחה קוד פתוח למודל בשם UI-Tars, המסוגל להפעיל מחשבים על ידי התבוננות בצילומי מסך. המודל מנבא היכן ללחוץ, לגלול או להקליד, ושולח פקודות עכבר דרך ממשק תוכנה קטן.
אזהרה מפני מילים מוזרות
חוקרים ב-DeepMind הזהירו שמילים נדירות ומוזרות עלולות לגרום נזק למודלים של בינה מלאכותית. הוספת מילה נדירה למשפט עלולה לגרום למודל להזות. הם הציעו שני פתרונות: לכתוב את המשפט כך שהמילה המוזרה תופיע בהדרגה, ולסנן את 8% ממגמות הגרדיאנט הגבוהות ביותר במהלך כוונון עדין.
ניסוי של יוטיוב עם קליפים קצרים
יוטיוב החלה בניסוי המציג קליפים קצרים של סרטונים בתוצאות החיפוש. ניסוי זה עלול להשפיע על ההכנסות של יוצרי תוכן.
סיכום
השבוע האחרון היה עמוס בחידושים בתחום הבינה המלאכותית, החל מפרשנות ספורט בזמן אמת ועד ליצירת סרטים וירטואליים. בין היתר, ראינו מודלים חדשים ומהירים, סוכנים חכמים של מיקרוסופט ושיפורים בסיוע הקולי לאייפון. כמו כן, הוזהרנו מפני הסכנות של מילים מוזרות ונדירות במודלים של בינה מלאכותית. קראו עדכונים נוספים מהשבוע.
תגובות
יש להתחבר כדי להגיב
מערכת התגובות מאתחלת, אנא המתן...
בודק חיבור לשרת...