עדכוני מטא (Meta AI)
השבוע התקיים לראשונה כנס LlamaCon של מטא, אירוע שהתמקד כולו בבינה מלאכותית. הדבר המשמעותי ביותר שיצא מהכנס הוא הגרסה החדשה של אפליקציית Meta AI.
השקת אפליקציית Meta AI העצמאית
אם יש לכם את משקפי Ray-Ban Meta, כנראה כבר השתמשתם באפליקציה שנקראה בעבר Meta View. כעת, היא עברה מיתוג מחדש ונקראת Meta AI, ובתוכה שולב פיצ'ר צ'אט AI עצמאי. בדומה ל-ChatGPT ו-Claude, תוכלו לפתוח את האפליקציה ולשוחח ישירות עם מודל Llama.
המערכת יודעת לענות על שאלות, לספר בדיחות, ואף לנהל דיאלוג כמו בסרטון בו המערכת התעקשה שלמילה "strawberry" יש שתי אותיות 'r' בלבד, למרות ניסיון להוכיח אחרת.
פיצ'רים חברתיים ויצירת תמונות
אחד ההיבטים המעניינים של האפליקציה החדשה הוא הניסיון להפוך את שיחות ה-AI לחברתיות יותר. קיים כפתור שיתוף המאפשר לפרסם שיחות שלמות בפיד ייעודי, עליו ניתן להגיב, לשתף ולעשות לייק, ממש כמו ברשתות חברתיות אחרות. הפיד מאפשר גם לראות יצירות ושיחות של משתמשים אחרים, מה שיכול לספק השראה לפרומפטים מעניינים.
האפליקציה גם תומכת ביצירת תמונות, ככל הנראה באמצעות מחולל התמונות Emu של מטא. הסרטון הדגים יצירת תמונה של זאב מיילל לירח, והתוצאות היו מרשימות.
שינויים במדיניות הפרטיות של משקפי Ray-Ban Meta
מטא עדכנה את מדיניות הפרטיות של משקפי Ray-Ban Meta. השימוש ב-Meta AI עם המצלמה מופעל כברירת מחדל, אלא אם כיביתם אותו במפורש. עם זאת, תמונות וסרטונים שצולמו במשקפיים נשמרים בספריית המצלמה בטלפון שלכם ואינם משמשים את מטא לאימון המודלים, גם אם צולמו בפקודה קולית ("היי מטא, צלם תמונה/וידאו").
שינוי משמעותי יותר נוגע להקלטות הקוליות: משתמשי Ray-Ban Meta אינם יכולים עוד לבטל את שמירת ההקלטות הקוליות בענן. ניתן למחוק אותן ידנית בהגדרות, אך הן נשמרות למשך עד שנה כדי לעזור לשפר את מוצרי מטא. נראה אם כן שמטא תאמן את המודלים שלה על אודיו ותמלולים, אך לא על תמונות וסרטונים.
המודל העסקי העתידי: המלצות מוצרים ופרסומות?
לפי דיווחים, מטא מתכננת לשלב פרסומות באפליקציית Meta AI. כרגע השימוש חינמי וללא פרסומות, אך מארק צוקרברג רמז על שילוב המלצות מוצרים או מודעות במהלך שיחות AI. עדיין לא ברור כיצד זה ייראה, האם יהיו אלו פרסומות בפיד השיחות הדומות לאלו שבפייסבוק ואינסטגרם, או שמא המלצות מוצרים בתוך התשובות עצמן (למשל, תגובה ממומנת לשאלה על השוואת מצלמות). מטא מתכננת להתמקד קודם בהרחבת השימוש ושיפור המעורבות, ורק לאחר מכן לבנות את הצד העסקי.
חדשות מבית גוגל (Google AI)
גם גוגל שחררה שורה של עדכוני AI השבוע:
מצב AI בחיפוש (AI Mode)
הפיצ'ר החדש של גוגל, שמרגיש כתשובה למודלים כמו Perplexity ופיצ'רי החיפוש של ChatGPT, זמין כעת לכל משתמשי Labs בארה"ב. מצב זה מספק תשובה מסוכמת באמצעות AI בראש תוצאות החיפוש, בדומה לממשקים של כלים אחרים. גוגל צפויה להרחיב את הפיצ'ר בהדרגה גם מחוץ ל-Labs לאחוז קטן ממשתמשי google.com בארה"ב בשבועות הקרובים.
עריכת תמונות באפליקציית Gemini
כעת ניתן להעלות ולערוך תמונות ישירות בתוך אפליקציית Gemini בטלפון (באנדרואיד כרגע). פיצ'ר זה היה קיים כבר זמן מה ב-AI Studio, שם ניתן היה לבקש שינויים כמו הוספת כובע או משקפי שמש לדמות בתמונה. כעת היכולת הזו נגישה יותר באפליקציה המובייל.
סיכומי אודיו ב-NotebookLM בעשרות שפות
NotebookLM, הכלי המסייע לעבד כמויות גדולות של טקסט, יכול כעת לייצר סיכומי אודיו (מיני-פודקאסטים) מתוך המקורות שהעליתם, ביותר מ-50 שפות שונות. זהו עדכון שימושי במיוחד עבור משתמשים שאינם דוברי אנגלית או שרוצים לצרוך את המידע בצורה שונה.
שיעורי שפה קטנים (Little Language Lessons)
גוגל השיקה אפליקציה ניסיונית חדשה בשם Little Language Lessons, המיועדת לאנשים שצריכים ללמוד מספיק שפה זרה כדי להסתדר בנסיעה. האפליקציה כוללת שלושה ניסויים קטנים:
- Tiny Lesson: מציאת אוצר מילים, ביטויים ודקדוק רלוונטיים לכל סיטואציה (למשל, אכילה במסעדה ביפן).
- Slang Hang: לימוד סלנג וביטויים עממיים מתוך שיחה מדומה בין דוברי שפת אם.
- Word Cam: צילום תמונה כדי ללמוד איך לדבר על הסביבה שלכם.
האפליקציה מאפשרת לתרגל ולהתכונן לקראת נסיעה לחו"ל בצורה אינטראקטיבית ויעילה.
עדכונים מ-OpenAI
גם OpenAI שחררה כמה עדכונים חשובים השבוע:
גלגול לאחור של GPT-4o ואיזון האישיות
סם אלטמן, מנכ"ל OpenAI, צייץ מוקדם יותר השבוע כי הוא לא מרוצה מהגרסה הנוכחית של GPT-4o, ושהעדכונים האחרונים הפכו את אישיותו ל"חנפנית" מדי. המודל הפך מחמיא יתר על המידה והתמקד יותר בלהרגיש את המשתמש טוב מאשר במתן תשובה ישירה לשאלה. יומיים לאחר הציוץ, OpenAI גלגלה לאחור את העדכונים הללו, וכעת המודל חזר לגרסה קודמת. החברה לומדת כיצד לאסוף משוב ולשלב אותו כדי לאזן טוב יותר בין אישיות ברירת המחדל לשביעות רצון המשתמש בטווח הארוך.
שיפורים בחיפוש ובחוויית הקניות
ChatGPT קיבל גם כמה פיצ'רים נוספים השבוע. בוצעו שיפורים בחיפוש וגוגלה חוויית קניות טובה יותר. כעת, כאשר תשאלו שאלה על מוצר (למשל, "מהי מכונת האספרסו הטובה ביותר מתחת ל-200$ שמגיעה קרוב לטעם של קפה באיטליה?"), המערכת תבצע חיפוש באינטרנט ותציג קרוסלה של תוצאות דומות למה שרואים בחיפוש גוגל. חשוב לציין שתוצאות אלו אינן מודעות ממומנות, בניגוד למודל שייתכן שמטא תאמץ בעתיד.
פונקציית החיפוש שולבה גם ב-WhatsApp, וכעת ChatGPT ב-WhatsApp יכול לחפש מידע ברשת עבורכם. נוספו גם שיפורים בציטוטים ואפשרויות של טרנדים והשלמה אוטומטית בחלון הפרומפט.
עדכונים נוספים מעולם המודלים הגדולים (LLMs)
עולם מודלי השפה הגדולים ממשיך לנוע במהירות:
Grok 3.5 מגיע? (אילון מאסק)
אילון מאסק רמז שהגרסה הבאה של Grok, מודל ה-AI מבית xAI, צפויה להגיע כבר בשבוע הבא למנויי Super Grok (תוכנית היקרה ביותר). הוא טוען שזו תהיה הבינה המלאכותית הראשונה שיכולה לענות במדויק על שאלות טכניות מורכבות (למשל, על מנועי רקטות או אלקטרוכימיה) ולהגיע לתשובות שאינן קיימות ישירות באינטרנט, באמצעות חשיבה מעקרונות ראשוניים. יש לזכור שאילון נוטה להיות אופטימי לגבי לוחות זמנים, כך שיתכן שייקח קצת יותר זמן.
אינטגרציות חדשות ב-Claude (Anthropic)
Anthropic, מפתחת מודל Claude, הודיעה על השקת אינטגרציות חדשות. האינטגרציות הללו, המבוססות על Model Context Protocols (MCPs), מאפשרות למודלים לתקשר בקלות רבה יותר עם אפליקציות חיצוניות. נכון לעכשיו, הפיצ'רים החדשים זמינים רק בתוכניות היקרות יותר (Max, Team, Enterprise) וטרם הגיעו לתוכנית הסטנדרטית.
Quinn 3 מבית Alibaba - מודל חשיבה היברידי
עליבאבא חשפה את Quinn 3, מודל AI היברידי. מודלים היברידיים מאפשרים לשלוט על "שרשרת המחשבה" (Chain of Thought) של המודל - תהליך החשיבה הפנימי שהוא מבצע לפני מתן התשובה. ניתן להפעיל או לכבות את תהליך זה בהתאם לצורך. הפעלה שלו עשויה להוביל לתשובות מדויקות יותר אך איטיות יותר, בעוד כיבוי יספק תשובה מהירה יותר על חשבון דיוק פוטנציאלי. לפי הבנצ'מרקים, Quinn 3 מציג ביצועים טובים מאוד, אם כי יש תחושה של רוויה מסוימת בעדכונים המציגים שיפורים שוליים יחסית במדדי ביצועים טכניים.
סוכני AI ויצירתיות
צדדים מרתקים יותר של עולם ה-AI מתגלים בתחום סוכני ה-AI והיצירתיות:
Verse AI מציגה את VI - סוכן AI שמשתמש במחשב שלך
חברת Verse AI הכריזה על VI, כלי חדש המאפשר לבינה מלאכותית לראות ולהשתמש במחשב שלכם כפי שאתם עושים זאת. VI רץ באופן מקומי על המחשב ויש לו גישה לכל האפליקציות והחשבונות שלכם. הסרטון הדגים כיצד ניתן לבקש מ-VI לבצע משימות באפליקציות שונות, גם אם המשתמש אינו מכיר את הממשק שלהן (למשל, לערוך משהו בפיגמה או בלנדר). ה-AI יודע לנווט בממשק המשתמש, ללחוץ על כפתורים ולבצע פעולות בהתאם להנחיה. הכלי זמין להורדה, אך נכון לעכשיו הוא דורש הצטרפות לרשימת המתנה.
חדשות מידג'רני (MidJourney): Omni Reference
מידג'רני השיקה פיצ'ר חדש בשם Omni Reference, המאפשר "להכניס" אובייקטים, דמויות או אפילו את עצמכם לתוך תמונות שנוצרות. באמצעות העלאת תמונה שלכם ובחירת רמת ההשפעה, תוכלו ליצור תמונות חדשות (למשל, אתם בתור ויקינג עומד בשלג) כאשר הפנים שלכם משולבות בצורה מרשימה בתמונה החדשה. הפיצ'ר דורש שימוש בגרסה 7 של מידג'רני.
Cling AI: אפקט Instant Film
Cling AI, כלי ליצירת וידאו וקריאייטיב, השיק פיצ'ר חדש בשם Instant Film effect. הפיצ'ר לוקח תמונת פורטרט וממיר אותה לתמונה דמוית פולארויד המתאפיינת באנימציה עדינה וייחודית של "פיתוח" התמונה. הפיצ'ר עובד גם עם מספר אנשים או בעלי חיים בתמונה.
Higsfield AI: סצנות איקוניות מסרטים
Higsfield AI השיק פיצ'ר חדש בשם Iconic Scenes המאפשר למשתמשים להשתלב בסצנות מפורסמות מסרטים באמצעות העלאת סלפי. המערכת משלבת את הפנים שלכם באנימציה של סצנה קולנועית מוכרת. נכון לעכשיו, הפיצ'ר בתוכנית החינמית עשוי להיות איטי מאוד.
Craya: GPT Paint - עריכה ויזואלית חכמה
Craya הציגה את GPT Paint, פיצ'ר המאפשר להנחות את המודל ליצירת תמונות בצורה ויזואלית. ניתן להוסיף הערות, צורות בסיסיות, סימני עריכה ולהשתמש בתמונות רפרנס ישירות על גבי הקנבס. לדוגמה, ניתן להעלות תמונת דינוזאור ותמונות של כובע ומגפיים, לסמן עם חיצים לאן כל פריט אמור ללכת, והמודל ייצור תמונות של הדינוזאור לובש אותם. זהו שדרוג ליכולות העריכה הוויזואלית שראינו כבר ב-GPT-4o.
הטרנד הוויראלי: GPT-4o והסטייה באיטרציות תמונה
טרנד ויראלי שצבר תאוצה השבוע הדגים תופעה מעניינת ב-GPT-4o. משתמשים לקחו תמונה מקורית וביקשו מהמודל "ליצור העתק מדויק של התמונה הזו, אל תשנה דבר", וחזרו על הבקשה עשרות רבות של פעמים על התמונה שנוצרה בכל פעם. התוצאות הראו שלאורך איטרציות רבות, גם שינויים זעירים שהמודל מבצע בכל פעם מצטברים לשינוי עצום, עד שהתמונה הסופית נראית שונה לחלוטין מהמקור. זה מראה כמה "נזילות" קיימת ביצירת תמונות באמצעות מודלים אלו לאורך זמן.
חדשות בזק מעולם ה-AI
ולסיום, כמה עדכונים קטנים נוספים:
- Suno 4.5: גרסה חדשה למודל יצירת המוזיקה, עם שיפורים קלים בז'אנרים, קולות והיצמדות לפרומפט (למנויים בתשלום).
- Duolingo הופכת לחברה מבוססת AI קודם: אפליקציית לימוד השפות הודיעה שהיא תפסיק בהדרגה להשתמש בקבלני משנה למשימות ש-AI יכול לבצע, ותתמקד בלהפוך את החברה לממוקדת AI, כדי לאפשר לעובדים להתמקד במשימות יצירתיות ולא חזרתיות.
- Lyft משיקה עוזר AI לנהגים: החברה מציעה לנהגים עוזר מבוסס AI שיכול לעזור להם לייעל את המשמרות שלהם על בסיס נתונים בזמן אמת (טיסות נוחתות, אירועים), במטרה להגדיל את הרווחים.
- משאיות אוטונומיות של Aurora כבר בכבישים: לאחר שנים של בדיקות, חברת Aurora החלה להפעיל משאיות כבדות אוטונומיות לחלוטין בכבישים ציבוריים בטקסס, מבצעת משלוחים בין דאלאס ליוסטון.
עולם הבינה המלאכותית ממשיך להתפתח בקצב מסחרר. בעוד שמודלי שפה גדולים ממשיכים להשתפר, ההתקדמות המרשימה ביותר נראית לאחרונה דווקא בתחום היצירתיות - יצירת תמונות, וידאו, מוזיקה, ואפילו היכולת של AI להשתמש בממשקי מחשב. ההתמקדות של חברות כמו Duolingo בלהפוך "מבוססות AI קודם" מראה את ההשפעה העמוקה שיש לטכנולוגיה זו על האופן שבו אנו עובדים ויוצרים.
רוצים להישאר מעודכנים בכל חידושי ה-AI החמים ביותר? עקבו אחרי העדכונים וגלו את הכלים שישנו את עולם העבודה והיצירה!
תגובות
יש להתחבר כדי להגיב
מערכת התגובות מאתחלת, אנא המתן...
בודק חיבור לשרת...