עולם הבינה המלאכותית ממשיך להתקדם בצעדי ענק, וכמעט כל שבוע אנו זוכים לראות פריצות דרך ופיצ'רים חדשים שמסקרנים ומרחיבים את האפשרויות. השבוע היה עמוס במיוחד, עם הכרזות חשובות מכמה מהשחקניות הגדולות בתחום וחידושים מרתקים בתחום ה-AI היצירתי. בואו נצלול פנימה לכל מה שאסור היה לכם לפספס.
מטא והתמקדות ב-AI: אפליקציה חדשה ושינויים בפרטיות
מטא קיימה השבוע את כנס ה-Llamacon הראשון שלה, שמוקדש כולו לבינה מלאכותית (בניגוד לכנס Meta Connect הרחב יותר). ההכרזה המשמעותית ביותר הייתה על אפליקציית Meta AI החדשה. האפליקציה, שבעבר נקראה Meta View ושימשה את משקפי Ray-Ban Meta, עברה מיתוג מחדש וכעת היא כוללת פיצ'ר צ'אט עצמאי המופעל על ידי מודל השפה Llama. ניתן לשוחח עם ה-AI ישירות דרך האפליקציה, לשאול שאלות ולקבל תשובות (למשל, הוא בטוח שאין שלוש אותיות R במילה strawberry...).
אחד ההיבטים המעניינים באפליקציה הוא הניסיון להפוך את שיחות ה-AI ל"חברתיות" יותר. קיים כפתור שיתוף המאפשר לפרסם שיחות או יצירות בפיד ייעודי, ומשתמשים אחרים יכולים להגיב, לשתף ולעשות לייק. זהו מקור השראה מצוין לפרומפטים מעניינים.
בנוסף, האפליקציה משתמשת במודל יצירת התמונות Emu של מטא. אפשר לבקש מה-AI ליצור תמונות, והתוצאות נראות מבטיחות.
פיצ'ר נוסף שהושק מאפשר להמשיך שיחות AI בין מכשירים: להתחיל שיחה על משקפי Ray-Ban Meta ולהמשיך אותה באפליקציה בטלפון או באפליקציית הרשת.
שינויים במדיניות הפרטיות של משקפי Ray-Ban Meta
לצד החידושים, דווח על שינויים במדיניות הפרטיות של המשקפיים:
שימוש במצלמה: Meta AI עם שימוש במצלמה מופעל תמיד במשקפיים, אלא אם מכבים אותו במפורש.
תמונות וסרטונים: תמונות וסרטונים שצולמו נשמרים בגלריית הטלפון ואינם משמשים את מטא לאימון המודלים, גם לא צילומים שנעשו בפקודה קולית "Hey Meta".
הקלטות קוליות: כאן יש שינוי משמעותי - לא ניתן עוד לבטל את שמירת ההקלטות הקוליות בענן. אמנם ניתן למחוק אותן ידנית בכל עת, אך הן נשמרות למשך עד שנה כדי "לשפר את מוצרי מטא". נראה שמטא מתכננת להשתמש באודיו ובתמלילי השיחות לאימון מודלי השפה שלה.
פרסומות באפליקציית Meta AI?
על פי דיווחים, מטא מתכננת להציג פרסומות באפליקציית Meta AI בעתיד. מארק צוקרברג הזכיר המלצות מוצרים או פרסומות אפשריות במסגרת ה-AI. טרם ברור מתי או כיצד זה יקרה (ייתכן שהפרסומות ישולבו בפיד השיחות או כהמלצות ממומנות בתוך התשובות), אך התוכנית היא להתמקד קודם בהרחבת השימוש והמעורבות. כרגע, האפליקציה חינמית וללא פרסומות.
גוגל מתחדשת ב-AI: חיפוש, עריכת תמונות, שפות ועוד
גם גוגל הכריזה על מספר עדכוני AI חשובים השבוע:
מצב AI בחיפוש (AI Mode in Search): גוגל פתחה את מצב ה-AI שלה (שנראה כמו תגובה למודלים כמו Perplexity) לכל משתמשי Google Labs בארה"ב. בקרוב הוא צפוי להיות זמין לאחוז קטן של משתמשים גם מחוץ ל-Labs, ישירות באתר google.com. הפיצ'ר מספק תשובות מבוססות AI עם קישורים, מפות והמלצות רכישה לשאילתות מורכבות.
עריכת תמונות באפליקציית Gemini: כעת ניתן להעלות ולערוך תמונות ישירות בתוך אפליקציית Gemini (באנדרואיד), בדומה ליכולות שהיו קיימות ב-AI Studio. ניתן לבקש מה-AI להוסיף אובייקטים (כמו משקפי שמש או כובע) לתמונות.
סקירות אודיו רב-לשוניות ב-Notebook LM: הכלי Notebook LM, שיוצר סיכומי אודיו מהמסמכים שאתם מספקים לו, תומך כעת ביותר מ-50 שפות עבור סקירות האודיו.
אפליקציית "Little Language Lessons": אפליקציה חדשה שמיועדת לעזור למשתמשים ללמוד את הבסיס של שפה זרה לקראת נסיעה. היא כוללת ניסויים כמו "Tiny Lesson" (אוצר מילים ודקדוק למצבים שונים), "Slang Hang" (סלנג וביטויים משיחות מדוברות) ו-"Word Cam" (צילום אובייקט ולמידת המילה המתאימה בשפה).
חדשות מ-OpenAI, Grok, Claude ואחרים
OpenAI - נסיגה מאימון GPT-4o והתקדמות בקניות ובחיפוש: סם אלטמן ציין שהגרסה הנוכחית של GPT-4o "מחנפת" מדי, וכתוצאה מכך, OpenAI ביטלה חלק מהעדכונים האחרונים למודל. נראה שהם שמו דגש יתר על פידבק קצר טווח על חשבון התנהגות המודל לאורך זמן. במקביל, שוחררו שיפורים לחיפוש של ChatGPT ולחוויית הקנייה, ונוספה פונקציונליות חיפוש ל-ChatGPT בתוך וואטסאפ.
Grok 3.5 בדרך? אילון מאסק טוען שגרסת Grok 3.5 תגיע למנויי Super Grok בשבוע הבא. הוא טוען שהיא הראשונה שמסוגלת לענות על שאלות טכניות מורכבות על ידי "חשיבה מעקרונות יסוד" (first principles), ואף ליצור תשובות שאינן קיימות באינטרנט. נראה אם ההבטחה תתממש בזמן.
אינטגרציות חדשות בקלוד (Claude): Anthropic הכריזה על אינטגרציות חדשות לקלוד באמצעות MCPs (Model Context Protocols), שמאפשרים למודל לתקשר עם אפליקציות אחרות. נכון לעכשיו, פיצ'ר זה זמין רק בתוכניות היקרות (Max, Team, Enterprise).
Alibaba Qwen3: מודל היברידי חזק: עליבאבא חשפה את Quinn 3, מודל שפה היברידי חדש. מודלים היברידיים מאפשרים להפעיל או לכבות את תהליך ה"חשיבה" המפורט של המודל (chain of thought reasoning), מה שמאפשר איזון בין דיוק (עם חשיבה ארוכה יותר) למהירות (עם חשיבה מקוצרת). על פי הבנצ'מרקים, Quinn 3 נחשב למודל חזק במיוחד.
Versep VI - סוכן AI שמשתמש במחשב שלכם: חברת Versep הציגה את VI, סוכן AI שנועד לראות ולהשתמש בממשק המחשב שלכם בדיוק כמו אדם. הוא רץ באופן מקומי ויכול לגשת לאפליקציות ולחשבונות שכבר מחוברים. ניתן להוריד את התוכנה כעת, אך נכון לעכשיו היא פועלת על רשימת המתנה. הדגמות מראות אותו מבצע פעולות מורכבות באפליקציות כמו Adobe Podcast או Figma רק על ידי קבלת הנחיות בשפה טבעית. זהו צעד מרתק לעבר אוטומציה של משימות בממשק המשתמש.
התקדמות מרשימה בתחום ה-AI היצירתי
תחום ה-AI היצירתי ממשיך להפתיע ולסקרן:
MidJourney Omni Reference: מידג'רני השיקה פיצ'ר חדש שמאפשר לשלב בקלות אלמנטים או דמויות ספציפיות בתמונות שנוצרות, כמו "להזריק" את הפנים שלכם לדמות של ויקינג. הפיצ'ר עובד טוב בהטמעת פרטים מתוך תמונת רפרנס.
Cling AI Instant Film: כלי זה מאפשר להפוך תמונות פורטרט לאנימציית "פיתוח" של תמונת פולרואיד, עם תנועה עדינה וסגנון ויזואלי ייחודי.
Higsfield AI Iconic Scenes: שירות חדש שמאפשר להכניס את הסלפי שלכם לסצנות אייקוניות מסרטים או ממים, וליצור מהם אנימציה קצרה.
Craya GPT Paint: פלטפורמת Craya הוסיפה פיצ'ר המאפשר הנחיה ויזואלית של יצירת התמונה. ניתן לסמן על גבי תמונות קיימות (עם חצים, צורות והערות טקסט) מה להוסיף או לשנות ואיך להשתמש באלמנטים מתמונות רפרנס אחרות.
הטיית הדור ב-GPT-4o: תופעה מעניינת
אחת התופעות המעניינות שנצפו השבוע עם יצירת תמונות ב-GPT-4o היא תופעת ה"הטיה" או "ההידרדרות" לאורך איטרציות רבות. כשמבקשים מהמודל לשכפל תמונה מסוימת שוב ושוב, כל איטרציה מכילה שינויים קטנים שמובילים לכך שלאחר עשרות איטרציות, התמונה הסופית נראית שונה לחלוטין מהמקור.
חדשות AI נוספות בקיצור
Suno 4.5: גרסה חדשה של מודל יצירת המוזיקה Suno יצאה למשתמשים בתשלום, עם שיפורים קלים בז'אנרים, שילובים חכמים יותר של שירים וקולות משופרים.
Duolingo עוברת לגישת AI-First: אפליקציית לימוד השפות הכריזה על מעבר לגישה שבה AI מקבל קדימות, מה שישפיע על מבנה החברה והתפקידים בה. המטרה היא שה-AI יבצע משימות חוזרות ויאפשר לעובדים להתמקד בעבודה יצירתית.
Lyft AI Earnings Assistant: אפליקציית הנסיעות השיקה עוזר AI לנהגים שלה, המספק המלצות לאופטימיזציה של שעות העבודה והמסלולים על בסיס נתונים בזמן אמת (כמו נחיתות בשדות תעופה ואירועים מקומיים) כדי לעזור להם להרוויח יותר.
משאיות אוטונומיות של Aurora בטקסס: חברת Aurora פרסה משאיות אוטונומיות לחלוטין בכבישים ציבוריים בטקסס. המשאיות כבר מבצעות משלוחים ללקוחות בין דאלאס ליוסטון, לאחר שהשלימו אלפי מיילים ללא נהג בבדיקות.
לסיכום, השבוע שוב הדגים את קצב ההתקדמות המדהים בתחום הבינה המלאכותית. בעוד שמודלי השפה הכלליים מגיעים לשלב של שיפורים הדרגתיים, תחום ה-AI היצירתי והסוכנים האוטונומיים מציגים חידושים מרתקים ופורצי דרך.
אם אתם רוצים להישאר בחזית, לגלות את הכלים החדשים ולעקוב אחרי ההתפתחויות החמות ביותר ב-AI,
גלו את עולם כלי ה-AI והישארו מעודכנים!
תודה שקראתם, וניפגש בעדכון הבא!
תגובות
יש להתחבר כדי להגיב
מערכת התגובות מאתחלת, אנא המתן...
בודק חיבור לשרת...