עולם הבינה המלאכותית נמצא בתנופה מתמדת, והשבוע האחרון לא היה יוצא דופן. בואו נצלול לכמה מהחידושים המרכזיים והמסקרנים ביותר.
Step 1X 3D: כלי חדשני ליצירת מודלים תלת-ממדיים
Step 1X 3D הוא כלי מרשים ליצירת מודלים תלת-ממדיים מדהימים עם טקסטורות מפורטות, והכל על סמך תמונה אחת בלבד! בין אם מדובר בדרקון משוכלל או תיק יד עם טקסטורת עור ריאליסטית, הכלי הזה מצליח לייצר מודלים מדויקים להפליא. בנוסף, הוא מאפשר שליטה בסימטריה ובחדות של האובייקט.
רוצים להתנסות? אפשר לעשות זאת בחינם דרך ההדגמה ב-Hugging Face, או להוריד ולהריץ אותו באופן מקומי. לפרטים נוספים, בקרו בדף ה-GitHub של הפרויקט.
Seed 1.5 VL: מודל ראייה-שפה פורץ דרך מבית ByteDance
ByteDance, החברה שמאחורי טיקטוק, השיקה את Seed 1.5 VL, מודל קוד פתוח שיודע לפענח גם תמונות וגם טקסט. הוא מפגין יכולות מרשימות בניתוח ויזואלי מורכב, זיהוי אובייקטים ופתרון חידות ויזואליות, ויכול לשמש גם כסוכן AI שיעזור לכם לנווט בין חלונות פתוחים במחשב.
המודל הזה משיג ביצועים מצוינים, ולעיתים אף עולה על Gemini 2.5 Pro של גוגל ו-GPT-4o של OpenAI. את כל המידע הנחוץ, כולל הוראות להורדה והרצה מקומית, תוכלו למצוא בעמוד ה-GitHub שלו. קיימת גם גרסה מקוונת להתנסות מהירה.
Stable Audio Open Small: מחולל אודיו קומפקטי ויעיל מבית Stability AI
Stability AI, החברה שאחראית ל-Stable Diffusion, הציגה את Stable Audio Open Small, מחולל אודיו קטן וזריז שיכול ליצור מוזיקה ואפקטים קוליים באמצעות טקסט. הוא מסוגל ליצור 12 שניות של אודיו בתוך 7 שניות בלבד על טלפון נייד, וניתן להריץ אותו על רוב הסמארטפונים ללא צורך בחומרה מיוחדת.
בעזרת הכלי הזה תוכלו ליצור לולאות קצביות מדויקות, אפקטים קוליים מציאותיים, ואפילו להעביר סגנון ספציפי מקטע אודיו קיים ליצירה חדשה. את המודלים תוכלו למצוא ב-Hugging Face, ואת ההוראות להרצה מקומית ב-GitHub.
שיפורים משמעותיים ב-LTX Video: מחולל וידאו קוד פתוח מהיר ויעיל
LTX Video, מחולל וידאו קוד פתוח שצבר פופולריות בזכות האיזון המוצלח בין איכות ומהירות, עבר שדרוג רציני! גרסת ה-Distilled החדשה מציעה שיפור ניכר במהירות היצירה, מבלי להתפשר על האיכות. הסרטונים נוצרים ב-4-8 צעדים בלבד, וניתן להריץ את הכלי גם על חומרה עם 12GB VRAM בלבד. תוכלו להתנסות בכלי בחינם דרך הדגמה ב-Hugging Face.
Hunyan Image 2.0: מחולל תמונות בזמן אמת מבית Tencent
Tencent חשפה את Hunyan Image 2.0, מחולל תמונות שיודע ליצור תמונות ברזולוציה גבוהה תוך מילישניות ספורות. הכלי כולל גם Canvas בזמן אמת, שמאפשר לשלב סקיצות עם תוצאות AI באופן מיידי. ניתן להירשם לרשימת המתנה באתר הרשמי.
Alpha Evolve ו-Light Lab: חידושים מבית גוגל
גוגל ממשיכה להפתיע עם Alpha Evolve, מערכת אוטונומית שמסוגלת לבצע פריצות דרך מדעיות, ו-Light Lab, כלי מדהים שמאפשר לשנות תאורה בתמונות בצורה ריאליסטית במיוחד. תוכלו לשנות את עוצמת האור, את הצבע שלו, ואפילו להוסיף מקורות אור חדשים לסצנה.
עדכונים מבית OpenAI: GPT-4.1 ו-Codex
OpenAI השיקה את GPT-4.1, מודל שמתמחה במשימות קידוד, וכן את Codex, כלי קידוד אוטונומי שיכול לסייע בביצוע משימות קידוד מורכבות כמו כתיבת קוד, תיקון באגים והסברת בסיסי קוד. בנוסף, OpenAI שחררה גרסת קוד פתוח של Codex בשם Codex CLI.
Deer Flow: סוכן מחקר קוד פתוח מבית ByteDance
ByteDance הציגה גם את Deer Flow, מערכת של סוכני AI שיכולה לבצע מחקר מקיף ולספק דוחות מפורטים. הכלי הזה תומך במגוון מודלים של AI ומאפשר אינטגרציה עם MCPs. תוכלו למצוא את כל המידע בעמוד ה-GitHub של הפרויקט.
תגובות
יש להתחבר כדי להגיב
טוען תגובות...