דיפסיק (DeepSeek) הסינית הצליחה לטלטל אתמול את עולם ה-AI ואת השווקים בו זמנית. סטארטאפ הבינה המלאכותית שחרר את המודל שלו-R1 והציג תוצאות מרשימות, אבל בעיקר יעילות מטורפת לעומת המתחרים המפורסמים שלו כמו ChatGPT וג'מיני, שהשקיעו מאות מיליונים באימון המודלים שלהם.
עם פתיחת המסחר בניו יורק הבינו את חומרת המצב, כאשר מניות רבות צנחו ובראשן אנבידיה, המלכה הבלתי מעורערת של נאסד"ק בשנה האחרונה. חברת השבבים הפסידה קרוב ל-600 מיליארד דולר ביום אחד, מחיקת השווי הגדולה ביותר שנרשמה אי פעם בוול סטריט, ובכך איבדה את התואר הנכסף של החברה הגדולה ביותר בעולם במונחי שווי שוק. בהצהרה לבלומברג, דובר של החברה אמר: "דיפסיק היא התקדמות מצוינת בבינה מלאכותית והיא דוגמה מושלמת ל-Test-Time Scaling. העבודה של דיפסיק ממחישה כיצד ניתן לייצר מודלים חדשים באמצעות טכניקה זו, תוך מינוף של מודלים קיימים וטכנולוגיות מחשוב שעומדות בתקנות הייצוא. ביצוע Inference דורש מספר משמעותי של מעבדים גרפיים וטכנולוגיות תקשורת מואצת. כעת, ישנם שלושה חוקי סקיילינג: Pre-Training, Post-Training וכן Test-Time Scaling".
Test Time Scaling היא שיטה שבה משתמשים כדי לשפר את ביצועי המודלים בשלב ההיסק (Inference). לעומת זאת Pre-Training היא שיטה לשיפור לפני האימון ו-Post-Training אחרי האימון.
סם אלטמן, הבעלים של OpenAI המתחרה, שיבח ב-X את מודל R1 של דיפסיק, שמצטיין במיוחד בפתרון בעיות ומציג ביצועים מקבילים לאלה של מודל o1 של OpenAI, בהתחשב במחיר הנמוך שלו. עם זאת, הוא אמר ש"העולם ירצה להשתמש בהרבה מאוד" בינה מלאכותית, והביע את אמונתו ש"משאבי חישוב חשובים כעת יותר מתמיד להצלחה במשימה שלנו". אלטמן ציין כי OpenAI "תספק, כמובן, מודלים הרבה יותר טובים" וכי העולם "באמת יופתע מאוד מהמודלים של הדור הבא שיגיעו", הוא הוסיף שהוא "מצפה להביא את הבינה המלאכותית הכללית (AGI) ומעבר לה".
but mostly we are excited to continue to execute on our research roadmap and believe more compute is more important now than ever before to succeed at our mission.
the world is going to want to use a LOT of ai, and really be quite amazed by the next gen models coming.
באופן מפתיע גם הנשיא עצמו, דונלד טראמפ, התייחס לדיפסיק ושיבח את הסינים: "זאת צריכה להיות קריאת השכמה לתעשיות שלנו, שעלינו להתמקד בתחרות כדי לנצח. קראתי על סין ועל כמה מהחברות בסין, אחת מהן במיוחד, שפיתחה שיטה מהירה יותר וזולה בהרבה לפיתוח בינה מלאכותית, וזה טוב כי לא צריך להוציא כל כך הרבה כסף. אני רואה בכך דבר חיובי. כי גם אתם תעשו את אותו הדבר, כך שלא תוציאו כל כך הרבה כסף, ותשיגו את אותה תוצאה". עם זאת הוא גם ציין שמכסים על שבבי מחשב, מוליכים למחצה ותרופות זרות ייכנסו לתוקף "בעתיד הקרוב".
לא כולם בעולם מאמינים להצהרות של החברה הסינית, אתמול עלה סרטון לרשת X של אלכסנדר ואנג, יזם, חוקר בינה מלאכותית ומיליארדר אמריקאי, מייסד ומנכ"ל Scale AI, אשר טען שלדיפסיק יש כ-50,000 יחידות מעבדים של אנבידיה מסוג H100, שהם לא יכולים לדבר עליהם בגלל מגבלות הייצוא של ארצות הברית שתקפות. אילון מאסק, שטרם התייחס באופן רציני לחברה הסינית, ענה לו פשוט: "ברור".
Obviously
אתמול, לאחר שהגיע לראש טבלאות ה-App Store של אפל בארה"ב, עוזר הבינה המלאכותית של דיפסיק הגביל את ההרשמות של משתמשים חדשים. לפי דף השגיאה, ההרשמות מוגבלות באופן זמני "עקב מתקפות זדוניות רחבות היקף על שירותי דיפסיק", אם כי לא ברור כיצד בדיוק מיושמות ההגבלות הללו.
"משתמשים קיימים יכולים להתחבר כרגיל", ציינה דיפסיק בעדכון שלה. "תודה על ההבנה והתמיכה". באנר התרעה בדף ההרשמה באתר דיפסיק מציין ש"ייתכן שההרשמה עמוסה" ולא שהיא מוגבלת לחלוטין, ומעודד משתמשים להמתין ולנסות שוב אם הבקשה שלהם לא התקבלה. בינתיים נראה שהמערכות חזרו לעבוד כרגיל. כעת כל מה שנותר לראות הוא כיצד יגיבו השווקים היום והאם אנבידיה ושאר החברות האמרקיאיות ימשיכו לצנוח או שיצליחו להתאושש מהר.
לאחר ההייפ המטורף שיצר המתחרה של ChatGPT, החברה הסינית הודיעה כבר על תחרות גם בתחום יצירת תמונות מטקסט. דיפסיק טוענת שמודל הבינה המלאכותית החדש שלה, Janus-Pro, יכול להציג ביצועים טובים יותר מ-Stable Diffusion ו-DALL-E 3. כעת, הסטארטאפ הסיני שחרר מודל בינה מלאכותית חדש בקוד פתוח: Janus-Pro. ניתוח תמונות מוגבל לרזולוציה של 384x384, אך החברה טוענת שגרסת המודל הגדולה ביותר, Janus-Pro-7b, גברה על מודלים מקבילים בשני מבחני ביצוע סטנדרטיים לבינה מלאכותית.
Wow.
DeepSeek just dropped Janus-Pro-7B, an open-source multimodal AI that beats DALL-E 3 and Stable Diffusion.
The is on fire. pic.twitter.com/Vy9V7P2FLP