PodcastsCiênciaExplAInable

ExplAInable

Tamir Nave, Mike Erlihson, Uri Goren, Hila Paz Herszfang
ExplAInable
Último episódio

155 episódios

  • ExplAInable

    [155] Diffusion Language Models

    25/05/2026 | 25min
    הפרק עוסק במודלי דיפוזיה ליצירת טקסט (DLMs), המאומנים לג'נרט טקסט מתוך רעש (ג'יבריש).להבדיל מעולם התמונות שבו רעש הוא טבעי, בעולם השפה ייצוג הרעש מורכב יותר בשל אופייה הדיסקרטי של השפה. קיימות שלוש גישות מרכזיות בתחום: הגישה הרציפה (המרעשת את האמבדינגס), הגישה הדיסקרטית (המחליפה טוקנים בג'יבריש) או ממסכת אותם), וגישת ה-Block Diffusion המשלבת חיזוי אוטוגרסיבי עם דיפוזיה.
    היתרון המרכזי של מודלי דיפוזיה הוא מהירותם הרבה לעומת מודלים אוטוגרסיביים, שכן הם מסוגלים לחזות בלוקים שלמים של טוקנים במקביל במקום לחזות טוקן אחר טוקן. למרות הפוטנציאל, המודלים הקיימים כיום עדיין מוגבלים מבחינת איכות הטקסט שהם מייצרים, ואין כרגע מודלי דיפוזיה גדולים מאוד מאות מילאירדי פרמטרים שמסוגלים להפגין ביצועי ברי השוואה עם LLMs בגדלים שונים
  • ExplAInable

    [154] על Physical AI: מתי הומנואידים של טסלה ושוטף-שואב יחלקו foundational model

    12/05/2026 | 23min
    יצא לכם לתהות מתי הומנואידים של טסלה ושוטף-שואב של שיאומי ישתמשו באותו ה- foundational model?
    אחרי שלושה פרקים ברימוט, אקספליינבל חוזרת לסטודיו, ובפרק 154 תמיר והילה צוללים ל- Physical AI. בפרק נבדיל בין 4 הקטגוריות של רובוטים, נבין למה צצו foundational models לתמונות לפני טקסט, איזה חיישן יכול לעזור לרובוט שוטף כלים להבדיל בין זכוכית לקריסטל, ואיך הרגולציה עשויה להשפיע על תפוצה רחבה של הומנואידים. 
    נפרק את מה שעומד מאחורי מודלי VLA (ויז׳ן, שפה, ו-action), ונבין מה צריך להשתנות עד שנוריד משקולות לשוטף-שואב מ Huggingface. 
    אז - האם סימולציות יוכלו לקדם אותנו לעבר מספיק training data? איך מגדירים טוקן בפעולות מוטוריות? ואיזו ענקית קראה למודל ה VLA שלה על שם דמות מפתיעה משומרי הגלקסיה?
    כל זאת, בפרק!
    אתר mAIk Education של תמיר: https://www.maik-education.com/
    סדנאות לבתי ספר: https://www.maik-education.com/for-Israelschools 
    סדנאות רובוטים לחברות (לעובדים או לילדי העובדים): https://www.maik-education.com/for-Israelcompanies 
    00:00 חוזרים להקליט באולפן!
    01:17 ארבע משפחות של רובוטים
    03:40 מתי foundational models נהיו שם-דבר
    06:46 מולטי-מודאליות של טקסט, תמונה, ופעולה: VLA
    11:35 על הinput וה-output של מודלי VLA 
    17:05 אז מה יש לנו היום בשוק
    20:04 החסם האנרגטי
  • ExplAInable

    [153] למידה אדוורסריאלית

    26/04/2026 | 36min
    מה הקשר בין הרעלת training data להורדת הסבירות ל- end of text token?
    בפרק 153 של אקספליינבל, אורי ומייק מארחים את ד״ר רז לפיד ואילון מזרחי לשיחה על למידה אדוורסריאלית. לא זו מארכיטקטורת GAN, אלא כזו שגורמת למודלי LLM לצטט את החוקה האמריקאית ולבזבז יותר מדי טוקנים. בפרק למדנו על תקיפות שמתחילות בwhitebox עם מודל opensource ונודדות למודלים סגורים, תקיפות פיזיות על מערכות סגורות שאומנו לזיהוי בני אדם, ואיך אפשר להתמודד עם מתקפה שמורידה את הסבירות שמודל שפה יוצא end of text token. אז האם אייג׳נטים שמשתמשים במודל סגור יותר בטוחים מכאלו שמשתמשים במשקולות מhugging face? איך תוקפים מרעילים תוצאות כשכל מה שיש להם הוא גישה ל training data? האם אורי ורז יפתחו עסק צדדי של הדפסת חולצות שיגרמו לנו להיות בלתי נראים?

    ה scholar של קרליני: https://scholar.google.com/citations?user=q4qDvAoAAAAJ&hl=en
    הגנה "לא מפוקחת" שהתקבלה ל ICCV: 
    https://openaccess.thecvf.com/content/ICCV2025W/SafeMM-AI/html/Mizrahi_Pulling_Back_the_Curtain_Unsupervised_Adversarial_Detection_via_Contrastive_Auxiliary_ICCVW_2025_paper.html
    התקפת black box על object detectors שהתקבלה ל - ECML: 
    https://arxiv.org/abs/2303.04238
  • ExplAInable

    [152] ביו-האקינג כמו דאטה סיינטיסט

    15/04/2026 | 17min
    מה הקשר בין התפלגות פוסטריורית של בדיקות גנטיות לבריאן ג׳ונסון? 
    השבוע באקספליינבל, אורי פותח מצלמה ומספר על ביו-האקינג מנקודת מבט קצת אחרת (ספוילר: בלי האקרים). ננסה להבין מה קורה כשמנסים לתשאל ריצוף גנום עם SQL, ואיך רופאים מגיבים לגישה "דאטאית" לבריאות. מה אפשר ללמוד (ומה פחות) מהשגרה הקיצונית של בריאן ג׳ונסון, למה ניסויים בלי קבוצת ביקורת הם בעייתיים יותר ממה שנדמה. ואפילו - האם בדיקה של 300$ יכולה להסביר למה צריך יותר חומר הרדמה אצל רופא שיניים?
  • ExplAInable

    [151] עקבות של רעשי תיוג עם ד״ר שמואל חיון

    30/03/2026 | 36min
    השבוע באקספליינבל אנחנו עוברים למתכונת רימוט ומארחים את ד״ר שמואל חיון, חוקר AI בכיר בהירונדו, שיספר לנו על העקבות שתיוג לא נכון משאיר לנו בזמן אימון המודל. הבנו איך טעות סיווג בהקלטה עם קשר טמפורלי קשורה לקלסיפיקציה של חתולים, ומתי סטטיסטיקות על פיצ׳רים כבר לא יכולות לעזור לנו במציאת טעויות סיווג (רמז: תמונות). העמקנו בהשפעה של דוגמא עם סיווג לא-נכון על loss של דוגמא אחרת, ואיך מודאליות שונה תשתמש אחרת באותה ליבה אלגוריתמית למציאת הרעשים.

    המאמרים שהוזכרו בפרק:
    שערוך יעיל של data influence למציאת שגיאות תיוג

    סקירת מגוון שיטות לחישוב מקורב של data influence

    00:00 היי שמואל, חוקר AI בכיר בהירונדו
    02:40 חשיבות איכות הדאטה וכלב שמסווג כחתון
    07:35 מבדיקה ידנית ועד קרבה סמנטית: איך להתמודד עם רעשי סיווג
    13:33 מודאליות ותיוגים: איפה אנחנו הכי פגיעים
    18:45 שגיאות תיוג נפוצות
    22:44 איך לומדים ביחד ולחוד עבור מודאליות שונה
    32:29 תוצאות בשטח
    35:48 איך ללמוד עוד
Mais podcasts de Ciência
Sobre ExplAInable
תמיר נווה, אורי גורן, מייק ארליכסון והילה פז הרשפנג מארחים מומחים מעולם הבינה המלאכותית. האזינו לשיחות עם חוקרי AI, דאטה סיינטסים, מהנדסי ML ומובילים בתעשייה, שמביאים לכם את האתגרים, המחשבות והתובנות המעניינות ביותר מבפנים.
Sítio Web de podcast

Ouve ExplAInable, Radiolab e muitos outros podcasts de todo o mundo com a aplicação radio.pt

Obtenha a aplicação gratuita radio.pt

  • Guardar rádios e podcasts favoritos
  • Transmissão via Wi-Fi ou Bluetooth
  • Carplay & Android Audo compatìvel
  • E ainda mais funções
Aplicações
Social
v8.9.4| © 2007-2026 radio.de GmbH
Generated: 5/28/2026 - 10:25:23 PM