مهر: هم اکنون سیستمهای هوش مصنوعی جلوههای صوتی برای تصاویر ساکن از خیابانهای شهر و اماکن دیگر میسازند، اما یک فناوری آزمایشی جدید برعکس این فرآیند را انجام میدهد. یوهائو کانگ و همکارانش در دانشگاه تگزاس «مدل انتشار صدا به تصویر» (Soundscape-to-Image Diffusion Model) را براساس مخزن دادهای از کلیپهای صوتی و تصویری ۱۰ ثانیهای آموزش دادند.