گجت‌نیوز نوشت: هوش مصنوعی VALL-E مایکروسافت ابزاری جذاب و در عین حال ترسناک است که علاوه بر تقلید دقیق صدا، می‌تواند لحن و احساسات گوینده را نیز بازتولید کند. فناوری‌های مبتنی بر هوش مصنوعی با سرعتی باورنکردنی در حال توسعه هستند. پس از رونمایی از مدل‌های AI که می‌توانند از کلمات تصویر بسازند و با […]

هوش مصنوعی مایکروسافت VALL-E، ترسناک‌تر از چیزی است که فکرش را می‌کنید!

گجت‌نیوز نوشت: هوش مصنوعی VALL-E مایکروسافت ابزاری جذاب و در عین حال ترسناک است که علاوه بر تقلید دقیق صدا، می‌تواند لحن و احساسات گوینده را نیز بازتولید کند.

فناوری‌های مبتنی بر هوش مصنوعی با سرعتی باورنکردنی در حال توسعه هستند. پس از رونمایی از مدل‌های AI که می‌توانند از کلمات تصویر بسازند و با شما وارد گفتگو شوند، هوش مصنوعی موسوم به VALL-E مایکروسافت می‌تواند به تقلید هر نوع صدایی، تنها در عرض ۳ ثانیه بپردازد. برخلاف بسیاری از ابزارهای هوش مصنوعی، VALL-E می‌تواند احساسات و لحن گوینده را نیز بازتولید کند.

WALL-E: هوش مصنوعی مایکروسافت که می‌تواند هر صدایی را تقلید کند

هوش مصنوعی مایکروسافت

هوش مصنوعی WALL-E مایکروسافت می‌تواند صدای افراد را به‌طور کامل بازتولید و تکرار کند. این ابزار از ضبط ۳ ثانیه‌ای یک صدای خاص به‌عنوانی پیامی برای تولید محتوا استفاده می‌کند و بر روی ۶۰ هزار ساعت داده گفتار انگلیسی تسلط دارد. این مدل AI هم‌چنین قادر است احساسات و لحن گوینده را به کلماتی اضافه کند که هرگز توسط فرد گفته نشده است.

این پیشرفتی قابل توجه در زمینه گفتار تولید شده توسط هوش مصنوعی است، زیرا مدل‌های قبلی تنها می‌توانستند صدا را تکرار کنند و در تقلید لحن و احساسات گوینده ناتوان بودند. دانشگاه کرنل در مطالعه خود از هوش مصنوعی WALL-E مایکروسافت برای ترکیب چندین صدا استفاده کرده که نمونه‌هایی از این کار در GitHub موجود است.

نمونه‌های صوتی به اشتراک گذاشته شده توسط مایکروسافت، از لحاظ کیفی دارای اختلاف هستند و در حالی‌که برخی از آنها کاملا طبیعی به‌گوش می‌رسند، برخی دیگر صدایی رباتیک و ماشینی دارند. بااین‌حال، با ادامه پیشرفت‌ها در حوزه هوش مصنوعی، نمونه صداهای ضبط‌ شده بهبود خواهند یافت.

هوش مصنوعی vall-e مایکروسافت

در این میان، نگرانی‌های در مورد پیامدهای اخلاقی این فناوری نیز وجود دارد. با قدرتمندتر شده فناوری AI، صداهای تولید شده توسط VALL-E و نمونه‌های مشابه بیش از گذشته به واقعیت نزدیک‌تر شده‌اند که ممکن است مورد سواستفاده افراد سودجو برای تماس‌های اسپم قرار بگیرند. علاوه بر آن، هویت سیاستمداران و سایر شخصیت‌های سرشناس نیز ممکن است توسط این ابزار تقلید صدا، جعل و در نتیجه آن، اطلاعات نادرست در رسانه‌های اجتماعی منتشر شوند.

فراتر از آن، نگرانی‌های امنیتی نیز وجود دارند. برخی از بانک‌ها از فناوری تشخیص صدا برای تایید هویت تماس‌گیرنده استفاده می‌کنند که در صورت پیشرفت این فناوری، امکان تشخیص واقعی یا جعلی بودن صدا بسیار سخت‌تر خواهد شد. علاوه بر آن، این فناوری ممکن است بر حرفه صداپیشگان نیز تاثیر منفی بگذارد. زیرا اگر صداهای تولید شده توسط هوش مصنوعی به واقعیت نزدیک باشند، ممکن است دیگر به خدمات آنها نیازی نباشد.

هوش مصنوعی VALL-E مایکروسافت یک ابزار چشم‌گیر محسوب می‌شود که از پتانسیل ایجاد انقلابی بزرگ در زمینه سنتز صدا برخوردار است. بااین‌حال، شرکت‌های توسعه‌دهنده لازم است مقرراتی را برای استفاده از این ابزارها ایجاد کنند تا خیال همه راحت باشد که از آنها تنها در راستای اهداف مفید استفاده خواهند شد.

۲۲۷۲۲۷