به نظر می رسد هوش مصنوعی در حال ورود به عصر جدیدی در زمینه تولید محتوای صوتی است. ElevenLabs صدای انسان و موسیقی تولید شده توسط هوش مصنوعی را ارائه می دهد. اکنون این هوش مصنوعی به کاربران اجازه می دهد تا جلوه های صوتی برای پادکست ها، فیلم ها یا بازی ها نیز ایجاد کنند.
به گفته TheVerge، این ابزار جدید می تواند تا 22 ثانیه صدا بر اساس درخواست کاربران ایجاد کند که می تواند با پلتفرم های صوتی و موسیقی سایر شرکت ها ادغام شود. همچنین پس از انجام کار، این سرویس حداقل چهار نوع فایل صوتی قابل دانلود را در اختیار کاربران قرار می دهد.
ElevenLabs اعلام کرد که با Shutterstock برای ساخت یک پایگاه داده و آموزش این مدل هوش مصنوعی کار کرده است. Shutterstock قبلاً به چندین شرکت هوش مصنوعی از جمله Meta، OpenAI و Google مجوز پایگاه داده محتوای خود را داده است.
استفاده از جلوه های صوتی سرویس هوش مصنوعی ElevenLabs رایگان است، اما کاربران اشتراک می توانند از کلیپ های صوتی تولید شده با مجوزهای تجاری استفاده کنند. در حالی که کاربران رایگان باید “elevenlabs.io” را در عنوان محتوای خود قرار دهند. علاوه بر این، این کاربران هنگام نوشتن ادعاها دارای محدودیت کاراکتر هستند و مجاز به استفاده از 10000 کاراکتر در ماه هستند.
خدمات مختلفی در بازار برای ارائه جلوه های صوتی به فیلمسازان و بازی سازان وجود دارد، اما گاهی اوقات این سرویس ها گران هستند یا در پخش صدا با مشکل مواجه می شوند.
ElevenLabs در وبسایت خود میگوید که مدل هوش مصنوعی را برای «تولید صدای غنی و همهجانبه سریع، مقرونبهصرفه و در مقیاس بزرگ» طراحی کرده است.
سایر توسعه دهندگان هوش مصنوعی نیز در حال توسعه چنین سرویسی هستند. سال گذشته، Stability AI سرویس Stable Audio خود را منتشر کرد که جلوه های صوتی ایجاد می کند. مدل های AudioCraft متا همچنین صداهای پس زمینه طبیعی مانند باد یا ترافیک تولید می کنند.
اتاق خبر سیلور شاپ
منبع: https://digiato.com/artificial-intelligence/elevenlabs-has-unveiled-its-synthetic-voice-production-service