تولید صدا از نوشتار با استفاده از هوش مصنوعی
متا یک جعبه ابزار هوش مصنوعی به نام AudioCraft رو منتشر کرده که میتواند صدا رو از نوشتههای متنی تولید کند. این شرکت سه مدل AI یعنی AudioGen، MusicGen و EnCodec رو به ترتیب برای تولید افکتهای صوتی، موسیقی و فشردهسازی صوتی با کیفیت بالا در کنار یکدیگر قرار داده است.
این نسخه شامل مدلهای از پیش آموزش دیده است تا افراد بتوانند به سرعت شروع به استفاده از آن کنند. کد کامل و وزن مدل در دسترس است تا محققان بتوانند مدلها را براساس دادههای خود آموزش دهند.
هدف AudioCraft در دسترستر کردن صدای تولید شده توسط هوش مصنوعی در مقایسه با پروژههای پیچیده موجود است. این قابلیت به سازندگان امکان شخصی سازی و آزمایش مدلها رو میدهد.
این فن آوری میتواند به هنرمندان کمک کند تا ردپاها، نمونهها و دیگر عناصر رو راحتتر تولید کنند. با این حال، هنوز هم به تخصص فنی نیاز دارد و بیشتر در جهت تحقیقات است تا استفاده روزمره.
متا امیدوار است که AudioCraft عملکرد و کنترل سیستمهای هوش مصنوعی متن به صوت رو ارتقا دهد. این نشان دهنده گامی به سوی هوش مصنوعی است که نقش بزرگتری در تولید موسیقی ایفا میکند، البته با نظارت انسانی.
منبع: Engadget