أعلنت شركة Stability AI، الناشطة في مجال الذكاء الاصطناعي، إطلاق نموذج جديد مفتوح المصدر لتوليد الأصوات.
وأكدت الشركة في بيانها الرسمي أن النموذج دُرّب على تسجيلات خالية من حقوق الملكية، مشيرة إلى الاعتماد على نحو 486 ألف عينة من مكتبات الأصوات المفتوحة المصدر مثل FreeSound و Free Music Archive.
ويحمل النموذج اسم Stable Audio Open، وهو يعمل على تحويل المطالبات النصية إلى تسجيلات صوتية يصل طولها إلى 47 ثانية.
وتقول Stability AI إن النموذج يمكن استخدامه لإنشاء الأصوات من أجل الأغراض المختلفة، ومنها الأفلام والبرامج التي تُبث عبر التلفاز.
وأضافت الشركة أن إحدى الفوائد الرئيسية لهذا الإصدار المفتوح المصدر هي أن المستخدمين يمكنهم تحسين النموذج باستخدام بياناتهم الصوتية المخصصة. على سبيل المثال، يمكن للمستخدم تحسين النموذج اعتمادًا على عينات من تسجيلاته الخاصة لتوليد أصوات جديدة منها.
وتوصي الشركة المستخدمين الذين يبحثون عن قدرات أكبر لإنتاج الأصوات بالذكاء الاصطناعي باستخدام خدمة Stable Audio المميزة التي توفرها.
ولا يمكن استخدام نموذج Stable Audio Open لأغراض تجارية، وفقًا لما هو منصوص عليه في شروط الخدمة الخاصة بالنموذج، كما أنه لا يعمل بالكفاءة نفسها مع المطالبات النصية المكتوبة بلغة غير اللغة الإنجليزية، أو عند توليد مقاطع صوتية لا علاقة لها ببيانات التدريب.
وواجهت شركة Stability AI تحديات في الآونة الأخيرة في تطوير منتجاتها، وخاصةً بعد استقالة نائب رئيس الصوت التوليدي، إد نيوتن ريكس، بسبب زعمه أن الشركة تدرب نماذج الذكاء الاصطناعي التوليدي على الأعمال المحمية بحقوق الطبع والنشر.
وتسعى الشركة من خلال هذا النموذج الجديد إلى الدفاع عن نفسها ضد الاتهامات الموجهة إليها في هذا الشأن، كما تهدف إلى الترويج لخدماتها المتقدمة لإنتاج الأصوات بالذكاء الاصطناعي.
ومن الجدير بالذكر أن شركة سوني كانت قد أرسلت خطابًا في مايو الماضي إلى مئات الشركات العاملة في مجال الذكاء الاصطناعي التوليدي تحذرهم من “الاستخدام غير المصرح به” لمحتواها لتدريب مولّدات الصوت.