لتنظيف الصوت في تسجيلات وفيديوهاتك… ميتا تُطلق SAM Audio لعزل الصوت بالذكاء الاصطناعي

امرأة تتحدث عبر الهاتف في شارع مزدحم مع عناصر توضيحية لعزل الضوضاء، في إشارة إلى تقنية تنقية الصوت بالذكاء الاصطناعي.

اعزل أي صوت في تسجيلاتك الصوتية أو فيديوهاتك بالأوامر النصية فقط.

في تطوّر جديد مثير لعالم الذكاء الاصطناعي AI، أعلنت شركة  Meta مؤخرًا عن أداتها الجديدة SAM Audio AI Model، وهو نموذج صوتي متقدّم يمكنه فصل وتحرير أصوات معينة من التسجيلات المعقدة المتشابكة بسهولة غير مسبوقة. تخيل معي أنّه بإمكانك فصل أي صوت من داخل أي تسجيل صوتي أو فيديو وعزله وحفظه كما تريد. هذه التقنية تمثل خطوة كبيرة لأنظمة الذكاء الاصطناعي في فهم الأصوات المختلفة والتمييز بينها، كما يفهم البشر الصوت في الحياة اليومية.

ما هو SAM Audio AI Model باختصار؟

SAM Audio AI Model هو نموذج جديد يعتمد على الذكاء الاصطناعي ينتمي إلى عائلة Segment Anything Model التي اشتهرت بقدرتها على فصل الكائنات في الصور. في نسخته الحالية للتعديل على الصوت، يستطيع النموذج فصل أي صوت داخل تسجيل صوتي أو فيديو، سواء كانت موسيقى، ضوضاء خلفية، أو أصوات بيئية،  اعتمادًا على ما تطلبه أنت بشكل مباشر. كمثال بسيط وعملي، يمكن فصل الضوضاء الموجوة في الخلفية في تسجيلات الصوتية أو فيديوهات بسهولة كبيرة وفعالية عالية.

انضموا إلى قناة موندو Mundo على التيليجرام Telegram

الميزة الأهم في SAM Audio AI Model أنّه لا يحتاج إلى أدوات تحرير تقليدية أو خبرة متقدمة لفصل الأصوات، بل يعتمد النموذج على الأوامر الكتابية التي تمنحها أنت له ليقوم بالعمل نيابةً عنك.

كيف يعمل SAM Audio AI Model؟

الجميل في SAM Audio AI Model هو بساطة وتعدد طريقة الاستخدام وقدرته على التعرّف على ما تريد تحديدًا دون تعقيدات:

  1. العمل بالأوامر النصية (Text Prompts): اكتب ما تريد عزله في تسجيلاتك، مثل “غناء المطرب” أو “ضوضاء مرور”، وسيقوم النموذج بفصل الصوت المطلوب.
  2. العمل بالأوامر البصرية (Visual Prompts): عند وجود فيديو، يمكنك النقر على الشخص أو الكائن الذي يصدر الصوت، ليقوم النموذج بعزل الصوت الخاص به.
  3. العمل بالأوامر الزمنية (Span Prompts): يمكنك تحديد جزء من مقطع الصوت الذي يحتوي على الصوت المستهدف، وسيتعرف النموذج على ما تريد استخراجه بدقة.

هذه الطرق يمكن استخدامها معًا أو كل واحدة لوحدها للحصول على النتائج التي تريدها بسهولة.

اقرأ: موقعك أو تطبيقك الخاص مجانًا في ثوانٍ؟ جوجل تُطلق أداتها Antigravity للبرمجة بالذكاء الاصطناعي

ما أهمية إطلاق SAM Audio AI Model في وقتنا الحالي؟

قبل إطلاق شركة ميتا نموذجها SAM Audio AI Model، كان تحرير الصوت يحتاج إلى برامج متعددة وعمليات معقدة. في أغلب الحالات، باستخدام هذه البرامج أنت بحاجة لعدة أدوات لكل مهمة، أدوات لإزالة الضوضاء، أدوات لعزل الصوت، أدوات لتحرير وتعديل الصوت وغيرها. لكن مع SAM Audio AI Model يمكنك القيام بجميع ما سبق بأمر كتابي واحد ولست بحاجة لأي خبرة في هندسة الصوت.

هذا ما سيفتح المجال أمام المبدعين، الصحفيين، صانعي الفيديوهات، وحتى الباحثين في مجالات مثل علم البيئة والعلوم الاجتماعية.

انظر: يقوم بإنجاز المهام بالنيابة عنك… OpenAI تُطلق متصفحها الجديد Atlas المدمج مع ChatGPT

من يمكنه استخدام SAM Audio وكيف يُستخدم؟

نموذج SAM Audio AI Model متاح للاستخدام المفتوح من قبل أي شخص. وهو أداة مفيدة بشكل خصوصي للعاملين في البودكاست، صانعو المحتوى، الموسيقيون، الباحثون، ولأي شخص مهتم بالأمر.

أعلنت Meta أن نموذج SAM Audio أصبح متاحًا للتجربة عبر Segment Anything Playground، وهي منصة تفاعلية تتيح للمستخدمين اختبار قدرات النموذج مباشرة دون الحاجة إلى تثبيت برامج معقدة أو امتلاك خبرة تقنية مسبقة.

موقع Segment Anything Playground لاستخدام نموذج Meta SAM Audio AI Model

ببساطة، تقوم برفع ملف صوتي أو فيديو يحتوي على أكثر من مصدر صوتي، ثم تخبر النموذج بما تريد عزله أو تعديله. الذكاء الاصطناعي يتولى الباقي، ويفصل الصوت المطلوب بدقة لافتة خلال ثوانٍ.

والأهم هنا أن Meta أتاحت النموذج أيضًا كمشروع مفتوح المصدر (Open Source)، ما يعني أن المطورين وصناع الأدوات يمكنهم دمجه داخل تطبيقاتهم أو برامج التحرير الصوتي الخاصة بهم، سواء لأغراض إبداعية أو بحثية.

مثال بسيط على طريقة الاستخدام SAM Audio AI Model

تخيّل أنك صانع محتوى ولديك فيديو يحتوي على: حديث شخص، موسيقى خلفية، ضوضاء شارع، وتريد الاحتفاظ بصوت الشخص فقط. كل ما عليك فعله هو:

  • رفع الفيديو أو الملف الصوتي إلى منصة SAM Audio
  • كتابة طلب بسيط مثل: “اعزل صوت المتحدث فقط”
  • خلال لحظات، سيقوم النموذج بفصل صوت الشخص وإزالة الموسيقى والضوضاء المحيطة

يمكنك بعدها: حفظ الصوت الناتج، استخدامه في فيديو جديد، أو تحسينه أكثر داخل أي برنامج تحرير آخر.

نفس الفكرة تنطبق على الموسيقى، المؤثرات الصوتية، أو حتى أصوات الطبيعة. أنت فقط تحدد ما تريد، و SAM Audio AI Model يقوم بالعمل عنك.

اقرأ: تعلم واحصل على شهادات مجانًا.. جوجل تُطلق منصتها الجديدة Google Skills لتعلم AI والمهارات الرقمية

هل يوجد أي حدود لهذا النموذج؟

رغم دقته وقوّته، بعض المراجعات التقنية تشير إلى أن SAM Audio AI Model قد لا يكون مثاليًا في جميع الحالات، خاصة عندما يتعلق الأمر بعزل مصادر صوتية متشابكة جدًا أو حاجات تحرير معقدة قد تحتاج أدوات متخصّصة أخرى. ومع ذلك، فإن التقدّم هنا هو قفزة كبيرة في تبسيط المهام التي كانت تتطلب سابقًا برامج معقدة أو خبراء صوتيين.

بالنتيجة، SAM Audio AI Model ليس مجرد أداة تحرير صوت جديدة، بل نموذج ذكاء اصطناعي يغيّر قواعد اللعبة في فهم وتحرير الصوت. بفضل إمكانياته في العزل الدقيق باستخدام أوامر بسيطة وواضحة، أصبح بإمكان أي شخص التعامل مع الصوت على مستوى احترافي، دون أن يكون خبيرًا في الصوتيات.

بعض المصادر:

Meta AI. Introducing SAM Audio: The First Unified Multimodal Model for Audio Separation

عن الكاتب