اخبار التكنولوجيا

تعرف علي ميزة الترجمة الصوتية باستخدام الذكاء الاصطناعي

كيف يتم ترجمه الصوتيه باستخدام الذكاء الاصطناعي

أطلقت شركة ميتا ميزة جديدة وحديثه على تطبيق الفيس بوك وايضا تطبيق انستجرام و يمكنك من خلال ترجمة صوتك تلقائيا ودبلجته في الريال إلى اي لغة أخرى مع مزامنة حركة الشفاه ومعالجة نبرة الصوت بحيث يبدو ان الصوت المترجم يكون قريبًا جدًا من خامة صوتك الأصلية في المرحلة الأولى ترتكز هذه الميزة على الترجمة بين اللغه الإنجليزية وايضا اللغه الإسبانية مع وعد بالتوسع إلى لغات أخرى كثيرة  وذلك يكون قريبًا وهي متاحة عالميا لجميع مستخدمي تطبيق فيسبوك و إنستجرام مع تدرج في الإتاحة الكامله للحسابات العامة وجميع صناع المحتوى

تعرف علي ميزة الترجمة الصوتية باستخدام الذكاء الاصطناعي

من خلال لقطة من المشهد الأكبر في شركة ميتا وإطلاق الترجمة الصوتية، جزء من دفع أوسع نحو أدوات الذكاء الاصطناعي داخل منظومة ميتا من المساعدات الصوتية إلى ميزات الترجمة الحية وحتى النظارات الذكية، هذا المسار واضح منذ إعلانات وتوسيع قدرات البث اللحظي الخاص ب Seamless Streaming، وكذلك ربط الذكاء الاصطناعي بتجارب الأجهزة القابلة للارتداء والترجمة الحية.

لماذا هذه الميزة مهمة الآن؟

تكبير الجمهور

لو محتواك عربي أو إنجليزي مثلا، تقدر توصله تلقائيا لكل المتابعين لغتهم المفضلة المختلفة، حيث ان التطبيق يعرض النسخة المترجمة للمستخدم على حسب إعدادات اللغة لديه، ومع وسم واضح بأن الريل «تمت ترجمته بواسطة Meta AI، وهذا يفتح أبواب وصول طبيعيه ل Organic Reach، و بدون مجهود مضاعف في التسجيل والتحرير.

أصالة التجربة

بدل صوت آلي غريب، الأداة تستنسخ نبرة صوتك و تحاكي المخارج والحركة عبر Lip-Sync، في تجنب المشاهدون الانفصال السمعي والبصري المعتاد في الدبلجة التقليدية.

إمكانية الوصول

إلى جانب التوسع اللغوي، هذه الخطوة الهامه قد تساعد في إتاحة المحتوى لمن لا يجيدون لغة المصدر، وتكمل جهود هذه المنصة في التسميات التوضيحية والشرح الآلي.

كيف تفعل الترجمة الصوتية على الريال؟

كل هذه الخطوات عمليًا بأنها تكون متشابهة على تطبيق فيس بوك، و ايضا إنستجرام مع فروق طفيفة في الواجهة، و اصنع الريل كعادتك صور أو ارفع الفيديو و أضف الصوت الأصلي الموجود في شاشة الإعدادات قبل النشر، و فعِّل خيار  ال“Translate voices with Meta AI” أو “Translate your voice with Meta AI”، وايضا اختر لغة الهدف ،حاليًا انجليزي، اسباني، مع توسع مرتقبة، جرب المعاينة بإمكانك تشغيل نسخة تكون مترجمة لمراجعة النطق و مزامنة الشفاه وبعد ذلك انشر سيظهر الريل لكل للمشاهدين، بلغتهم المفضلة تلقائيا مع وسم يوضح استخدام الذكاء الاصطناعي، ويمكنك إلغاء الترجمة لاحقًا أو إيقافها لكل فيديو.

كيف يمكنك تفعيل هذا الخيار تقنيًا من غير تعقيد

عند تفعيل الخيار، يحلل النظام الصوت الأصلي ASR، ثم يترجمها إلى لغة الهدف MT، وبعدها ينشئ ملفا صوتيا جديدا TTS يقلد نبرة صوتك قدر الإمكان، في المستوى البصري، يطبق النظام مزامنة شفاه لتقليل عدم التطابق بين حركة الفم والصوت الجديد، وهذه السلسلة مبنية على نماذج Seamless التي تعالج الكلام والنص عبر قنوات متعددة و بزمن قريب من الحقيقي.

لمن هذه الميزة بالأساس

هذه الميزه تكون للمدوّنون وصناع المحتوى، دبج متابعين جدد بدون تسجيل نسخة ثانية العلامات التجارية حملة واحدة تصبح متعددة اللغات، أسرع وأوفر كلفة المؤسسات التعليمية شروحات قصيرة بلغة المعلم تعرض تلقائيا بلغة الطالب المبدعون المستقلون الموسيقيون، و كل من يعتمد على مقاطع الريلز يلزم للوصول السريع.

حالات الاستخدام الذكية

من بعض مقاطع حالات الاستخدام الذكيه مثل كيف تفعل ذلك ووصف خطوات سريعة بالعربية، وترجمتها فورا للإنجليزية للوصول الدولي الإعلانات و التعريف بالمنتج وهو نسخة واحدة، تخدم تلقائيا بلغات الجمهور المستهدف الفعاليات مقتطفات من مؤتمر ندوة بلغة المتحدث تعرض ترجمة فورا، ل السفر والسياحة او اي مرشد سياحي يصنع ريلز محلي و يشاهد عالميا.

من أفضل الممارسات لضمان نتيجة نظيفة

  • اهتم بنقاء الصوت الأصلي كلما كان التسجيل واضحاً من قصير الجمل، كلما خرجت الترجمة أدق واسهل.
  • تحدث بوتيرة متزنة، تجنب الجمل المتداخلة والكلمات المقطوعة.
  • قلّل الضوضاء والمؤثرات في الخلفية أثناء الكلام.
  • راجع المعاينه، إن لاحظت خطأ اصطلاحيًا، غير صياغة الجملة في النسخة الأصلية و أعد التجريب.

احترس من المصطلحات الخاصة

أعطى تعريف يكون سريعًا داخل الفيديو، وذلك لتحسين المعنى في النسخة المترجمة، بحيث يمكن تضيف نصا داعمًا على الشاشة Captions  ملصقات للمقاطع التقنية، و تختبر أداء كل لغة عبر تحليلات الجمهور حسب اللغه حين تتاح لديك، يفيدك في التخطيط للمحتوى لاحقًا.

حدود الميزة الآن

نطاق اللغات حاليًا في البداية مع اللغه الإنجليزية واللغه الإسبانية، ومع تأكيد رسمي بالتوسع إلى بعض اللغات التي تكون أكثر قريبًا، إن كنت تستهدف العربية مثلا، راقب تحديثات الإتاحة وهي تكون كالاتي:

المحتوى السريع جدًا

الكلام المتلاحق أو الذي يكون بالغه العامية الثقيلة، قد يُربك النظام يكون خفيف السرعة واوضح ايضا في النطق.

التلاعب الصوتي

رغم أن الاستنساخ يحافظ على نبرة الصوت، قد لا يكون هناك تطابق مع الشخصية في الملف الصوتي، وذلك يكون بنسبة 100% في كل الأحوال.

التزامن البصري

التزامن البصري Lip-sync ممتاز لكنه ليس مثاليا جدا، في كل الإضاءات أو كل الزوايا الخاصه ب الفم.

اعتبارات الخصوصية والأمان

تشير شركة ميتا إلى وسم واضح يظهر أن الفيديو يكون مترجم بالذكاء الاصطناعي، مع تحكم للمشاهدين كي يختاروا رؤية الترجمات بلغات تكون محددة جدا بالنسبة للمُنشئ، وذلك لكي يكون لديك تحكم تام ب التفعيل اوا لتعطيل قبل النشر ومعاينة مسبقة هذه الشفافية مهمة لتجربة موثوقة وتجنب الالتباس وهو يكون قاعدة عامة، تجنب استخدام أصوات أشخاص آخرين دون إذن منهم، والتزم بسياسات حقوق النشر والمجتمع.

كيف يعرض الريل المترجم للمشاهد؟

عند نشر المقطع، تعرض للمشاهد الي نسخة الصوت بلغته المفضلة وفق إعدادات الحساب الي اي لغه بحيث يظهر وسم بأن المحتوى «AI-Translated by Meta»، و هذه الآلية تراعي تجربة المستخدم وتزيل الحاجة لرفع عدة نسخ لنفس الفيديو.

مقارنة مع كل حلول الترجمة التقليدية

هنام مقارنه هامه بين كل الحلول الخاصه بالترجمه التقليديه،ه مثل السرعه و الاتساق السمعي والبصري و التكلفه والقيود تعرف علي كل هذا وهو يكون كالاتي:

السرعة

بدل أن تقوم ب تسجيل استوديو، او مونتاج وايضا مكساج، او ان تقوم بأنك تنشئ نسخة مترجمة بعض في دقائق معدوده، وتسهل عليك السرعه بشكل كبير جدا.

الاتساق السمعي والبصري

من بعض الحلول للترجمه التقليديه انه بفضل الاستنساخ و مزامنة الشفاه، وكل هذا قد بعمل علي تقليل الشعور بالانفصال.

التكلفة

التكلفه للترجمه التقليدية تكون مجانية وقت الإطلاق، لجميع صناع المحتوى على المنصّتين، حيث انها تكون ميزة تنافسية مقارنة بخدمات دبلجة مدفوعة.

القيود

نطاق لغات محدود مبدئيا، وقد تحتاج أحيانًا لبعض التعديلات اليدوية وهي تكون لكل المصطلحات الدقيقة.

خارطة طريق متوقعة

توسيع اللغات تدريجيًا مع احتمال إضافة لغات كبرى مثل الفرنسية، واللغة الألمانية، وايضا البرتغالية، وربما تكون اللغه العربية، ومنصات الأخبار التقنية والتواصل وهذا صنف الإطلاق كبداية واضحة جدا، وتكامل أوسع مع أدوات ميتا الأخرى في التحكم أدق اللغات التي تكون مستهدفة، وهناك تقارير تفصيلية حسب اللغة، وربما ربط مع الإعلانات أو بعض المجموعات المتشابهة الاهتمامات، وهناك ايضا استدلال منطقي مبني على نمط طرح المزايا وليس انه إعلان رسميًا بعينه.



هل كان المحتوى مفيداً؟

نعم
لا
شكرا لك

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى