طور باحثون في جامعة كاليفورنيا في سان فرانسيسكو وجامعة كاليفورنيا في بيركلي واجهة دماغية حاسوبية (BCI) مكنت امرأة مصابة بشلل شديد من سكتة دماغية في جذع الدماغ من التحدث مره أخرى من خلال صورة رمزية رقمية.
هذه هي المرة الأولى التي يتم فيها تصنيع الكلام أو تعبيرات الوجه من إشارات الدماغ، حيث يمكن للنظام أيضا فك تشفير هذه الإشارات إلى نص بمعدل 80 كلمة تقريبا في الدقيقة، وهو تحسن كبير مقارنة بالتكنولوجيا المتاحة تجاريا.
يأمل إدوارد تشانغ، وهو حاصل على دكتوراه في الطب، رئيس جراحة الأعصاب في UCSF، الذي عمل على التكنولوجيا المعروفة باسم واجهة الدماغ الحاسوبية ، أو BCI ، لأكثر من عقد من الزمان، أن يؤدي هذا الاختراق البحثي الأخير، الذي يظهر في 23 أغسطس 2023 ، في Nature، إلى نظام معتمد من إدارة الغذاء والدواء الأمريكية (FDA) يتيح الكلام من إشارات الدماغ في المستقبل القريب.
“هدفنا هو استعادة طريقة كاملة ومجسدة للتواصل، وهي حقا الطريقة الأكثر طبيعية بالنسبة لنا للتحدث مع الآخرين” ، قال تشانغ ، وهو عضو في معهد UCSF Weill لعلم الأعصاب وأستاذ جين روبرتسون المتميز في الطب النفسي. “هذه التطورات تقربنا كثيرا من جعل هذا حلا حقيقيا للمرضى.”
أظهر فريق تشانغ سابقا أنه من الممكن فك تشفير إشارات الدماغ إلى نص في رجل عانى أيضا من سكتة دماغية في جذع الدماغ قبل سنوات عديدة. ولكن في هذه المره توضح الدراسة شيئا أكثر طموحا: فك تشفير إشارات الدماغ إلى ثراء الكلام ، إلى جانب الحركات التي تحرك وجه الشخص أثناء المحادثة.
روبوتات تسبح تحت الماء لتحديد أماكن الأشياء بالواقع المعزز
زرع تشانغ مستطيلا رقيقا من الورق من 253 قطبا كهربائيا على سطح دماغ المرأة فوق مناطق اكتشف فريقه أنها ضرورية للكلام، و اعترضت الأقطاب الكهربائية إشارات الدماغ التي لولا السكتة الدماغية، لكانت قد ذهبت إلى عضلات لسانها وفكها وحنجرتها، وكذلك وجهها.
لأسابيع، عمل الفريق لتدريب خوارزميات الذكاء الاصطناعي للتعرف على إشارات دماغها الفريدة للكلام. وتضمن ذلك تكرار عبارات مختلفة من مفردات محادثة مكونة من 1024 كلمة مرارا وتكرارا ، حتى تعرف الكمبيوتر على أنماط نشاط الدماغ المرتبطة بالأصوات.
وبدلا من تدريب الذكاء الاصطناعي على التعرف على الكلمات الكاملة، أنشأ الباحثون نظاما يفك تشفير الكلمات من الصوتيات. هذه هي الوحدات الفرعية للكلام التي تشكل الكلمات المنطوقة بنفس الطريقة التي تشكل بها الحروف الكلمات المكتوبة. HELLO “مرحبا” ، على سبيل المثال ، يحتوي على أربعة أصوات: “HH” و “AH” و “L” و “OW”.
باستخدام هذا النهج، احتاج الكمبيوتر فقط إلى تعلم 39 صوتا لفك تشفير أي كلمة باللغة الإنجليزية. أدى ذلك إلى تعزيز دقة النظام وجعله أسرع بثلاث مرات.
الدقة والسرعة والمفردات أمر بالغ الأهمية قال شون ميتزجر ، الذي طور وحدة فك ترميز النص مع أليكس سيلفا
لإنشاء الصوت ، ابتكر الفريق خوارزمية لتوليف الكلام، والتي قاموا بتخصيصها لتبدو مثل صوتها قبل الإصابة، باستخدام تسجيل لها وهي تتحدث في حفل زفافها.
قام الفريق بتحريك الصورة الرمزية بمساعدة برنامج يحاكي ويحرك حركات عضلات الوجه، التي طورتها شركة Speech Graphics، وهي شركة تصنع الرسوم المتحركة للوجه التي يحركها الذكاء الاصطناعي. ابتكر الباحثون عمليات تعلم آلي مخصصة سمحت لبرامج الشركة بالتشابك مع الإشارات التي يتم إرسالها من دماغ المرأة أثناء محاولتها التحدث وتحويلها إلى حركات على وجه الصورة الرمزية، مما يجعل الفك مفتوحا ومغلقا، وتبرز الشفاه واللسان يرتفع وينخفض ، وكذلك حركات الوجه من أجل السعادة ، الحزن والمفاجأة.
“نحن نعوض عن الروابط بين الدماغ والمسالك الصوتية التي قطعتها السكتة الدماغية” ، قال كايلو ليتلجون ، طالب دراسات عليا يعمل مع تشانغ وجوبالا أنومانشيبالي ، دكتوراه ، أستاذ الهندسة الكهربائية وعلوم الكمبيوتر في جامعة كاليفورنيا في بيركلي. “عندما استخدم الشخص هذا النظام لأول مرة للتحدث وتحريك وجه الصورة الرمزية جنبا إلى جنب ، كنت أعرف أن هذا سيكون شيئا له تأثير حقيقي.”
تتمثل الخطوة التالية المهمة للفريق في إنشاء إصدار لاسلكي لا يتطلب من المستخدم أن يكون متصلا فعليا ب BCI.
“إن إعطاء الناس القدرة على التحكم بحرية في أجهزة الكمبيوتر والهواتف الخاصة بهم باستخدام هذه التكنولوجيا سيكون له آثار عميقة على استقلالهم وتفاعلاتهم الاجتماعية” ، قال المؤلف المشارك الأول ديفيد موسى ، دكتوراه ، أستاذ مساعد في جراحة الأعصاب.
لأي استفسارات يمكنكم التواصل معنا من خلال الفيسبوك