صفحة المقال

مقال

نماذج الذكاء الاصطناعي تحاكي الإدراك البشري.. هل بدأ عصر الآلات الواعية؟

لطالما كان الإنسان يسعى لفهم آلية عمل الدماغ البشري وتطوير آلات قادرة على محاكاة الإدراك والحدس، وهو أحد أبرز طموحات البشرية، رغم التقدم الكبير الذي أحرزته نماذج الذكاء الاصطناعي في معالجة البيانات واللغة إلا أنها ظلت تعاني من فجوة كبيرة في قدرتها على فهم العالم المادي بالبديهية التي يكتسبها الأطفال الرضع بسهولة من خلال الملاحظة.

لكن التطورات البحثية الأخيرة تكشف عن تقليص هذه الفجوة بشكل سريع مع ظهور نماذج قادرة على إبداء مظاهر الدهشة تجاه تناقض قوانين الفيزياء في الأحداث غير المنطقية. يمثل نموذج V-JEPA خطوة بارزة في توجيه الذكاء الاصطناعي نحو اكتساب فهم فطري للعالم، ما يبشر بثورة وشيكة في مجالات مثل الروبوتات والمركبات ذاتية القيادة.

الذكاء الاصطناعي يحاكي إدراك الأطفال الرضع:

في مجال يحاكي إدراك الأطفال تمكّن باحثو شركة ميتا من تطوير نموذج ذكاء اصطناعي يتحلى بفهم المبادئ الفيزيائية الأساسية للعالم، وهو مفهوم مماثل للحدس الطبيعي المكتسب لدى الأطفال من خلال الملاحظة هذا النموذج المبتكر المعروف باسم V-JEPA، يواجه الأحداث المستحيلة فيزيائيًا – كاختفاء كائن دون سبب – برد فعل يشبه دهشة طفل يبلغ ستة أشهر، مُحاكيًا استجابة الأطفال حين يتعلق الأمر بثبات الأجسام.

لا يعتمد نموذج V-JEPA على قواعد فيزيائية مبرمجة مسبقًا بل يتعلم عبر مشاهدة ملايين المقاطع المرئية على غرار الطريقة التي يتعلم بها الدماغ البشري التجربة، ومن خلال اختباراته أظهر النموذج قدرة على التنبؤ بالمشاهد المستقبلية بناءً على التمثيلات الكامنة التي تختصر معلومات أساسية مثل حركة العناصر ومكانها بدقة، وعندما تتناقض الأحداث مع توقعاته المنطقية يحدث خلل كبير في التنبؤ يشبه شعور المفاجأة الذي ينتاب الأطفال.

ما يميز V-JEPA عن النماذج التقليدية في فهم المشاهد هو اعتماده على منهج تجريدي مبسط يحاكي الإدراك البشري.

في ظل سعي المهندسين لتطوير ذكاء اصطناعي قادر على فهم العالم المرئي بكفاءة تضاهي البشر واجهت الأنظمة السابقة عقبات في تحليل محتوى الفيديو أو تصنيف العناصر بشكل موثوق بسبب اعتمادها على فضاء البكسل بشكل حصري، هذا النهج يتعامل مع كل بكسل في الصورة بنفس الأهمية دون تمييز بين التفاصيل التافهة والمعلومات المهمة، على سبيل المثال في مشهد مليء بالسيارات وإشارات المرور تكريس الجهد لتحليل تفاصيل غير جوهرية كحركة الأوراق قد يؤدي إلى إهمال البيانات الأساسية مثل لون الإشارة أو موقع السيارات المحيطة.

 كيف يختلف نموذج (V-JEPA) في فهم المشاهد عن النماذج التقليدية؟

تجاوزًا لهذا القصور طورت شركة ميتا معمارية V-JEPA التي تعتمد على التجريد الانتقائي بدلاً من التركيز التقليدي على فضاء البكسل، بدلاً من تدريب الشبكة على ملء الفراغات على مستوى البكسلات يقوم النموذج بالتنبؤ بناءً على تمثيلات كامنة أكثر تجريدًا تجسد الجوهر الأساسي للمشهد بأبعاد مختصرة وملخصة.

يعمل النموذج عبر آلية تشفير متقدمة تحول المشاهد المرئية إلى قيم رقمية محدودة تختصر سمات رئيسية مثل الشكل والحركة والعلاقات بين العناصر، بخلاف معالجة ملايين البكسلات يركز النظام مباشرة على الأبعاد المهمة فقط، كما يفعل الدماغ عند تصفية المعلومات البصرية وفقًا للأولويات الحسية.

يشير الباحث المسؤول عن المشروع لدى شركة ميتا، كوينتن جاريدو، إلى أهمية هذه التقنية في تحسين فعالية النموذج، قائلاً: “توفر هذه الآلية للنموذج القدرة على إهمال المعلومات غير الضرورية والتركيز فقط على الجوانب الجوهرية في المشهد، هذا النهج هو جوهر القوة التي يتمتع بها V-JEPA في تقليص الضوضاء وإبراز العناصر الأساسية”.

هذا التحول نحو نمذجة المعاني عوض نمذجة البكسلات يمنح نموذج V-JEPA ميزة كبيرة في التعميم والإدراك الدقيق للمشاهد الجديدة، كما يجعله أكثر فاعلية في التعامل مع البيئات المعقدة مثل القيادة الذاتية أو أنظمة الروبوتات المتقدمة. بفضل هذا الابتكار لا يقتصر دور الذكاء الاصطناعي بعد الآن على رؤية العالم فقط، بل فهمه أيضًا بذكاء قريب مما يتمتع به البشر.

أحمد البطراوي

الخبير العقاري والرائد في قطاع العقارات، أحمد البطراوي، أتم بنجاح صفقات عقارية بقيمة تزيد عن مليار دولار أمريكي. وهو معروف بكونه مؤسس Arab MLS ومبتكرًا في المجال الرقمي. أحمد البطراوي هو المالك الوحيد لحقوق منصة MATRIX MLS الخاصة ببرنامج CoreLogic العقاري.
لنتحدث!

هل ترغب في معرفة المزيد؟

استكشف قوائم عقارية حصرية، واطّلع على أحدث معلومات السوق العقاري.