الذكاء الاصطناعي السيادي: التكنولوجيات المساعدة والقدرات الرقمية الحرجة [AR]

متاح باللغات: EN, FR, DE, ES, PT, IT, NL, AR

هذه الصفحة ترجمة للمقال الأصلي باللغة الإنجليزية. يرجى الملاحظة أن واجهة التنقل متوفرة باللغة الإنجليزية فقط.

تماشياً مع مساهمتنا السابقة في الحوار حول التكنولوجيات المساعدة والصناديق السيادية، واستجابةً لنداء المفوضية الأوروبية بشأن تعزيز مرونة التكنولوجيا والبنية التحتية، ومبادرة يوروستاك وخطة عمل قارة الذكاء الاصطناعي، شاركنا في دعوة مفتوحة تتعلق بنشر القدرات الرقمية الحرجة، في سياق يتسم بتعقيدات جيوسياسية متزايدة وتسارع وتيرة السباق التكنولوجي العالمي. وقد تناولت مساهمتنا مجموعة واسعة من النماذج والأنظمة والمكوّنات عبر سلسلة القيمة، تغطي تطبيقات التكنولوجيات المساعدة القائمة على الذكاء الاصطناعي، والخدمات العامة، والتقنيات البشرية التفاعلية والروبوتات، بما في ذلك النماذج اللغوية الكبيرة والنماذج اللغوية الصغيرة، ونماذج الرؤية-اللغة (VLMs)، والنماذج التأسيسية ثلاثية الأبعاد، والذكاء الاصطناعي المُجسَّد، وأنظمة اللمس والتشغيل، وبيئات المحاكاة، وغيرها.

ينبغي أن تتكامل مساهمتنا مع الأعمال والتبادلات الجارية ضمن المنظومة التقنية والسياساتية الأوسع نطاقاً. ومع تزايد تعقيد التكنولوجيات المساعدة واعتمادها النمطي في قطاعات الرعاية الصحية والتعليم والقطاعات العامة، تطرح تحديات متعددة: التشغيل البيني السلس ضمن البيئات القائمة، والمتطلبات الحاسوبية التي تقيد النشر على الأجهزة محدودة الموارد، والوصول إلى مجموعات بيانات متخصصة لنماذج VLM والنماذج التأسيسية ثلاثية الأبعاد التي تمثل مجموعات سكانية متنوعة، وتكامل خطوط أنابيب الذكاء الاصطناعي المعقدة (الاستشعار ← الاستدلال ← التصرف ← الاختبار ← السلامة) مع الحفاظ على الأداء والدقة في الوقت الفعلي.

ذات صلة

منظمة التعاون الاقتصادي والتنمية: الذكاء الاصطناعي للتكنولوجيا المساعدة والعمل (تقرير ومستودع)

المنتدى الاقتصادي العالمي: التكنولوجيا المساعدة والقدرات والصناديق السيادية

المنتدى الاقتصادي العالمي: إمكانات الذكاء الاصطناعي التوليدي لإمكانية الوصول

منظمة الصحة العالمية: التوجيهات المتعلقة بالنماذج الكبيرة متعددة الوسائط

اللجنة الاستشارية الرئاسية للعلوم والتكنولوجيا: فريق العمل المعني بالذكاء الاصطناعي التوليدي (محدث)

واشنطن، مجلس الوصول وجلسات استماع أخرى: الذكاء الاصطناعي التوليدي وإمكانية الوصول

نماذج الرؤية-اللغة (VLMs) لإمكانية الوصول والإدراك

تُظهر نماذج الرؤية-اللغة مثل PaLI وFlamingo وOpenFlamingo وSegment Anything (SAM) إمكانات واعدة لتطبيقات الفهم البصري والتعليق التوضيحي في الوقت الفعلي التي تساعد المستخدمين المكفوفين والأشخاص المصابين بالتوحد والمستخدمين ذوي الإعاقات المعرفية. تستفيد هذه النماذج من معماريات المحولات مع آليات الانتباه المتقاطع لمعالجة البيانات البصرية والنصية المتداخلة، مما يُمكّن قدرات الاستدلال متعدد الوسائط المتطورة.

يمكن أن يُتيح نشرها سرداً بصرياً فورياً للمشاهد والتعرف على الكائنات باستخدام خطوط أنابيب الاستدلال في الوقت الفعلي التي تحقق أوقات استدلال محسنة مناسبة للتطبيقات في الوقت الفعلي على الأجهزة الطرفية. بالإضافة إلى ذلك، تدعم هذه الأنظمة واجهات المستخدم متعددة الوسائط التي تدمج الإيماءات والصور واللغة المنطوقة من خلال مساحات التضمين الموحدة وآليات الدمج القائمة على الانتباه. علاوة على ذلك، تقدم أدوات الوعي الظرفي في الأماكن العامة والمنزل، بدمج الاستدلال المكاني والفهم السياقي عبر المخططات البيانية الدلالية للمشاهد.

المدخلات:

  • دعم نماذج الرؤية-اللغة المركزة على إمكانية الوصول المدربة على مجموعات بيانات متنوعة ومفتوحة (شاملة للغات محدودة الموارد والبيئات المتنوعة)، مع اهتمام خاص بالضبط الدقيق على مجموعات بيانات التكنولوجيا المساعدة المحتوية على ملاحة الكراسي المتحركة وسيناريوهات ضعف البصر وسياقات إمكانية الوصول المعرفية

  • دعم تطوير واجهات برمجة التطبيقات للأدوات المساعدة القائمة على نماذج الرؤية-اللغة، خاصة تلك التي تُمكّن التأسيس البيئي وفهم النص إلى المشهد والتعليق التوضيحي في الوقت الفعلي مع واجهات REST/GraphQL المعيارية وبروتوكولات البث WebRTC

  • تطوير نماذج الرؤية-اللغة متعددة اللغات للأقليات اللغوية والمجموعات السكانية المحرومة في الاتحاد الأوروبي، بدمج التعلم التحويلي عبر اللغات والتمثيلات البصرية المستقلة عن اللغة

النماذج التأسيسية ثلاثية الأبعاد للاستدلال المكاني والملاحة

تُمكّن النماذج ثلاثية الأبعاد مثل Point-E وShape-E وDreamFusion وHoloAssist الفهم الدلالي للمشاهد ومعالجة الكائنات وإعادة البناء ثلاثي الأبعاد للعالم الحقيقي — وهي قدرات مهمة للموجة القادمة من مساعدات التنقل الذاتي والملاحة التعويضية وواجهات المنزل الذكي. تستخدم هذه النماذج حقول الإشعاع العصبي (NeRFs) وتمثيلات السطوح الضمنية ومعالجة سحابة النقاط لإنشاء فهم ثلاثي الأبعاد مفصل من المدخلات ثنائية الأبعاد.

تُظهر المعمارية التقنية تقدماً ملحوظاً في منهجيات التوليد ثلاثي الأبعاد. تُولّد Point-E سحب النقاط ثلاثية الأبعاد من خلال عملية انتشار ذات مرحلتين تتضمن تحويل النص إلى صورة يتبعه تحويل الصورة إلى ثلاثي الأبعاد، محققة تحسناً في السرعة يبلغ حوالي 600 ضعف مقارنة بالطرق المنافسة. تستخدم DreamFusion أخذ العينات بالتقطير النقطي (SDS) لتحسين تمثيلات NeRF باستخدام السوابق الانتشارية ثنائية الأبعاد، بينما تستخدم Shape-E تمثيلات الدوال الضمنية مع نماذج الانتشار الشرطي لتوليد أصول ثلاثية الأبعاد عالية الدقة. تتكامل هذه الأنظمة مع خوارزميات SLAM (التوطين والخرائط المتزامن) للفهم المكاني في الوقت الفعلي.

المدخلات:

  • إيلاء الأولوية للبحوث في رسم خرائط الإمكانات ثلاثية الأبعاد والتراكبات السياقية والاستدلال المكاني لمساعدة الأشخاص ذوي الإعاقات الجسدية، بدمج تقنيات تركيب التغذية الراجعة اللمسية والعرض اللمسي

  • إنشاء مجموعات بيانات على مستوى الاتحاد الأوروبي تحاكي سيناريوهات المساعدة الواقعية في الأماكن المغلقة والحضرية، مما يُتيح تدريب النماذج ثلاثية الأبعاد الموثوق للنشر في الأطراف الاصطناعية والروبوتات المنزلية وأنظمة التوجيه المكاني بتنسيقات البيانات المعيارية (PLY وOBJ وGLTF) والتعليقات التوضيحية الدلالية

  • تطوير خطوط أنابيب فهم المشاهد ثلاثية الأبعاد التي تجمع بين إعادة البناء الهندسي والتجزئة الدلالية لتحسين معالجة الكائنات ومساعدة الملاحة

النماذج اللغوية الكبيرة (LLMs) والنماذج اللغوية الصغيرة (SLMs) للحوار التكيفي

تقدم النماذج اللغوية الكبيرة مثل GPT-4 وMistral وPhi إلى جانب النماذج اللغوية الصغيرة المدمجة (أقل من 7 مليارات معلمة) قدرات الاستدلال التكيفي، مما يجعلها مناسبة احتمالياً للوكلاء المساعدين ومرافقي الرعاية ودعم الحالات المزمنة التي تخدم مجموعات سكانية متنوعة، بما في ذلك أولئك الذين يعانون من إعاقات في الكلام أو الإدراك. تستفيد هذه النماذج من معماريات المحولات مع آليات الانتباه المحسنة لفهم السياق الطويل والتكيف الشخصي.

تركز استراتيجيات التنفيذ التقني على كفاءة النشر وقدرات التخصيص. تُمكّن تقنيات التكمية بما في ذلك INT8 وINT4 النشر الفعال على الأجهزة محدودة الموارد، بينما يسمح الضبط الدقيق LoRA (التكيف منخفض الرتبة) وQLoRA بالمساعدة الشخصية دون إعادة تدريب النموذج الكامل. تدعم الأنظمة أطوال السياق التي تمتد إلى أكثر من 32 ألف رمز للحفاظ على تاريخ المحادثة وتفضيلات المستخدم، وتتكامل مع أنظمة التعرف التلقائي على الكلام (ASR) وتحويل النص إلى كلام (TTS) للتفاعل متعدد الوسائط.

المدخلات:

  • دعم النماذج اللغوية القادرة على العمل دون اتصال وموفرة الطاقة القابلة للنشر في بيئات الرعاية الصحية الريفية أو منخفضة الاتصال، مع التركيز على تقنيات ضغط النماذج ومناهج التعلم الاتحادي وتحسين الحوسبة الطرفية

  • دعم تطوير أنظمة الحوار التكيفية القادرة على فهم مدخلات المستخدم المجزأة أو المشوشة أو الغامضة — الضرورية لتصميم التفاعل الشامل، بدمج تصحيح الأخطاء القوي وتوضيح النوايا وآليات الإصلاح السياقي

  • تعزيز أدوات الاستدلال المساعدة المخصصة، مما يُمكّن النماذج اللغوية الكبيرة من التكيف مع تفضيلات المستخدم وإشارات الذاكرة والاحتياجات المتطورة بمرور الوقت من خلال التعلم المستمر والمعماريات المعززة بالذاكرة

الذكاء الاصطناعي المُجسَّد وأنظمة اللمس والتشغيل

لسد الفجوة بين الإدراك والعمل، يجب أن يتفاعل الذكاء الاصطناعي مع العالم المادي من خلال أنظمة دمج الحساسات والتحكم المتطورة. هذا أمر بالغ الأهمية للرعاية الروبوتية والأجهزة المساعدة القابلة للارتداء والبيئات المنزلية المستجيبة التي تتطلب التكيف في الوقت الفعلي مع الاحتياجات البشرية والتغيرات البيئية.

تشمل المكونات التقنية قدرات التكامل الحسي الحركي الشاملة. تجمع معماريات دمج الحساسات المتعددة بين كاميرات RGB-D ووحدات IMU وحساسات القوة والمصفوفات اللمسية لتوفير إدراك بيئي غني. تحقق أنظمة التحكم في الوقت الفعلي أوقات استجابة سريعة، مع حلقات التحكم الداخلية التي تعمل بسرعات عالية ودورات النظام الكاملة التي تستجيب ضمن نطاقات منخفضة من الميلي ثانية للتطبيقات الحساسة للسلامة، بينما يدعم التحكم في القوة القائم على التعلم الآلي التفاعل اللطيف بين الإنسان والروبوت. تعمل هذه الأنظمة من خلال معماريات الحوسبة الموزعة التي تُمكّن المعالجة القائمة على الحافة والتنسيق السحابي للأداء والاستجابة الأمثل.

المدخلات:

  • دعم البحث والتطوير لأنظمة التشغيل النمطية وأنظمة اللمس القابلة للارتداء ومعماريات دمج الحساسات التي تجمع بين التغذية الراجعة اللمسية والبصرية والقوة مع بروتوكولات الاتصال المعيارية (ناقل CAN وEtherCAT وROS) وواجهات الأجهزة القابلة للتشغيل البيني

  • دعم تكامل LiDAR والتصوير الحراري وحساسات القوة في المنصات المدمجة فعالة التكلفة (ARM Cortex وNVIDIA Jetson وRaspberry Pi) للروبوتات المساعدة مع مكدسات البرمجيات مفتوحة المصدر

  • تشجيع المشروعات التجريبية للنشر متعددة التخصصات التي تدمج النماذج المعرفية مع الأجهزة المادية لإثبات دعم الحياة اليومية، بما في ذلك بروتوكولات السلامة المعيارية وأطر الاعتماد

بيئات Sim2Real للتدريب والتقييم الآمن

تسمح أجهزة المحاكاة مثل Habitat وIsaac Sim وGazebo بالتدريب الآمن والقابل للتوسع للوكلاء المساعدين في بيئات واقعية قبل النشر في العالم الحقيقي. توفر هذه المنصات محاكاة دقيقة فيزيائياً مع عرض واقعي، مما يُمكّن الاختبار الشامل لأنظمة الذكاء الاصطناعي في سيناريوهات متنوعة ومتحكم فيها.

تشمل قدرات المحاكاة أطر النمذجة والاختبار المتقدمة المصممة لتطوير الذكاء الاصطناعي الشامل. توفر محركات الفيزياء عالية الدقة بما في ذلك PhysX وBullet نمذجة دقيقة لتفاعل الكائنات، بينما يُمكّن العرض الواقعي مع تتبع الأشعة التدريب الفعال لأنظمة الإدراك البصري. تدعم هذه المنصات التوليد الإجرائي للبيئات لتغطية السيناريوهات المتنوعة وتدمج نمذجة السلوك البشري للمحاكاة التفاعلية الواقعية. بالإضافة إلى ذلك، تقدم قدرات اختبار الأجهزة في الحلقة لدعم النقل السلس من المحاكاة إلى الواقع للأنظمة المنشورة.

المدخلات:

  • إنشاء منصات اختبار Sim2Real مفتوحة الوصول على مستوى الاتحاد الأوروبي مُصممة حول حالات الاستخدام المساعدة (مثل كشف السقوط وملاحة المطبخ واستخدام الأطراف الاصطناعية وتوجيه الكراسي المتحركة الذكية) مع واجهات برمجة التطبيقات المعيارية والوصول القائم على السحابة للباحثين والمطورين

  • إنشاء معايير افتراضية مشتركة تعجل تطوير وكلاء الذكاء الاصطناعي الآمن في مجالات الصحة والمنزل والخدمات العامة، بدمج مقاييس التقييم المعيارية وبروتوكولات الاعتماد

  • تطوير تقنيات العشوائية المجالية لتحسين المتانة في العالم الحقيقي وتقليل الفجوة بين المحاكاة والواقع

كشف الإمكانات والإدراك المُجسَّد

تُنمذج مجموعات البيانات مثل Ego4D وBEHAVIOR كيفية استخدام الكائنات وفهمها في السياق، مما يوفر بيانات التدريب لأنظمة الذكاء الاصطناعي التي يجب أن تفهم العلاقات الوظيفية بين البشر والكائنات والبيئات.

تقدم مجموعات البيانات هذه خصائص شاملة لتطوير الذكاء الاصطناعي السياقي. يوفر Ego4D 3670 ساعة من بيانات الفيديو من منظور الشخص الأول مع تعليقات توضيحية زمنية غنية، بينما يشمل BEHAVIOR أكثر من 100 نشاط عبر مشاهد داخلية متعددة مع تغييرات مفصلة في حالة الكائنات. تتكامل مجموعات البيانات بفعالية مع أطر كشف الكائنات بما في ذلك YOLO وR-CNN بالإضافة إلى نماذج التعرف على الأفعال، وتدعم توليد المخططات البيانية الدلالية للمشاهد للفهم السياقي المحسن للتفاعلات بين الإنسان والكائن والبيئة.

المدخلات:

  • تمويل جهود تنظيم مجموعات البيانات التي تلتقط الإمكانات الواقعية للمستخدمين ذوي الإعاقة (مثل مستخدمي الكراسي المتحركة والأفراد ضعاف البصر) مع معايير التعليق التوضيحي الشاملة بما في ذلك خصائص الكائنات وميزات إمكانية الوصول وأنماط الاستخدام

  • تطوير نماذج يمكنها تحديد إمكانات الكائنات الخاصة بالمساعدة — على سبيل المثال، الأدوات القابلة للاستخدام لتنظيف الأسنان بيد واحدة، أو المقابض التي تدعم الانتقال الآمن من السرير، بدمج القيود البيوميكانيكية واعتبارات السلامة

  • إنشاء مهام مرجعية لتقييم فهم الإمكانات في السياقات المساعدة مع المقاييس المعيارية وبروتوكولات التقييم

المعايير والاختبار والحاضنات التنظيمية

يجب أن يكون نشر الذكاء الاصطناعي المساعد آمناً وقابلاً للتشغيل البيني ومتوافقاً أخلاقياً من خلال أطر الاختبار الشاملة والإشراف التنظيمي. سيكون عمل الاتحاد الأوروبي على الحاضنات التنظيمية حاسماً للتنافسية العالمية والثقة العامة مع ضمان معايير السلامة.

يجب أن تشمل متطلبات الإطار التنظيمي أبعاد امتثال متعددة ضرورية للنشر المسؤول. يجب أن تحقق الأنظمة الامتثال لمتطلبات قانون الذكاء الاصطناعي للاتحاد الأوروبي لأنظمة الذكاء الاصطناعي عالية المخاطر وتتكامل مع لوائح الأجهزة الطبية (MDR) للتطبيقات المتعلقة بالصحة. يتطلب امتثال حماية البيانات تحت اللائحة العامة لحماية البيانات (GDPR) اعتباراً خاصاً للبيانات الصحية الحساسة، بينما يجب أن يلبي امتثال معايير إمكانية الوصول متطلبات EN 301 549 وWCAG 2.1 AA. بالإضافة إلى ذلك، تُعتبر أطر الأمن السيبراني القوية ضرورية للأجهزة المساعدة المتصلة لضمان سلامة المستخدم وأمن البيانات طوال دورة حياة النشر.

المدخلات:

  • إطلاق منصات اختبار تنظيمية مخصصة للذكاء الاصطناعي المساعد والمُجسَّد (تماشياً مع قانون الذكاء الاصطناعي للاتحاد الأوروبي والمعايير المنسقة القادمة)، توفر بيئات متحكماً فيها لاختبار الامتثال لمتطلبات السلامة والفعالية والأخلاق

  • تطوير بروتوكولات الاختبار للسلامة والشفافية وتخفيف التحيز المصممة خصيصاً للسياقات المساعدة، بما في ذلك الاختبار العدائي وتقييم الحالات الحدية وتقييم الموثوقية طويلة المدى

  • تشجيع أطر التشغيل البيني عبر منصات البرمجيات والأجهزة المستخدمة في التكنولوجيات المساعدة العامة والشخصية، بإنشاء واجهات برمجة التطبيقات المشتركة وتنسيقات البيانات وبروتوكولات الاتصال لمنع تقييد البائعين وضمان خيار المستخدم

بالإضافة إلى ذلك، هناك حاجة لمراعاة قدرات الطاقة ومتطلبات التشغيل المستدام لأنظمة الذكاء الاصطناعي المساعدة، والتي تتطلب في كثير من الحالات تشغيلاً مستمراً. وفي الوقت نفسه، تستهلك نماذج الذكاء الاصطناعي الحالية طاقة مفرطة للأجهزة التي تعمل بالبطاريات، مما يخلق فجوات بين احتياجات المستخدمين والقدرات التقنية. تبقى طرق التدرج الديناميكي للطاقة التي تتكيف مع تعقيد النموذج بناءً على مستويات البطارية غير مطورة بشكل كافٍ، بينما يجب أن توازن جدولة الاستدلال بين احتياجات الاستجابة الفورية ومتطلبات التشغيل طويل المدى. وبالتالي، يجب أن تعطي البحوث والتطوير الأولوية لأطر الحوسبة المتناسبة مع الطاقة والإدارة التنبؤية للطاقة إلى جانب الأداء والدقة. هذه الاعتبارات المتعلقة بالطاقة مفيدة بشكل خاص للبيئات محدودة الموارد أو تلك التي تتطلب مراقبة ودعماً مستمرين.

الجدول الزمني للتنفيذ ومتطلبات الموارد

نتصور نهجاً للتنفيذ على مراحل على مدار 5-7 سنوات:

  • المرحلة الأولى (السنتان 1-2): إنشاء الأطر التنظيمية وآليات التمويل والبنية التحتية البحثية الأولية

  • المرحلة الثانية (السنتان 3-4): نشر البرامج التجريبية ومنصات الاختبار مع تطوير التكنولوجيات الأساسية

  • المرحلة الثالثة (السنوات 5-7): توسيع نطاق البرامج التجريبية الناجحة وتحقيق النشر الواسع عبر جميع الدول الأعضاء في الاتحاد الأوروبي

التوزيع التقديري للميزانية

  • 40% للبحوث وتطوير تكنولوجيات الذكاء الاصطناعي الأساسية

  • 25% لتطوير البنية التحتية (منصات الاختبار ومجموعات البيانات والمعايير)

  • 20% للبرامج التجريبية والتحقق من صحة العالم الحقيقي

  • 15% لتطوير الإطار التنظيمي وأطر الامتثال

يمكن لهذا النهج أن يحسن موقع الاتحاد الأوروبي في مجال التكنولوجيات العامة والمساعدة

• • •

المراجع

¹ البرلمان الأوروبي ومجلس الاتحاد الأوروبي. "اللائحة (الاتحاد الأوروبي) 2024/1689 بشأن النهج الأوروبي للذكاء الاصطناعي (قانون الذكاء الاصطناعي)." الجريدة الرسمية للاتحاد الأوروبي. 1 أغسطس 2024.

² البرلمان الأوروبي ومجلس الاتحاد الأوروبي. "اللائحة (الاتحاد الأوروبي) 2016/679 بشأن حماية الأشخاص الطبيعيين فيما يتعلق بمعالجة البيانات الشخصية وحرية نقل هذه البيانات (اللائحة العامة لحماية البيانات)." الجريدة الرسمية للاتحاد الأوروبي. 2016.

³ البرلمان الأوروبي ومجلس الاتحاد الأوروبي. "اللائحة (الاتحاد الأوروبي) 2017/745 بشأن الأجهزة الطبية." الجريدة الرسمية للاتحاد الأوروبي. 2017.

⁴ اتحاد الشبكة العنكبوتية العالمية (W3C). "إرشادات إمكانية الوصول لمحتوى الويب (WCAG) 2.1." توصية W3C. 2018.

⁵ المعهد الأوروبي لمعايير الاتصالات (ETSI). "EN 301 549 V3.2.1 (2021-03) متطلبات إمكانية الوصول لمنتجات وخدمات تكنولوجيا المعلومات والاتصالات." معايير ETSI. 2021.

⁶ جمعية مهندسي الكهرباء والإلكترونيات (IEEE). "مؤتمر IEEE للرؤية الحاسوبية والتعرف على الأنماط." وقائع المؤتمر السنوي. 2022.