سجل بريدك لتكن أول من يعلم عن تحديثاتنا!
Peter Chen
ليس سرًا أن نماذج الأساس قد عَمَّقَت التحول في مجال الذكاء الاصطناعي في العالم الرقمي. إذ ساعدت النماذج اللغوية طويلة المدى (LLMs) مثل “ChatGPT”، وLLaMA، و”بارد”، على ثورة مجال الذكاء الاصطناعي للغة. بالرغم من أن نماذج جي بي تي الخاصة بـOpen AI ليست النماذج الوحيدة طويلة المدى، فإنها تمكنت من الحصول على أكبر قدر من التعريف الجماهيري لأخذ المدخلات النصية والصورية وتقديم استجابات تشبه الإنسان، وحتى مع بعض المهام التي تتطلب حل مشاكل معقدة وتفكيرًا متقدمًا.
انتشار “ChatGPT” الفيروسي واسع النطاق شكل بالفعل كيفية فهم المجتمع لهذه اللحظة الجديدة للذكاء الاصطناعي. التقدم التالي الذي سيحدد الذكاء الاصطناعي لأجيال قادمة هو علوم الروبوتات. إذ سيتم بناء روبوتات مزودة بالذكاء الاصطناعي وقادرة على تعلم كيفية التفاعل مع العالم المادي، مما سيحسن جميع أشكال العمل المتكرر في قطاعات تتراوح من اللوجستيات والنقل والتصنيع، إلى التجزئة والزراعة، وحتى الرعاية الصحية. كما أنه سيفتح الكثير من الكفاءات في العالم المادي كما شهدناها في العالم الرقمي خلال العقود القليلة الماضية.
على الرغم من وجود مجموعة فريدة من المشاكل لحلها في مجال الروبوتات مقارنة باللغة، فإن هناك تشابهات في المفاهيم الأساسية. وقد أحرز بعض أبرز عقول الذكاء الاصطناعي تقدمًا ملموسًا في بناء “GPT للروبوتات”.
ما الذي يمكّن نجاح “GPT”؟
لفهم كيفية بناء “GPT للروبوتات”، يجب النظر أولاً إلى الأركان الأساسية التي مكّنت نجاح النماذج اللغوية طويلة المدى مثل “GPT “. تم تدريب “GPT” على مجموعة بيانات واسعة ومتنوعة. كان المهندسون في السابق يجمعون البيانات ويدربون الذكاء الاصطناعي المحدد على مشكلة معينة. ثم كان يحتاجون إلى جمع بيانات جديدة لحل مشكلة أخرى. مشكلة أخرى، وبيانات جديدة مرة أخرى!.. الآن، مع نهج النموذج الأساسي، فإن العكس تمامًا هو ما يحدث.
بدلاً من بناء ذكاء اصطناعي متخصص لكل حالة استخدام، يمكن استخدام واحد عمومي. وهذا النموذج العام بشكل أكبر يحقق النجاح من كل النماذج المتخصصة. الذكاء الاصطناعي في النموذج الأساسي يؤدي بشكل أفضل مهمة معينة. يمكنه الاستفادة من الدروس المستفادة من مهام أخرى وتعميمها على مهام جديدة بسبب تعلمه مهارات إضافية من خلال أدائه بشكل جيد عبر مجموعة متنوعة من المهام.
للحصول على ذكاء اصطناعي عام، يجب أولاً الحصول على كمية هائلة من البيانات المتنوعة. حصلت “OpenAI” على البيانات الحقيقية اللازمة لتدريب نماذج “جي بي تي” بكفاءة معقولة. قام جي بي تي بالتدرب على بيانات تم جمعها من كامل الإنترنت بمجموعة بيانات كبيرة ومتنوعة تشمل الكتب والمقالات الإخبارية ومنشورات وسائل التواصل الاجتماعي والكود وغيرها. ليس حجم المجموعة فحسب ما يهم، بل جمع البيانات ذات الجودة العالية وذات القيمة الهامة يلعب دورًا هائلاً أيضًا. حققت نماذج “GPT” أداء غير مسبوق؛ لأن مجموعات بياناتها ذات الجودة العالية تأتي من المهام التي يهتم بها المستخدمون بشكل رئيسي وأفضل الإجابات المفيدة.
تستخدم “OpenAI” تعلم التعزيز بالتغذية الراجعة البشرية RLHF لتوافق استجابة النموذج مع التفضيلات البشرية “مثل ما يعتبر مفيدًا للمستخدم”. تحتاج إلى أكثر من التعلم الموجه البحت فقط SL؛ لأن SL يمكنه فقط الاقتراب من مشكلة بنمط أو مجموعة واضحة من الأمثلة. تتطلب النماذج اللغوية طويلة المدى من الذكاء الاصطناعي تحقيق هدف دون وجود إجابة صحيحة فريدة وواضحة. وهنا تأتي أهمية RLHF.
تتيح RLHF للخوارزمية التحرك نحو الهدف عبر المحاولة والخطأ، حيث يقوم الإنسان بالإقرار بالإجابات الصحيحة “مكافأة عالية”، أو رفض الخاطئة منها “مكافأة منخفضة”. يقوم الذكاء الاصطناعي بإيجاد دالة المكافأة التي تفسر على أفضل وجه تفضيلات البشر ثم تستخدم RL لتعلم كيفية الوصول إليها. يمكن لـ”تشات جي بي تي” تقديم استجابات تعكس أو تتجاوز القدرات البشرية من خلال التعلم من التغذية الراجعة البشرية.
الأفق التالي للنماذج الأساسية هو في مجال الروبوتات
تلك نفس التقنية الأساسية التي تتيح لـ”GPT” أن ترى وتفكر وحتى تتكلم، هي التي تمكّن الآلات أيضًا من أن ترى وتفكر وتتصرّف. الروبوتات المدعومة بنموذج أساسي يمكنها فهم محيطها المادي، واتخاذ قرارات مستنيرة، وتعديل تصرفاتها وفقًا للتغيرات المحيطة.
يتم بناء “GPT للروبوتات” بنفس الطريقة التي بُني بها “GPT”، مما يضع أسسًا لثورة ستعيد تعريف الذكاء الاصطناعي مرة أخرى كما نعرفه.
من خلال اعتماد منهجية النموذج الأساسي، يمكنك أيضًا بناء ذكاء اصطناعي واحد يعمل عبر مهام متعددة في العالم المادي. منذ بضع سنوات، أوصى الخبراء بصنع ذكاء اصطناعي متخصص للروبوتات المعنية باختيار وتعبئة مواد غذائية. وهي تختلف عن النموذج القادر على فرز مختلف الأجزاء الكهربائية، الذي بدوره يختلف عن النموذج المسؤول عن تفريغ قوائم الشاحنات.
يمكّن هذا التحول النموذجي إلى النموذج الأساسي الذكاء الاصطناعي من الاستجابة بشكل أفضل لسيناريوهات الحالة المتطورة التي توجد غالبًا في بيئات العالم الحقيقي غير المنظمة والتي قد تعوق النماذج ذات التدريب الأضيق .ويعد بناء ذكاء اصطناعي واحد معمم لجميع هذه السيناريوهات أكثر نجاحًا .ومن خلال التدريب على كل شيء تحصل على الاستقلالية على المستوى البشري التي افتقدناها في الأجيال السابقة من الروبوتات.
يعتبر تعليم الروبوتات تمييز الإجراءات التي تؤدي إلى النجاح عن تلك التي تؤدي إلى الفشل، أمرًا صعبًا للغاية. ويتطلب ذلك بيانات واسعة ذات جودة عالية تعتمد على التفاعلات الفيزيائية في العالم الحقيقي. لا تعتبر البيئات المعملية المنعزلة أو الأمثلة الفيديوية مصادر موثوقة بها أو قوية بما فيه الكفاية “على سبيل المثال، فشلت مقاطع الفيديو على موقع يوتيوب في نقل تفاصيل التفاعل المادي، وتميل مجموعات البيانات الأكاديمية إلى احتواء نطاق محدود”.
على عكس الذكاء الاصطناعي للغة أو معالجة الصور، لا تمثل أي مجموعة بيانات سابقة كيفية تفاعل الروبوتات مع العالم المادي. وبالتالي، تصبح مهمة الحصول على مجموعة بيانات واسعة وذات جودة عالية تحديًا أكثر تعقيدًا في مجال الروبوتات؛ لأن تشغيل أسطول من الروبوتات في الإنتاج هو السبيل الوحيد لبناء مجموعة بيانات متنوعة.
على غرار الإجابة عن الأسئلة النصية بقدرات على المستوى البشري، يتطلب التحكم الآلي والتلاعب من الوكيل أن يسعى لتحقيق التقدم نحو هدف لا يحتوي على إجابة واحدة صحيحة وفريدة من نوعها “على سبيل المثال، “ما هي الطريقة الناجحة لالتقاط هذه البصلة الحمراء؟”. مرة أخرى، مطلوب أكثر من مجرد التعلم الخاضع للإشراف.
هناك حاجة إلى روبوت يعتمد على تعلم التعزيز العميق deep RL للنجاح في مجال الروبوتات. هذا النهج الذكي الذاتي التعلمي يجمع بين RL والشبكات العصبية العميقة لفتح مستويات أداء أعلى؛ إذ سيقوم الذكاء الاصطناعي تلقائيًا بتكييف استراتيجيات التعلم ومواصلة تطوير مهاراته مع تجربة سيناريوهات جديدة.
النمو الهائل والتحدي قادم
خلال السنوات القليلة الماضية، قام بعض أبرز خبراء الذكاء الاصطناعي والروبوتات في العالم بوضع الأسس التقنية والتجارية لثورة نموذج الروبوتات الأساسي الذي سيعيد تعريف مستقبل الذكاء الاصطناعي.
على الرغم من أن هذه النماذج الذكية تم بناؤها بطريقة مماثلة لـ”GPT”، فإن تحقيق استقلالية على مستوى الإنسان في العالم المادي يمثل تحديًا علميًا مختلفًا لسببين:
1- بناء منتج قائم على الذكاء الاصطناعي يمكنه خدمة مجموعة متنوعة من التطبيقات العملية في العالم الحقيقي، يتطلب مجموعة معقدة بشكل لافت من المتطلبات المادية. يجب على الذكاء الاصطناعي أن يتكيف مع تطبيقات أجهزة مختلفة، كونه من غير المرجح أن يعمل جهاز واحد في مختلف الصناعات “اللوجستيات والنقل والتصنيع والتجزئة والزراعة والرعاية الصحية… إلخ”.
2- كما يجب أن يتكيف مع الأنشطة المختلفة داخل كل قطاع. تعتبر المستودعات ومراكز التوزيع بيئة مثالية لتدريب نماذج الذكاء الاصطناعي في العالم الحقيقي. ومن الشائع وجود مئات الآلاف أو حتى ملايين الوحدات المختلفة SKUs التي تمر عبر أي منشأة في أي لحظة؛ مما يوفر المجموعة الضخمة والخاصة ذات الجودة العالية اللازمة لتدريب “GPT للروبوتات”.
لحظة نمو “GPT”
مسار النمو لنماذج الروبوتات الأساسية يتسارع بوتيرة سريعة للغاية. تُطبق التطبيقات الروبوتية، وبشكل خاص تلك المتعلقة بالمهام التي تتطلب التلاعب الدقيق بالأشياء، بالفعل في بيئات الإنتاج الحقيقية في العالم، سوف نرى عددًا لا حصر له من التطبيقات الروبوتية ذات الجدوى التجارية يتم تشغيلها على نطاق واسع في عام 2024.
إعداد: وحدة الترجمات بمركز سمت للدراسات
المصدر: Techcrunch
سجل بريدك لتكن أول من يعلم عن تحديثاتنا!
تابعوا أحدث أخبارنا وخدماتنا عبر حسابنا بتويتر