بوتات: من الخيال العلمي إلى الجيل التالي من المنصة الحاسوبية
تتجه الروبوتات البشرية العامة بسرعة من الأعمال الخيالية إلى الواقع. انخفاض تكاليف الأجهزة، وزيادة الاستثمارات الرأسمالية، والاختراقات التكنولوجية في مرونة الحركة وقدرات التشغيل، هذه العوامل الثلاثة تتكامل باستمرار، مما يدفع بنشاط قطاع الحوسبة نحو جيل جديد من المنصة.
على الرغم من أن القدرة الحاسوبية والأجهزة أصبحت تجارية بشكل متزايد، مما يوفر مزايا تكلفة لهندسة الروبوتات، إلا أن هذه الصناعة لا تزال تواجه قيود عنق الزجاجة في بيانات التدريب. في هذا السياق، بدأت بعض المشاريع في الاستفادة من الذكاء الاصطناعي الفيزيائي اللامركزي (DePAI) لجمع بيانات الحركة الاصطناعية عالية الدقة، وبناء نماذج أساسية للروبوتات. وهذا يضعها في وضع فريد ومؤاتي لدفع نشر الروبوتات البشرية.
من وظيفة واحدة إلى شكل متعدد الوظائف
تجارية تقنية الروبوتات ليست فكرة جديدة. الروبوتات المنزلية مثل روبوتات التنظيف أو كاميرات الحيوانات الأليفة المعروفة للجمهور، هي أجهزة ذات وظيفة واحدة. مع تطور الذكاء الاصطناعي، تتطور الروبوتات من آلات ذات وظيفة واحدة إلى أشكال متعددة الوظائف، بهدف التكيف مع العمليات في البيئات المفتوحة.
سوف تتطور بوتات الشكل الإنساني من المهام الأساسية مثل التنظيف والطهي تدريجياً على مدى 5 إلى 15 عاماً، لتكون قادرة في النهاية على القيام بأعمال معقدة مثل خدمات الاستقبال، ومكافحة الحرائق، وحتى الجراحة.
تتطور الأحداث مؤخرًا لجعل بوتات humanoid تتحول من روايات الخيال العلمي إلى الواقع:
ديناميات السوق: أكثر من 100 شركة تضع خططًا لبوتات بشرية
لقد نجحت تكنولوجيا الأجهزة في تجاوز وادي الرعب: حيث تُظهر الجيل الجديد من الروبوتات البشرية حركات طبيعية وسلسة كما لو كانت تتدفق، مما يمكّنها من تحقيق تفاعل شبه إنساني في البيئات الواقعية. تصل سرعة المشي لبعض الروبوتات إلى 3.3 متر في الثانية، وهو ما يتجاوز بكثير متوسط سرعة المشي البشري البالغة 1.4 متر في الثانية.
تكلفة بوتات الشكل البشري الجديدة: من المتوقع أن تكون أقل من مستوى الرواتب البشرية في الولايات المتحدة بحلول عام 2032.
قيود التطوير: بيانات التدريب من العالم الحقيقي
على الرغم من وجود عوامل إيجابية واضحة في مجال بوتات الإنسان الآلي، إلا أن جودة البيانات المنخفضة والمشكلات المتعلقة بالندرة لا تزال تعيق نشرها على نطاق واسع.
تقنيات الكيانات الاصطناعية الأخرى، مثل تقنية القيادة الذاتية، قد حلت بشكل أساسي مشكلة البيانات من خلال الكاميرات والمستشعرات المثبتة في المركبات الحالية.能够产生数十亿英里的真实道路驾驶数据. في المراحل الأولى من التطوير، كانت هذه الشركات تضع المركبات على الطريق مع وجود مشرفين حقيقيين في المقعد الأمامي للتدريب في الوقت الحقيقي.
ومع ذلك، من غير المرجح أن يقبل المستهلكون بوجود "بوتات المربية". يجب أن تتمتع الروبوتات بأداء عالٍ جاهز للاستخدام، مما يجعل جمع البيانات قبل النشر أمرًا بالغ الأهمية. يجب أن تكتمل جميع التدريبات قبل الإنتاج التجاري، ولا تزال حجم البيانات وجودتها تمثل تحديًا مستمرًا.
توجد فجوة كبيرة في حجم بيانات التدريب في مجالات الذكاء الاصطناعي المختلفة:
يمكن أن يصل حجم بيانات تدريب نماذج اللغة الكبيرة إلى أكثر من 15 تريليون علامة نصية.
تستخدم نماذج توليد الصور مليارات من أزواج النصوص المصاحبة للفيديو المعلّمة.
بالمقارنة، تحتوي أكبر مجموعة بيانات بوتات على حوالي 2.4 مليون سجل تفاعلي.
تفسر هذه الفجوة لماذا لم تحقق تقنيات الروبوتات نماذج أساسية حقيقية مثل نماذج اللغة الكبيرة، والمفتاح هو أن قاعدة البيانات لا تزال غير مكتملة.
طرق جمع البيانات التقليدية لا تستطيع تلبية احتياجات البيانات التدريبية للروبوتات البشرية على نطاق واسع:
محاكاة: تكاليف منخفضة ولكن تفتقر إلى مشاهد الحدود الحقيقية (فجوة بين المحاكاة والواقع)
فيديو الإنترنت: لا يمكن توفير الإحساس الجسدي وبيئة ردود الفعل اللازمة لتعلم بوتات.
بيانات العالم الحقيقي: على الرغم من دقتها، إلا أنها تتطلب التحكم عن بُعد وعمليات إغلاق بشرية، مما يؤدي إلى ارتفاع التكاليف وافتقارها إلى القابلية للتوسع.
تدريب النماذج في بيئة افتراضية منخفض التكلفة وقابل للتوسع، ولكن هذه النماذج غالبًا ما تواجه صعوبات في النشر في العالم الحقيقي. تُعرف هذه المشكلة بفجوة المحاكاة إلى الواقع (Sim2Real).
على سبيل المثال، قد تتمكن الروبوتات التي تم تدريبها في بيئة محاكاة من التقاط الأشياء بسهولة التي تتمتع بإضاءة مثالية وسطح أملس، ولكن عند مواجهة بيئات فوضوية، أو أنماط غير متساوية، أو حالات طارئة معتادة يتعرض لها البشر في العالم الحقيقي، فإنها غالبًا ما تكون عاجزة.
الرؤية الشاملة للذكاء الاصطناعي اللامركزي
تقوم بعض المشاريع المبتكرة ببناء منصة بيانات وبرامج متكاملة رأسياً تركز على تطبيقات الروبوتات الذكية المدمجة. الهدف الرئيسي لهذه المشاريع هو معالجة مشكلة اختناق البيانات في مجال الروبوتات الشبيهة بالبشر، ولكن رؤيتها تتجاوز ذلك بكثير. من خلال تطوير الأجهزة بشكل مستقل، والبنية التحتية لمحاكاة متعددة الأنماط، ودمج النماذج الأساسية، ستصبح هذه المشاريع محركات شاملة لتحقيق الذكاء المدمج.
تستخدم هذه المنصات أجهزة التقاط الحركة الاستهلاكية المملوكة كنقطة انطلاق، لبناء نظام بيئي سريع التوسع للألعاب المعززة والافتراضية. يقوم المستخدمون بتبادل بيانات الحركة عالية الدقة مقابل مكافآت تحفيزية عبر الإنترنت، مما يعزز من استمرار تطوير المنصة.
ما يلفت الانتباه هو أن هذا النمو ناتج بالكامل عن التطور الطبيعي: المستخدمون يجذبهم ترفيه اللعبة نفسها، بينما يستخدم المذيعون أجهزة التقاط الحركة لتحقيق التقاط وضعيات رقمية في الوقت الحقيقي. لقد حقق هذا الدوران الإيجابي الذي يتشكل بشكل عفوي إنتاج بيانات قابل للتوسع، منخفض التكلفة، وعالي الدقة، مما جعل مجموعات البيانات ذات الصلة موارد تدريب تتنافس عليها أفضل بوتات شركات.
تقوم بعض المشاريع بتطوير منصة بيانات متعددة الأوجه لبيئة محاكاة موحدة مجزأة. حاليًا، فإن مجال المحاكاة مجزأ بشدة، حيث تعمل أدوات مختلفة بشكل مستقل، وعلى الرغم من أن لكل منها مزاياها، إلا أنها غير قادرة على التواصل. تؤخر هذه الحالة المنقسمة تقدم البحث والتطوير، مما يزيد من الفجوة بين المحاكاة والواقع. من خلال تحقيق توحيد المحاكيات، أنشأت هذه المنصات بنية تحتية افتراضية مشتركة لتطوير وتقييم نماذج بوتات. تدعم هذه التكاملات اختبارات قياسية متسقة، مما يعزز بشكل كبير قدرة النظام على التوسع والعمومية.
بوتات الأساس نموذج
بعض المشاريع تعمل على تطوير نماذج أساسية للروبوتات، وهذه النماذج تُبنى كنظام أساسي للبنية التحتية الذكية الناشئة. إن موقعها مشابه لنماذج اللغة الكبيرة التقليدية، ولكنها موجهة نحو مجال الروبوتات.
من خلال الجمع بين بيانات الحركة الجماعية ونظام المحاكاة القوي ونظام ترخيص النماذج، يمكن لهذه المشاريع تدريب نماذج أساسية تتمتع بقدرة تعميم عبر المشاهد. يمكن أن تدعم هذه النماذج تطبيقات متنوعة للروبوتات في مجالات الصناعة والاستهلاك والبحث، مما يحقق نشرًا عامًا تحت بيانات متنوعة ضخمة.
دور تقنية العملات المشفرة في مجموعة تقنيات الذكاء الاصطناعي الفيزيائي
تعمل تقنية التشفير على بناء كومة عمودية كاملة للذكاء الاصطناعي في العالم المادي. على الرغم من أن هذه المشاريع تنتمي إلى مستويات مختلفة من كومة الذكاء الاصطناعي المادي، إلا أن لديها نقطة مشتركة واحدة: معظمها مشاريع الذكاء الاصطناعي المادي اللامركزية (DePAI). يقوم DePAI من خلال الحوافز الرمزية بتمرير الآلية عبر كامل الكومة التقنية، مما يخلق آلية توسيع مفتوحة وقابلة للتجميع وغير مرخصة، وهذه الابتكارات هي التي جعلت من الممكن تطوير الذكاء الاصطناعي المادي بشكل لامركزي.
عند بدء تشغيل آلية تحفيز الرمز، ستصبح مشاركة الشبكة كعنصر رئيسي في تسريع تأثير دوامة DePAI: يمكن للمستخدمين شراء الأجهزة للحصول على تحفيز من جهة المشروع، بينما تدفع شركات تطوير الروبوتات مكافآت للمساهمين في الأجهزة. ستدفع هذه الحوافز المزدوجة المزيد من الأشخاص لشراء واستخدام الأجهزة ذات الصلة. في الوقت نفسه، سيقوم المشروع بتحفيز جمع بيانات السلوك المخصصة ذات القيمة العالية بشكل ديناميكي، مما يسهم بشكل أكثر فعالية في سد الفجوة التكنولوجية بين المحاكاة والتطبيقات الواقعية (Sim2Real).
الخاتمة
ثورة بوتات المنصة لا يمكن إيقافها، ولكن مثل جميع المنصات، فإن تطورها على نطاق واسع يعتمد على دعم البيانات. بعض المشاريع المبتكرة تعمل على تحويل الجماهير إلى "عمال" بيانات الحركة. تمامًا كما تحتاج نماذج اللغة الكبيرة إلى دعم علامات النص، تحتاج الروبوتات البشرية إلى تدريب على كميات هائلة من تسلسل الحركة. من خلال هذه الجهود، سنتمكن من تجاوز العقبة الأخيرة، وتحقيق قفزة من الخيال العلمي إلى الواقع للروبوتات البشرية.
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
تسجيلات الإعجاب 12
أعجبني
12
5
مشاركة
تعليق
0/400
BlockTalk
· منذ 19 س
خطوة أخرى نحو نهاية الأمر
شاهد النسخة الأصليةرد0
SchrodingerWallet
· منذ 19 س
انظر من سيقوم بوتات المنزل بالتمرد أولاً
شاهد النسخة الأصليةرد0
SorryRugPulled
· منذ 19 س
بوتات التنظيف لا يمكن تدريبها بشكل جيد، فما الفائدة من خلق البشر؟
ظهور بوتات الإنسان: ثورة البيانات المدفوعة للمنصة من الجيل القادم
بوتات: من الخيال العلمي إلى الجيل التالي من المنصة الحاسوبية
تتجه الروبوتات البشرية العامة بسرعة من الأعمال الخيالية إلى الواقع. انخفاض تكاليف الأجهزة، وزيادة الاستثمارات الرأسمالية، والاختراقات التكنولوجية في مرونة الحركة وقدرات التشغيل، هذه العوامل الثلاثة تتكامل باستمرار، مما يدفع بنشاط قطاع الحوسبة نحو جيل جديد من المنصة.
على الرغم من أن القدرة الحاسوبية والأجهزة أصبحت تجارية بشكل متزايد، مما يوفر مزايا تكلفة لهندسة الروبوتات، إلا أن هذه الصناعة لا تزال تواجه قيود عنق الزجاجة في بيانات التدريب. في هذا السياق، بدأت بعض المشاريع في الاستفادة من الذكاء الاصطناعي الفيزيائي اللامركزي (DePAI) لجمع بيانات الحركة الاصطناعية عالية الدقة، وبناء نماذج أساسية للروبوتات. وهذا يضعها في وضع فريد ومؤاتي لدفع نشر الروبوتات البشرية.
من وظيفة واحدة إلى شكل متعدد الوظائف
تجارية تقنية الروبوتات ليست فكرة جديدة. الروبوتات المنزلية مثل روبوتات التنظيف أو كاميرات الحيوانات الأليفة المعروفة للجمهور، هي أجهزة ذات وظيفة واحدة. مع تطور الذكاء الاصطناعي، تتطور الروبوتات من آلات ذات وظيفة واحدة إلى أشكال متعددة الوظائف، بهدف التكيف مع العمليات في البيئات المفتوحة.
سوف تتطور بوتات الشكل الإنساني من المهام الأساسية مثل التنظيف والطهي تدريجياً على مدى 5 إلى 15 عاماً، لتكون قادرة في النهاية على القيام بأعمال معقدة مثل خدمات الاستقبال، ومكافحة الحرائق، وحتى الجراحة.
تتطور الأحداث مؤخرًا لجعل بوتات humanoid تتحول من روايات الخيال العلمي إلى الواقع:
قيود التطوير: بيانات التدريب من العالم الحقيقي
على الرغم من وجود عوامل إيجابية واضحة في مجال بوتات الإنسان الآلي، إلا أن جودة البيانات المنخفضة والمشكلات المتعلقة بالندرة لا تزال تعيق نشرها على نطاق واسع.
تقنيات الكيانات الاصطناعية الأخرى، مثل تقنية القيادة الذاتية، قد حلت بشكل أساسي مشكلة البيانات من خلال الكاميرات والمستشعرات المثبتة في المركبات الحالية.能够产生数十亿英里的真实道路驾驶数据. في المراحل الأولى من التطوير، كانت هذه الشركات تضع المركبات على الطريق مع وجود مشرفين حقيقيين في المقعد الأمامي للتدريب في الوقت الحقيقي.
ومع ذلك، من غير المرجح أن يقبل المستهلكون بوجود "بوتات المربية". يجب أن تتمتع الروبوتات بأداء عالٍ جاهز للاستخدام، مما يجعل جمع البيانات قبل النشر أمرًا بالغ الأهمية. يجب أن تكتمل جميع التدريبات قبل الإنتاج التجاري، ولا تزال حجم البيانات وجودتها تمثل تحديًا مستمرًا.
توجد فجوة كبيرة في حجم بيانات التدريب في مجالات الذكاء الاصطناعي المختلفة:
تفسر هذه الفجوة لماذا لم تحقق تقنيات الروبوتات نماذج أساسية حقيقية مثل نماذج اللغة الكبيرة، والمفتاح هو أن قاعدة البيانات لا تزال غير مكتملة.
طرق جمع البيانات التقليدية لا تستطيع تلبية احتياجات البيانات التدريبية للروبوتات البشرية على نطاق واسع:
تدريب النماذج في بيئة افتراضية منخفض التكلفة وقابل للتوسع، ولكن هذه النماذج غالبًا ما تواجه صعوبات في النشر في العالم الحقيقي. تُعرف هذه المشكلة بفجوة المحاكاة إلى الواقع (Sim2Real).
على سبيل المثال، قد تتمكن الروبوتات التي تم تدريبها في بيئة محاكاة من التقاط الأشياء بسهولة التي تتمتع بإضاءة مثالية وسطح أملس، ولكن عند مواجهة بيئات فوضوية، أو أنماط غير متساوية، أو حالات طارئة معتادة يتعرض لها البشر في العالم الحقيقي، فإنها غالبًا ما تكون عاجزة.
الرؤية الشاملة للذكاء الاصطناعي اللامركزي
تقوم بعض المشاريع المبتكرة ببناء منصة بيانات وبرامج متكاملة رأسياً تركز على تطبيقات الروبوتات الذكية المدمجة. الهدف الرئيسي لهذه المشاريع هو معالجة مشكلة اختناق البيانات في مجال الروبوتات الشبيهة بالبشر، ولكن رؤيتها تتجاوز ذلك بكثير. من خلال تطوير الأجهزة بشكل مستقل، والبنية التحتية لمحاكاة متعددة الأنماط، ودمج النماذج الأساسية، ستصبح هذه المشاريع محركات شاملة لتحقيق الذكاء المدمج.
تستخدم هذه المنصات أجهزة التقاط الحركة الاستهلاكية المملوكة كنقطة انطلاق، لبناء نظام بيئي سريع التوسع للألعاب المعززة والافتراضية. يقوم المستخدمون بتبادل بيانات الحركة عالية الدقة مقابل مكافآت تحفيزية عبر الإنترنت، مما يعزز من استمرار تطوير المنصة.
ما يلفت الانتباه هو أن هذا النمو ناتج بالكامل عن التطور الطبيعي: المستخدمون يجذبهم ترفيه اللعبة نفسها، بينما يستخدم المذيعون أجهزة التقاط الحركة لتحقيق التقاط وضعيات رقمية في الوقت الحقيقي. لقد حقق هذا الدوران الإيجابي الذي يتشكل بشكل عفوي إنتاج بيانات قابل للتوسع، منخفض التكلفة، وعالي الدقة، مما جعل مجموعات البيانات ذات الصلة موارد تدريب تتنافس عليها أفضل بوتات شركات.
تقوم بعض المشاريع بتطوير منصة بيانات متعددة الأوجه لبيئة محاكاة موحدة مجزأة. حاليًا، فإن مجال المحاكاة مجزأ بشدة، حيث تعمل أدوات مختلفة بشكل مستقل، وعلى الرغم من أن لكل منها مزاياها، إلا أنها غير قادرة على التواصل. تؤخر هذه الحالة المنقسمة تقدم البحث والتطوير، مما يزيد من الفجوة بين المحاكاة والواقع. من خلال تحقيق توحيد المحاكيات، أنشأت هذه المنصات بنية تحتية افتراضية مشتركة لتطوير وتقييم نماذج بوتات. تدعم هذه التكاملات اختبارات قياسية متسقة، مما يعزز بشكل كبير قدرة النظام على التوسع والعمومية.
بوتات الأساس نموذج
بعض المشاريع تعمل على تطوير نماذج أساسية للروبوتات، وهذه النماذج تُبنى كنظام أساسي للبنية التحتية الذكية الناشئة. إن موقعها مشابه لنماذج اللغة الكبيرة التقليدية، ولكنها موجهة نحو مجال الروبوتات.
من خلال الجمع بين بيانات الحركة الجماعية ونظام المحاكاة القوي ونظام ترخيص النماذج، يمكن لهذه المشاريع تدريب نماذج أساسية تتمتع بقدرة تعميم عبر المشاهد. يمكن أن تدعم هذه النماذج تطبيقات متنوعة للروبوتات في مجالات الصناعة والاستهلاك والبحث، مما يحقق نشرًا عامًا تحت بيانات متنوعة ضخمة.
دور تقنية العملات المشفرة في مجموعة تقنيات الذكاء الاصطناعي الفيزيائي
تعمل تقنية التشفير على بناء كومة عمودية كاملة للذكاء الاصطناعي في العالم المادي. على الرغم من أن هذه المشاريع تنتمي إلى مستويات مختلفة من كومة الذكاء الاصطناعي المادي، إلا أن لديها نقطة مشتركة واحدة: معظمها مشاريع الذكاء الاصطناعي المادي اللامركزية (DePAI). يقوم DePAI من خلال الحوافز الرمزية بتمرير الآلية عبر كامل الكومة التقنية، مما يخلق آلية توسيع مفتوحة وقابلة للتجميع وغير مرخصة، وهذه الابتكارات هي التي جعلت من الممكن تطوير الذكاء الاصطناعي المادي بشكل لامركزي.
عند بدء تشغيل آلية تحفيز الرمز، ستصبح مشاركة الشبكة كعنصر رئيسي في تسريع تأثير دوامة DePAI: يمكن للمستخدمين شراء الأجهزة للحصول على تحفيز من جهة المشروع، بينما تدفع شركات تطوير الروبوتات مكافآت للمساهمين في الأجهزة. ستدفع هذه الحوافز المزدوجة المزيد من الأشخاص لشراء واستخدام الأجهزة ذات الصلة. في الوقت نفسه، سيقوم المشروع بتحفيز جمع بيانات السلوك المخصصة ذات القيمة العالية بشكل ديناميكي، مما يسهم بشكل أكثر فعالية في سد الفجوة التكنولوجية بين المحاكاة والتطبيقات الواقعية (Sim2Real).
الخاتمة
ثورة بوتات المنصة لا يمكن إيقافها، ولكن مثل جميع المنصات، فإن تطورها على نطاق واسع يعتمد على دعم البيانات. بعض المشاريع المبتكرة تعمل على تحويل الجماهير إلى "عمال" بيانات الحركة. تمامًا كما تحتاج نماذج اللغة الكبيرة إلى دعم علامات النص، تحتاج الروبوتات البشرية إلى تدريب على كميات هائلة من تسلسل الحركة. من خلال هذه الجهود، سنتمكن من تجاوز العقبة الأخيرة، وتحقيق قفزة من الخيال العلمي إلى الواقع للروبوتات البشرية.