مشاريع الويب 3 التي تتعلق بمفهوم الذكاء الاصطناعي أصبحت هدفًا لجذب الأموال في السوقين الأول والثاني.
تظهر الفرص في مجال الذكاء الاصطناعي في Web3 من خلال: استخدام الحوافز الموزعة لتنسيق العرض المحتمل في الذيل الطويل ------ عبر البيانات والتخزين والحوسبة؛ وفي الوقت نفسه، إنشاء نموذج مفتوح المصدر وسوق لامركزي لوكلاء الذكاء الاصطناعي.
تستخدم الذكاء الاصطناعي في صناعة Web3 بشكل رئيسي في التمويل القائم على blockchain (الدفع بالعملات المشفرة، التداول، تحليل البيانات) وكذلك في مساعدة التطوير.
تتمثل فائدة AI+Web3 في التكميل المتبادل بين الاثنين: من المتوقع أن يتصدى Web3 لتركز AI، ومن المتوقع أن تساعد AI Web3 في التوسع.
على مدى العامين الماضيين، تطور الذكاء الاصطناعي كما لو تم الضغط على زر التسريع، فهذه الأجنحة التي أطلقتها Chatgpt لم تفتح فقط عالماً جديداً للذكاء الاصطناعي التوليدي، بل أثارت أيضاً تياراً في الجانب الآخر من Web3.
تحت تأثير مفهوم الذكاء الاصطناعي، لاحظت السوق المشفرة تراجعًا ملحوظًا في التمويل. ووفقًا لإحصائيات وسائل الإعلام، تم تمويل 64 مشروعًا في مجال Web3 + AI فقط في النصف الأول من عام 2024، حيث حقق نظام التشغيل القائم على الذكاء الاصطناعي Zyber365 أعلى مبلغ تمويل يبلغ 100 مليون دولار في الجولة الأولى.
السوق الثانوية أكثر ازدهارًا، حيث تظهر بيانات مواقع تجميع العملات المشفرة أنه في غضون أكثر من عام بقليل، وصلت القيمة السوقية الإجمالية لقطاع الذكاء الاصطناعي إلى 48.5 مليار دولار، وبلغت حجم التداول على مدار 24 ساعة حوالي 8.6 مليار دولار؛ الفوائد الناتجة عن تقدم تكنولوجيا الذكاء الاصطناعي واضحة، حيث بعد إصدار نموذج Sora لتحويل النص إلى فيديو من قبل إحدى الشركات، ارتفع السعر المتوسط لقطاع الذكاء الاصطناعي بنسبة 151٪؛ تأثير الذكاء الاصطناعي كذلك يمتد إلى أحد القطاعات الجاذبة للعملات المشفرة وهو Meme: حيث أن أول مفهوم لعملة MemeCoin المرتبطة بالذكاء الاصطناعي ------ GOAT حقق شهرة سريعة وحصل على تقييم قدره 1.4 مليار دولار، مما ساعد على إثارة حمى Meme الذكية.
أصبحت الأبحاث والمواضيع المتعلقة بـ AI+Web3 مشتعلة بنفس القدر، من AI+Depin إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، مشاعر FOMO لم تعد قادرة على مواكبة سرعة تبادل السرد الجديد.
AI+Web3، هذه المجموعة من المصطلحات المليئة بالمال الساخن، والفرص المستقبلية، والخيال، لا مفر من أن تُعتبر زواجًا مُرتبًا من قبل رأس المال، يبدو أنه من الصعب علينا التمييز تحت هذا الرداء الفاخر، هل هي ساحة المضاربين، أم أنها ليلة الانفجار في الفجر؟
للإجابة على هذا السؤال، فإن أحد التأملات الحاسمة لكلا الجانبين هو: هل سيكون الوضع أفضل مع الطرف الآخر؟ هل يمكن الاستفادة من أنماط الطرف الآخر؟ في هذه المقالة، نحاول أيضًا أن نقف على أكتاف السابقين لفحص هذه الديناميكية: كيف يمكن لـ Web3 أن تلعب دورًا في مختلف جوانب تكنولوجيا الذكاء الاصطناعي، وما الجديد الذي يمكن أن يجلبه الذكاء الاصطناعي لـ Web3؟
الجزء 1 ما الفرص المتاحة في Web3 تحت كومة الذكاء الاصطناعي؟
قبل الخوض في هذا الموضوع، نحتاج إلى فهم تقنية نموذج الذكاء الاصطناعي الكبير:
بعبارات أكثر بساطة، يمكن التعبير عن العملية بأكملها على النحو التالي: "النموذج الكبير" يشبه دماغ الإنسان، في مراحله المبكرة، ينتمي هذا الدماغ إلى رضيع حديث الولادة يحتاج إلى مراقبة واستيعاب كميات هائلة من المعلومات من العالم من حوله لفهم هذا العالم، وهذه هي مرحلة "جمع" البيانات؛ نظرًا لأن أجهزة الكمبيوتر لا تمتلك حواس الإنسان مثل الرؤية والسمع، فإنه قبل التدريب، يجب تحويل كميات كبيرة من المعلومات غير المصنفة من العالم الخارجي إلى تنسيق معلومات يمكن للكمبيوتر فهمه واستخدامه من خلال "المعالجة المسبقة".
بعد إدخال البيانات، يقوم الذكاء الاصطناعي من خلال "التدريب" ببناء نموذج يمتلك القدرة على الفهم والتنبؤ، ويمكن اعتباره بمثابة عملية فهم وتعلم الطفل للعالم الخارجي تدريجياً، حيث تعتبر معلمات النموذج مثل القدرة اللغوية التي تتكيف باستمرار خلال عملية تعلم الطفل. عندما يبدأ المحتوى التعليمي في التخصص، أو عند التواصل مع الآخرين للحصول على ردود فعل وتعديل، يدخل ذلك في مرحلة "التعديل الدقيق" للنموذج الكبير.
عندما يكبر الأطفال ويتعلمون التحدث، يمكنهم فهم المعاني والتعبير عن مشاعرهم وأفكارهم في محادثات جديدة، وهذه المرحلة تشبه "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج التنبؤ وتحليل المدخلات الجديدة من اللغة والنصوص. يعبر الأطفال عن مشاعرهم من خلال القدرة اللغوية، ويصفون الأشياء ويحلون مختلف المشاكل، وهذا يشبه أيضًا تطبيق نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال بعد الانتهاء من التدريب واستخدامها في مهام محددة مثل تصنيف الصور والتعرف على الصوت.
ووكيل الذكاء الاصطناعي يقترب أكثر من الشكل التالي للنموذج الكبير - القدرة على تنفيذ المهام بشكل مستقل والسعي لتحقيق أهداف معقدة، فهو لا يمتلك فقط القدرة على التفكير، بل يمكنه أيضًا التذكر والتخطيط، ويمكنه استخدام الأدوات للتفاعل مع العالم.
في الوقت الحالي، وبالنظر إلى التحديات المتعلقة بالذكاء الاصطناعي في مختلف الطبقات، تشكل Web3 حاليًا نظامًا بيئيًا متعدد الطبقات ومترابطًا، يغطي جميع مراحل عملية نماذج الذكاء الاصطناعي.
1. الطبقة الأساسية: قوة الحوسبة والبيانات مثل Airbnb
قوة الحوسبة
حالياً، تعتبر واحدة من أعلى التكاليف في الذكاء الاصطناعي هي القدرة الحاسوبية والطاقة المطلوبة لتدريب النماذج واستنتاجها.
مثال على ذلك هو أن شركة LLAMA3 تحتاج إلى 16000 وحدة من H100GPU التي تنتجها شركة معينة (وهي وحدة معالجة رسومات عالية المستوى مصممة خصيصًا لأحمال العمل في الذكاء الاصطناعي والحوسبة عالية الأداء) لتكمل التدريب في 30 يومًا. تتراوح تكلفة النسخة ذات سعة 80 جيجابايت بين 30000 و40000 دولار، مما يتطلب استثمارًا في الأجهزة الحاسوبية (وحدات معالجة الرسومات + رقائق الشبكة) يتراوح بين 400 إلى 700 مليون دولار، بالإضافة إلى أن التدريب الشهري يتطلب استهلاك 1.6 مليار كيلوواط ساعة، مما يجعل نفقات الطاقة تصل إلى حوالي 20 مليون دولار شهريًا.
بالنسبة لفك ضغط قوة الذكاء الاصطناعي، فإنها تمثل بالفعل أحد المجالات الأولى التي تداخلت فيها Web3 مع الذكاء الاصطناعي------DePin (شبكة البنية التحتية المادية اللامركزية) حالياً، قامت إحدى مواقع البيانات بعرض أكثر من 1400 مشروع، حيث تشمل مشاريع مشاركة قوة GPU العديد من المشاريع.
المنطق الرئيسي هو: يسمح النظام للأفراد أو الكيانات الذين يمتلكون موارد GPU غير المستغلة بالمساهمة بقدراتهم الحاسوبية بطريقة لامركزية دون الحاجة إلى إذن، من خلال سوق عبر الإنترنت بين المشترين والبائعين مثل شركة معينة أو شركة أخرى، مما يزيد من معدل استخدام موارد GPU غير المستغلة، وبالتالي يحصل المستخدمون النهائيون على موارد حوسبة فعالة منخفضة التكلفة؛ في الوقت نفسه، تضمن آلية الرهن أنه في حالة حدوث انتهاك لآلية مراقبة الجودة أو انقطاع الشبكة، سيتعرض مقدمو الموارد لعقوبات مناسبة.
تتميز بـ:
جمع موارد GPU غير المستخدمة: يتكون الموردون بشكل رئيسي من مراكز البيانات المستقلة الصغيرة والمتوسطة، ومن مشغلي حقول التعدين وغيرها من الموارد الزائدة للقوة الحاسوبية، بالإضافة إلى الأجهزة التعدينية التي تستخدم آلية توافق PoS، مثل أجهزة التعدين لبعض المشاريع. حاليًا، هناك أيضًا مشاريع تهدف إلى تشغيل أجهزة ذات عتبة دخول أقل، مثل بعض المشاريع التي تستخدم أجهزة معينة لإنشاء شبكة حسابية لتشغيل استدلال النماذج الكبيرة.
مواجهة سوق الذيل الطويل لقوة الذكاء الاصطناعي:
أ. "من حيث الجانب التقني" فإن سوق قوة الحوسبة اللامركزية أكثر ملاءمة لخطوات الاستدلال. تعتمد التدريب بشكل أكبر على قدرة معالجة البيانات التي توفرها مجموعات GPU الكبيرة جدًا، بينما تتطلب عمليات الاستدلال أداءً أقل نسبيًا من GPU، مثل بعض المشاريع التي تركز على أعمال الريندرينغ ذات الكمون المنخفض وتطبيقات الاستدلال بالذكاء الاصطناعي.
ب. "من حيث جانب الطلب" فإن الأطراف ذات القوة الحاسوبية المنخفضة لن تقوم بتدريب نموذج كبير خاص بها بشكل منفصل، بل ستختار فقط تحسين وتعديل النماذج الكبيرة الرائدة القليلة، وهذه السيناريوهات مناسبة بشكل طبيعي لموارد الحوسبة الموزعة المتاحة.
الملكية اللامركزية: المعنى التكنولوجي للبلوكتشين هو أن مالكي الموارد يحتفظون دائمًا بالتحكم في مواردهم، مع إمكانية التعديل المرن بناءً على الطلب، وفي نفس الوقت تحقيق الأرباح.
البيانات
البيانات هي أساس الذكاء الاصطناعي. إذا لم تكن هناك بيانات، فإن الحسابات تشبه الحشائش الطافية بلا فائدة، وعلاقة البيانات بالنموذج تشبه المثل الشائع "المدخلات السيئة، المخرجات السيئة". إن كمية البيانات وجودة المدخلات تحدد جودة المخرجات النهائية للنموذج. بالنسبة لتدريب النماذج الحالية للذكاء الاصطناعي، فإن البيانات تحدد القدرة اللغوية للنموذج، وفهمه، وحتى قيمه وظاهرة إنسانيته. في الوقت الحالي، تركز معضلة احتياجات بيانات الذكاء الاصطناعي بشكل أساسي على النقاط الأربعة التالية:
جوع البيانات: يعتمد تدريب نماذج الذكاء الاصطناعي على كميات هائلة من بيانات الإدخال. تُظهر البيانات العامة أن إحدى الشركات قامت بتدريب نموذج معين وصل عدد معاييره إلى تريليونات.
جودة البيانات: مع دمج الذكاء الاصطناعي مع مختلف الصناعات، أصبحت timeliness البيانات، وتنوع البيانات، واحترافية البيانات المتخصصة، ومصادر البيانات الناشئة مثل استيعاب مشاعر وسائل التواصل الاجتماعي، تفرض متطلبات جديدة على جودتها.
قضايا الخصوصية والامتثال: بدأت الدول والشركات تدريجياً في إدراك أهمية مجموعات البيانات عالية الجودة، وتفرض قيوداً على جمع البيانات.
تكلفة معالجة البيانات مرتفعة: حجم البيانات كبير، وعملية المعالجة معقدة. تظهر البيانات العامة أن أكثر من 30% من تكلفة البحث والتطوير في شركات الذكاء الاصطناعي تُستخدم لجمع البيانات الأساسية ومعالجتها.
حالياً، تظهر حلول web3 في الجوانب الأربعة التالية:
جمع البيانات: البيانات التي يمكن جمعها من العالم الحقيقي مجانًا تتناقص بسرعة، والشركات العاملة في مجال الذكاء الاصطناعي تزداد نفقاتها على البيانات عامًا بعد عام. ومع ذلك، فإن هذه النفقات لم تعود بالنفع على المساهمين الحقيقيين في البيانات، حيث تستفيد المنصات بالكامل من القيمة التي توفرها البيانات، مثل منصة معينة حققت إيرادات إجمالية قدرها 2.03 مليار دولار من خلال توقيع اتفاقية ترخيص بيانات مع شركة ذكاء اصطناعي.
تمكين المستخدمين الذين يساهمون حقًا من المشاركة في خلق القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة بتكلفة منخفضة من خلال الشبكات الموزعة وآليات التحفيز، هو رؤية Web3.
*某项目 هو طبقة بيانات وشبكة غير مركزية، يمكن للمستخدمين من خلال تشغيل العقدة، المساهمة بعرض النطاق الترددي الفائض وإعادة توجيه الحركة لالتقاط البيانات الحية من الإنترنت بأسره والحصول على مكافآت رمزية؛
قدم مشروع معين مفهوم فريد من نوعه لبركة سيولة البيانات (DLP)، حيث يمكن للمستخدمين رفع بياناتهم الشخصية (مثل سجلات التسوق، عادات التصفح، نشاطات وسائل التواصل الاجتماعي، إلخ) إلى DLP محدد، واختيار ما إذا كانوا يرغبون في منح تفويض باستخدام هذه البيانات لطرف ثالث معين؛
في مشروع معين، يمكن للمستخدمين استخدام بعض العلامات على منصة معينة و@حساب معين لجمع البيانات.
معالجة البيانات: في عملية معالجة البيانات الخاصة بالذكاء الاصطناعي، نظرًا لأن البيانات التي تم جمعها عادة ما تكون صاخبة وتحتوي على أخطاء، يجب تنظيفها وتحويلها إلى تنسيق قابل للاستخدام قبل تدريب النموذج، مما يتطلب مهام متكررة تتعلق بالتوحيد والترشيح ومعالجة القيم المفقودة. هذه المرحلة هي واحدة من القليل من الخطوات التي تتطلب العمل اليدوي في صناعة الذكاء الاصطناعي، وقد أدى ذلك إلى ظهور مهنة مدربي البيانات. مع زيادة متطلبات النموذج لجودة البيانات، ارتفعت أيضًا معايير مهنة مدربي البيانات، وهذه المهمة تتناسب بشكل طبيعي مع آلية الحوافز اللامركزية في Web3.
حاليًا، تفكر بعض المشاريع في إضافة مرحلة الوسم البيانات هذه.
قدم مشروع ما مفهوم "Train2earn"، مع التأكيد على جودة البيانات، حيث يمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات موسومة، تعليقات، أو أشكال أخرى من المدخلات.
مشروع تسمية البيانات يقوم بتحويل مهام التسمية إلى لعبة، ويتيح للمستخدمين رهن النقاط لكسب المزيد من النقاط.
خصوصية البيانات والأمان: من الضروري توضيح أن خصوصية البيانات والأمان هما مفهومين مختلفين. تتعلق خصوصية البيانات بمعالجة البيانات الحساسة، بينما تحمي أمان البيانات المعلومات من الوصول غير المصرح به، أو التدمير، أو السرقة. وبالتالي، تظهر مزايا تقنيات الخصوصية في Web3 والسيناريوهات المحتملة للتطبيق في جانبين: (1) تدريب البيانات الحساسة؛ (2) التعاون في البيانات: يمكن لمالكي البيانات المتعددين المشاركة في تدريب الذكاء الاصطناعي دون الحاجة إلى مشاركة بياناتهم الأصلية.
تشمل تقنيات الخصوصية الشائعة حاليًا في Web3 ما يلي:
البيئة التنفيذية الموثوقة ( TEE )، مثل مشروع معين؛
التشفير المتجانس بالكامل (FHE)، مثل بعض المشاريع؛
تقنية المعرفة الصفرية (zk) ، مثل مشروع يستخدم تقنية zkTLS ، تولد إثباتات المعرفة الصفرية لحركة HTTPS ، مما يسمح للمستخدمين باستيراد الأنشطة وسمعة البيانات وهوياتهم بأمان من مواقع الويب الخارجية دون الكشف عن معلومات حساسة.
ومع ذلك، لا يزال هذا المجال في مرحلة مبكرة، حيث لا يزال معظم المشاريع قيد الاستكشاف، وأحد التحديات الحالية هو ارتفاع تكلفة الحساب، وبعض الأمثلة هي:
تحتاج إطار معين إلى حوالي 80 دقيقة لإنشاء إثبات نموذج 1M-nanoGPT.
وفقًا لبيانات إحدى الشركات، فإن تكاليف zkML أعلى بأكثر من 1000 مرة من الحسابات البحتة.
4، تخزين البيانات: بعد الحصول على البيانات، تحتاج إلى مكان
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 14
أعجبني
14
3
مشاركة
تعليق
0/400
GateUser-ccc36bc5
· منذ 19 س
الأموال تفر منّي أسرع.
شاهد النسخة الأصليةرد0
airdrop_huntress
· منذ 19 س
أيضًا، هذا هو الأمر فقط، إنها مجرد مادة جديدة لاستغلال الحمقى.
دمج الذكاء الاصطناعي وWeb3: فتح عصر جديد من البيانات، قوة الحوسبة والابتكار
الذكاء الاصطناعي + Web3: الأبراج والساحات
ليرة تركية ؛ د
مشاريع الويب 3 التي تتعلق بمفهوم الذكاء الاصطناعي أصبحت هدفًا لجذب الأموال في السوقين الأول والثاني.
تظهر الفرص في مجال الذكاء الاصطناعي في Web3 من خلال: استخدام الحوافز الموزعة لتنسيق العرض المحتمل في الذيل الطويل ------ عبر البيانات والتخزين والحوسبة؛ وفي الوقت نفسه، إنشاء نموذج مفتوح المصدر وسوق لامركزي لوكلاء الذكاء الاصطناعي.
تستخدم الذكاء الاصطناعي في صناعة Web3 بشكل رئيسي في التمويل القائم على blockchain (الدفع بالعملات المشفرة، التداول، تحليل البيانات) وكذلك في مساعدة التطوير.
تتمثل فائدة AI+Web3 في التكميل المتبادل بين الاثنين: من المتوقع أن يتصدى Web3 لتركز AI، ومن المتوقع أن تساعد AI Web3 في التوسع.
! الذكاء الاصطناعي+Web3: الأبراج والساحات
مقدمة
على مدى العامين الماضيين، تطور الذكاء الاصطناعي كما لو تم الضغط على زر التسريع، فهذه الأجنحة التي أطلقتها Chatgpt لم تفتح فقط عالماً جديداً للذكاء الاصطناعي التوليدي، بل أثارت أيضاً تياراً في الجانب الآخر من Web3.
تحت تأثير مفهوم الذكاء الاصطناعي، لاحظت السوق المشفرة تراجعًا ملحوظًا في التمويل. ووفقًا لإحصائيات وسائل الإعلام، تم تمويل 64 مشروعًا في مجال Web3 + AI فقط في النصف الأول من عام 2024، حيث حقق نظام التشغيل القائم على الذكاء الاصطناعي Zyber365 أعلى مبلغ تمويل يبلغ 100 مليون دولار في الجولة الأولى.
السوق الثانوية أكثر ازدهارًا، حيث تظهر بيانات مواقع تجميع العملات المشفرة أنه في غضون أكثر من عام بقليل، وصلت القيمة السوقية الإجمالية لقطاع الذكاء الاصطناعي إلى 48.5 مليار دولار، وبلغت حجم التداول على مدار 24 ساعة حوالي 8.6 مليار دولار؛ الفوائد الناتجة عن تقدم تكنولوجيا الذكاء الاصطناعي واضحة، حيث بعد إصدار نموذج Sora لتحويل النص إلى فيديو من قبل إحدى الشركات، ارتفع السعر المتوسط لقطاع الذكاء الاصطناعي بنسبة 151٪؛ تأثير الذكاء الاصطناعي كذلك يمتد إلى أحد القطاعات الجاذبة للعملات المشفرة وهو Meme: حيث أن أول مفهوم لعملة MemeCoin المرتبطة بالذكاء الاصطناعي ------ GOAT حقق شهرة سريعة وحصل على تقييم قدره 1.4 مليار دولار، مما ساعد على إثارة حمى Meme الذكية.
أصبحت الأبحاث والمواضيع المتعلقة بـ AI+Web3 مشتعلة بنفس القدر، من AI+Depin إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، مشاعر FOMO لم تعد قادرة على مواكبة سرعة تبادل السرد الجديد.
AI+Web3، هذه المجموعة من المصطلحات المليئة بالمال الساخن، والفرص المستقبلية، والخيال، لا مفر من أن تُعتبر زواجًا مُرتبًا من قبل رأس المال، يبدو أنه من الصعب علينا التمييز تحت هذا الرداء الفاخر، هل هي ساحة المضاربين، أم أنها ليلة الانفجار في الفجر؟
للإجابة على هذا السؤال، فإن أحد التأملات الحاسمة لكلا الجانبين هو: هل سيكون الوضع أفضل مع الطرف الآخر؟ هل يمكن الاستفادة من أنماط الطرف الآخر؟ في هذه المقالة، نحاول أيضًا أن نقف على أكتاف السابقين لفحص هذه الديناميكية: كيف يمكن لـ Web3 أن تلعب دورًا في مختلف جوانب تكنولوجيا الذكاء الاصطناعي، وما الجديد الذي يمكن أن يجلبه الذكاء الاصطناعي لـ Web3؟
الجزء 1 ما الفرص المتاحة في Web3 تحت كومة الذكاء الاصطناعي؟
قبل الخوض في هذا الموضوع، نحتاج إلى فهم تقنية نموذج الذكاء الاصطناعي الكبير:
بعبارات أكثر بساطة، يمكن التعبير عن العملية بأكملها على النحو التالي: "النموذج الكبير" يشبه دماغ الإنسان، في مراحله المبكرة، ينتمي هذا الدماغ إلى رضيع حديث الولادة يحتاج إلى مراقبة واستيعاب كميات هائلة من المعلومات من العالم من حوله لفهم هذا العالم، وهذه هي مرحلة "جمع" البيانات؛ نظرًا لأن أجهزة الكمبيوتر لا تمتلك حواس الإنسان مثل الرؤية والسمع، فإنه قبل التدريب، يجب تحويل كميات كبيرة من المعلومات غير المصنفة من العالم الخارجي إلى تنسيق معلومات يمكن للكمبيوتر فهمه واستخدامه من خلال "المعالجة المسبقة".
بعد إدخال البيانات، يقوم الذكاء الاصطناعي من خلال "التدريب" ببناء نموذج يمتلك القدرة على الفهم والتنبؤ، ويمكن اعتباره بمثابة عملية فهم وتعلم الطفل للعالم الخارجي تدريجياً، حيث تعتبر معلمات النموذج مثل القدرة اللغوية التي تتكيف باستمرار خلال عملية تعلم الطفل. عندما يبدأ المحتوى التعليمي في التخصص، أو عند التواصل مع الآخرين للحصول على ردود فعل وتعديل، يدخل ذلك في مرحلة "التعديل الدقيق" للنموذج الكبير.
عندما يكبر الأطفال ويتعلمون التحدث، يمكنهم فهم المعاني والتعبير عن مشاعرهم وأفكارهم في محادثات جديدة، وهذه المرحلة تشبه "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج التنبؤ وتحليل المدخلات الجديدة من اللغة والنصوص. يعبر الأطفال عن مشاعرهم من خلال القدرة اللغوية، ويصفون الأشياء ويحلون مختلف المشاكل، وهذا يشبه أيضًا تطبيق نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال بعد الانتهاء من التدريب واستخدامها في مهام محددة مثل تصنيف الصور والتعرف على الصوت.
ووكيل الذكاء الاصطناعي يقترب أكثر من الشكل التالي للنموذج الكبير - القدرة على تنفيذ المهام بشكل مستقل والسعي لتحقيق أهداف معقدة، فهو لا يمتلك فقط القدرة على التفكير، بل يمكنه أيضًا التذكر والتخطيط، ويمكنه استخدام الأدوات للتفاعل مع العالم.
في الوقت الحالي، وبالنظر إلى التحديات المتعلقة بالذكاء الاصطناعي في مختلف الطبقات، تشكل Web3 حاليًا نظامًا بيئيًا متعدد الطبقات ومترابطًا، يغطي جميع مراحل عملية نماذج الذكاء الاصطناعي.
! الذكاء الاصطناعي+Web3: الأبراج والمربعات
1. الطبقة الأساسية: قوة الحوسبة والبيانات مثل Airbnb
قوة الحوسبة
حالياً، تعتبر واحدة من أعلى التكاليف في الذكاء الاصطناعي هي القدرة الحاسوبية والطاقة المطلوبة لتدريب النماذج واستنتاجها.
مثال على ذلك هو أن شركة LLAMA3 تحتاج إلى 16000 وحدة من H100GPU التي تنتجها شركة معينة (وهي وحدة معالجة رسومات عالية المستوى مصممة خصيصًا لأحمال العمل في الذكاء الاصطناعي والحوسبة عالية الأداء) لتكمل التدريب في 30 يومًا. تتراوح تكلفة النسخة ذات سعة 80 جيجابايت بين 30000 و40000 دولار، مما يتطلب استثمارًا في الأجهزة الحاسوبية (وحدات معالجة الرسومات + رقائق الشبكة) يتراوح بين 400 إلى 700 مليون دولار، بالإضافة إلى أن التدريب الشهري يتطلب استهلاك 1.6 مليار كيلوواط ساعة، مما يجعل نفقات الطاقة تصل إلى حوالي 20 مليون دولار شهريًا.
بالنسبة لفك ضغط قوة الذكاء الاصطناعي، فإنها تمثل بالفعل أحد المجالات الأولى التي تداخلت فيها Web3 مع الذكاء الاصطناعي------DePin (شبكة البنية التحتية المادية اللامركزية) حالياً، قامت إحدى مواقع البيانات بعرض أكثر من 1400 مشروع، حيث تشمل مشاريع مشاركة قوة GPU العديد من المشاريع.
المنطق الرئيسي هو: يسمح النظام للأفراد أو الكيانات الذين يمتلكون موارد GPU غير المستغلة بالمساهمة بقدراتهم الحاسوبية بطريقة لامركزية دون الحاجة إلى إذن، من خلال سوق عبر الإنترنت بين المشترين والبائعين مثل شركة معينة أو شركة أخرى، مما يزيد من معدل استخدام موارد GPU غير المستغلة، وبالتالي يحصل المستخدمون النهائيون على موارد حوسبة فعالة منخفضة التكلفة؛ في الوقت نفسه، تضمن آلية الرهن أنه في حالة حدوث انتهاك لآلية مراقبة الجودة أو انقطاع الشبكة، سيتعرض مقدمو الموارد لعقوبات مناسبة.
تتميز بـ:
جمع موارد GPU غير المستخدمة: يتكون الموردون بشكل رئيسي من مراكز البيانات المستقلة الصغيرة والمتوسطة، ومن مشغلي حقول التعدين وغيرها من الموارد الزائدة للقوة الحاسوبية، بالإضافة إلى الأجهزة التعدينية التي تستخدم آلية توافق PoS، مثل أجهزة التعدين لبعض المشاريع. حاليًا، هناك أيضًا مشاريع تهدف إلى تشغيل أجهزة ذات عتبة دخول أقل، مثل بعض المشاريع التي تستخدم أجهزة معينة لإنشاء شبكة حسابية لتشغيل استدلال النماذج الكبيرة.
مواجهة سوق الذيل الطويل لقوة الذكاء الاصطناعي:
أ. "من حيث الجانب التقني" فإن سوق قوة الحوسبة اللامركزية أكثر ملاءمة لخطوات الاستدلال. تعتمد التدريب بشكل أكبر على قدرة معالجة البيانات التي توفرها مجموعات GPU الكبيرة جدًا، بينما تتطلب عمليات الاستدلال أداءً أقل نسبيًا من GPU، مثل بعض المشاريع التي تركز على أعمال الريندرينغ ذات الكمون المنخفض وتطبيقات الاستدلال بالذكاء الاصطناعي.
ب. "من حيث جانب الطلب" فإن الأطراف ذات القوة الحاسوبية المنخفضة لن تقوم بتدريب نموذج كبير خاص بها بشكل منفصل، بل ستختار فقط تحسين وتعديل النماذج الكبيرة الرائدة القليلة، وهذه السيناريوهات مناسبة بشكل طبيعي لموارد الحوسبة الموزعة المتاحة.
البيانات
البيانات هي أساس الذكاء الاصطناعي. إذا لم تكن هناك بيانات، فإن الحسابات تشبه الحشائش الطافية بلا فائدة، وعلاقة البيانات بالنموذج تشبه المثل الشائع "المدخلات السيئة، المخرجات السيئة". إن كمية البيانات وجودة المدخلات تحدد جودة المخرجات النهائية للنموذج. بالنسبة لتدريب النماذج الحالية للذكاء الاصطناعي، فإن البيانات تحدد القدرة اللغوية للنموذج، وفهمه، وحتى قيمه وظاهرة إنسانيته. في الوقت الحالي، تركز معضلة احتياجات بيانات الذكاء الاصطناعي بشكل أساسي على النقاط الأربعة التالية:
جوع البيانات: يعتمد تدريب نماذج الذكاء الاصطناعي على كميات هائلة من بيانات الإدخال. تُظهر البيانات العامة أن إحدى الشركات قامت بتدريب نموذج معين وصل عدد معاييره إلى تريليونات.
جودة البيانات: مع دمج الذكاء الاصطناعي مع مختلف الصناعات، أصبحت timeliness البيانات، وتنوع البيانات، واحترافية البيانات المتخصصة، ومصادر البيانات الناشئة مثل استيعاب مشاعر وسائل التواصل الاجتماعي، تفرض متطلبات جديدة على جودتها.
قضايا الخصوصية والامتثال: بدأت الدول والشركات تدريجياً في إدراك أهمية مجموعات البيانات عالية الجودة، وتفرض قيوداً على جمع البيانات.
تكلفة معالجة البيانات مرتفعة: حجم البيانات كبير، وعملية المعالجة معقدة. تظهر البيانات العامة أن أكثر من 30% من تكلفة البحث والتطوير في شركات الذكاء الاصطناعي تُستخدم لجمع البيانات الأساسية ومعالجتها.
حالياً، تظهر حلول web3 في الجوانب الأربعة التالية:
تمكين المستخدمين الذين يساهمون حقًا من المشاركة في خلق القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة بتكلفة منخفضة من خلال الشبكات الموزعة وآليات التحفيز، هو رؤية Web3.
*某项目 هو طبقة بيانات وشبكة غير مركزية، يمكن للمستخدمين من خلال تشغيل العقدة، المساهمة بعرض النطاق الترددي الفائض وإعادة توجيه الحركة لالتقاط البيانات الحية من الإنترنت بأسره والحصول على مكافآت رمزية؛
قدم مشروع معين مفهوم فريد من نوعه لبركة سيولة البيانات (DLP)، حيث يمكن للمستخدمين رفع بياناتهم الشخصية (مثل سجلات التسوق، عادات التصفح، نشاطات وسائل التواصل الاجتماعي، إلخ) إلى DLP محدد، واختيار ما إذا كانوا يرغبون في منح تفويض باستخدام هذه البيانات لطرف ثالث معين؛
في مشروع معين، يمكن للمستخدمين استخدام بعض العلامات على منصة معينة و@حساب معين لجمع البيانات.
حاليًا، تفكر بعض المشاريع في إضافة مرحلة الوسم البيانات هذه.
قدم مشروع ما مفهوم "Train2earn"، مع التأكيد على جودة البيانات، حيث يمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات موسومة، تعليقات، أو أشكال أخرى من المدخلات.
مشروع تسمية البيانات يقوم بتحويل مهام التسمية إلى لعبة، ويتيح للمستخدمين رهن النقاط لكسب المزيد من النقاط.
تشمل تقنيات الخصوصية الشائعة حاليًا في Web3 ما يلي:
البيئة التنفيذية الموثوقة ( TEE )، مثل مشروع معين؛
التشفير المتجانس بالكامل (FHE)، مثل بعض المشاريع؛
تقنية المعرفة الصفرية (zk) ، مثل مشروع يستخدم تقنية zkTLS ، تولد إثباتات المعرفة الصفرية لحركة HTTPS ، مما يسمح للمستخدمين باستيراد الأنشطة وسمعة البيانات وهوياتهم بأمان من مواقع الويب الخارجية دون الكشف عن معلومات حساسة.
ومع ذلك، لا يزال هذا المجال في مرحلة مبكرة، حيث لا يزال معظم المشاريع قيد الاستكشاف، وأحد التحديات الحالية هو ارتفاع تكلفة الحساب، وبعض الأمثلة هي:
تحتاج إطار معين إلى حوالي 80 دقيقة لإنشاء إثبات نموذج 1M-nanoGPT.
وفقًا لبيانات إحدى الشركات، فإن تكاليف zkML أعلى بأكثر من 1000 مرة من الحسابات البحتة.
4، تخزين البيانات: بعد الحصول على البيانات، تحتاج إلى مكان