كشفت شركة «بايت دانس»، المالكة لتطبيق «تيك توك»، عن نتائج بحثية جديدة قد تعيد رسم مستقبل تطوير الذكاء الاصطناعي، بعد أن توصل باحثوها إلى ما وصفوه بـ«قانون قابل للتنبؤ» يحكم تطور وكلاء الذكاء الاصطناعي عبر التفاعل مع بيئات العالم الحقيقي، وهو ما قد يساهم في إطالة أمد طفرة الذكاء الاصطناعي في ظل اقتراب أساليب التدريب التقليدية من حدودها.
مستقبل تطوير الذكاء الاصطناعي
جاء هذا الاكتشاف ضمن ورقة بحثية نشرها فريق Seed AI التابع للشركة. حيث أوضح أن وكلاء الذكاء الاصطناعي. وهي أنظمة قادرة على تنفيذ مهام مستقلة نيابة عن الإنسان.
يأتي هذا التطور في وقت يشهد فيه قطاع الذكاء الاصطناعي العالمي بحثًا مكثفًا عن بدائل لطرق التطوير التقليدية. التي اعتمدت لسنوات على زيادة حجم البيانات وقوة الحوسبة خلال مرحلة التدريب الأولي. وهي المقاربة التي يرى خبراء أنها تقترب من حدودها القصوى.
وحذر عدد من رواد المجال، من بينهم أندريه كارباثي، المؤسس المشارك لشركة «أوبن إيه آي». من أن الاعتماد المستمر على توسيع الموارد وحده لن يكون كافيًا لاستدامة تقدم النماذج الذكية على المدى الطويل.
في السياق ذاته، أشار معهد الأبحاث «Epoch AI» إلى احتمال مواجهة أزمة نقص في البيانات النصية المتاحة للعامة خلال السنوات المقبلة. ما يعزز الحاجة إلى تطوير مسارات جديدة تعتمد على التعلم المستمر والتفاعل مع العالم الواقعي بدلًا من البيانات الجاهزة فقط.
ولمعالجة هذه الإشكالية، طور باحثو «بايت دانس» إطارًا تجريبيًا جديدًا يحمل اسم EdgeBench. يضم 134 مهمة طويلة الأمد تغطي مجالات متعددة تشمل البرمجة، والرياضيات، والاكتشافات العلمية، والمهام المعرفية المتقدمة. حيث تتطلب كل مهمة تشغيلًا متواصلًا للوكيل الذكي لمدة لا تقل عن 12 ساعة.
خلال التجارب، سجل الفريق ما يقرب من 38 ألف ساعة من التفاعل مع بيئات مختلفة. شملت خمسة من أبرز نماذج الذكاء الاصطناعي عالميًا، من بينها نماذج «أوبن إيه آي»، و«أنثروبيك»، إلى جانب نماذج صينية من شركات مثل «Zhipu AI» و«ديب سيك».
في حين أظهرت النتائج أن أداء وكلاء الذكاء الاصطناعي لا يتحسن بشكل عشوائي، بل يتبع منحنى رياضيًا يمكن التنبؤ به بدقة عالية، ما يشير إلى أن التعلم بعد النشر . أي أثناء تشغيل النظام في بيئات حقيقية – قد يصبح محركًا رئيسيًا لتطور الذكاء الاصطناعي في المستقبل.
وكلاء الذكاء الاصطناعي
ويؤكد فريق «بايت دانس» أن قدرة وكلاء الذكاء الاصطناعي على التكيف وتحسين أدائهم أثناء تنفيذ المهام تمثل عنصرًا حاسمًا لنجاح انتشار هذه الأنظمة على نطاق واسع، مشيرين إلى أن المستقبل قد يعتمد على أنظمة لا تتوقف عن التعلم حتى بعد إطلاقها.



















