بث تجريبي

الإثنين، 20 يناير 2025

01:08 ص

أسسها

حازم الجندي

رئيس مجلس الإدارة

أكرم القصاص

إشراف عام

علا الشافعي

مايكروسوفت تطوّر ذكاءًا اصطناعيًا يمكنه التحكم في برامج ويندوز

الخميس، 02 يناير 2025 11:30 ص

شركة مايكروسوفت أرشيف

شركة مايكروسوفت أرشيف

أعلنت مايكروسوفت، تطوير نموذج ذكاء اصطناعي جديد، يحمل اسم “Large Action Model أو LAM”، ويتميز بقدرته على تشغيل برامج ويندوز، وتنفيذ المهام بنحو مستقل، كما يشكّل هذا النموذج، نقلة نوعية في الذكاء الاصطناعي القادر على تنفيذ الأوامر فعليًا.

وعلى عكس النماذج اللغوية التقليدية، مثل GPT-4o، والتي تقتصر وظيفتها على معالجة النصوص وإنشائها، يتمتع نموذج LAM الجديد من مايكروسوفت، بقدرة على تحويل طلبات المستخدمين إلى أفعال حقيقية، سواءًا كان ذلك تشغيل البرامج أو التحكم في الأجهزة.

وكانت هذه الفكرة موجودة سابقًا، لكن LAM يُعد أول نموذج يُدرَّب بنحو خاص، للعمل مع منتجات مايكروسوفت أوفيس المكتبية، وغيرها من تطبيقات ويندوز.

 

تقديم تعليمات نصية حول كيفية الشراء

وعلى سبيل المثال:- عند التسوق عبر الإنترنت، تستطيع النماذج التقليدية، تقديم تعليمات نصية حول كيفية الشراء، في حين يمكن لنموذج LAM، تنفيذ عملية الشراء نفسها من خلال التنقل في واجهة الموقع.

ووفقًا لمايكروسوفت، فإن تطوير هذا النموذج، يتطلب أربع مراحل رئيسية هي:- التدريب على تخطيط المهام وتقسيم المهمة إلى خطوات منطقية، والتعلم من نماذج متقدمة (مثل GPT-4o)، لتحويل الخطط إلى أفعال، والاستكشاف الذاتي، والذي يتيح للنموذج، البحث عن حلول جديدة وتجاوز العقبات التي تعجز عنها النماذج الأخرى، إضافة إلى التدريب المستند إلى المكافآت، لتحسين دقة التنفيذ.

وجرّب الباحثون، نموذج LAM في بيئة اختبار خاصة ببرنامج تحرير النصوص “ورد”، وقد نجح في تنفيذ المهام بنسبة قدرها 71%، متفوقًا على GPT-4o، والذي حقق نسبة نجاح بلغت 63%، دون معلومات بصرية، كما كان نموذج LAM أسرع إذ استغرق 30 ثانية فقط لتنفيذ المهمة، مقارنةً بـ86 ثانية لـGPT-4o، ومع ذلك، عند تزويد GPT-4o بمعلومات بصرية، تحسنت دقته لتصل إلى 75,5%.

شركة مايكروسوفت أرشيف

 

استخدام نموذج GPT-4o لتطوير المهام المُعقدة

واستند فريق مايكروسوفت، إلى آلاف البيانات التدريبية المستخلصة من وثائق مايكروسوفت، ومقالات منصة wikiHow، وعمليات البحث عبر محرك بينج، ثم استخدم الفريق نموذج GPT-4o، لتطوير هذه المهام إلى مهام أخرى أكثر تعقيدًا.

ومع هذا التطور، يواجه نموذج LAM بعض التحديات، منها تنفيذ أفعال بنحو خطأ، وبعض القضايا التنظيمية التي تحتاج إلى حلول، وقيود تقنية تؤثر في قابلية التوسع والتطبيق في مجالات مختلفة.

ويرى الباحثون، أن LAM يشكّل تقدمًا كبيرًا في مجال الذكاء الاصطناعي، مشيرين إلى أنه قد يمهد الطريق، لتطوير ذكاءٍ اصطناعي عام (AGI)؛ فبدلًا من الأنظمة التي تقتصر على فهم النصوص وإنتاجها، قد توفر الشركات قريبًا مساعدين رقميين، يساعدون فعليًا في تنفيذ المهام اليومية بنحو فعّال.

Short Url

showcase
showcase
search