“الوكيل الرقمي”.. عصر جديد من “السكرتير التكنولوجي” أقرب للبشر في 2025م
عندما طرح بيل جيتس، مؤسس مايكروسوفت، كتابه “The Road Ahead” (الطريق إلى الأمام)، وضع تعريفاً لفكرة المساعد الرقمي للبشر على الأجهزة الحاسوبية، وقال عنها إنها “قادرة على تعلم احتياجاتك وتفضيلاتك للاستخدام، بطريقة أقرب لطريقة تعلم المساعدين من البشر”.
الآن وبعد 30 عاماً من طرح الكتاب، أصبحت الرؤية أقرب إلى التحقق في 2025، بالتزامن مع القفزات التي تحققها فرق تطوير وتدريب الذكاء الاصطناعي داخل الشركات التقنية المختلفة، إذ تتجه مختلف نماذج الذكاء الاصطناعي، مثل OpenAI o3 من شركة OpenAI ونماذج جوجل Gemini 2.0، ونماذج ميتا Llama 3.2، نحو فهم العالم الرقمي بشكل أفضل، من خلال القدرات المتطورة على التفاعل مع واجهات الاستخدام، بتصميماتها ومساحات الكتابة بداخلها.
ما هو الوكيل الرقمي AI Agent؟
الوكيل الرقمي هو كائن إلكتروني، يمكن اعتباره روبوت برمجي، مُبرمج لكي يتعلم من الأوامر التي يقدمها إليه المستخدم، سواء بشكل مباشر عبر قائمة من الشروط والخطوات التي يحددها مسبقاً ليعمل الروبوت البرمجي وفقاً لها، أو بشكل غير مباشر من خلال الخبرات التي يكونها الروبوت من تتبع طريقة عمل واستخدام البشر وتفاعلهم اليومي مع التطبيقات والخدمات الإلكترونية على أجهزتهم الذكية.
الأمر أشبه بفكرة التصحيح التلقائي للنصوص Auto Correction على لوحة مفاتيح الهواتف والتي تعمل من خلال تتبع النمط المميز للمستخدم في الكتابة وطريقة كتابته للكلمات وأسلوبه في الكتابة، وعندما يبدأ الكتابة بعد ذلك، تقترح لوحة المفاتيح الكلمات على المستخدم بنفس طريقة كتابته وأسلوبه، كي لا يحتاج لكتابتها كاملة من جديد.
وعندما تنضج فكرة الوكلاء الرقميين بشكل كامل، لن يحتاج المستخدم إلى تصميم برنامجاً للسفر مثلاً بنفسه، لأن الوكيل الرقمي يعلم تفضيلاته للأماكن السياحية، وطبيعة شخصيته وانعكاسها على مفهومه للترفيه وطبيعة المطاعم والمقاهي التي تلائم المستخدم، وبالتالي سينشئ الوكيل تلقائياً برنامج زيارات مميز يعجب المستخدم، بل ويتناسب مع القدرة المالية لكل مستخدم.
كيف نقترب من عصر الوكلاء الرقميين؟
قطعت الشركات التقنية شوطاً كبيراً على التدريب والتجارب، بما يكفي لأن يكون عام 2025 هو الأقرب لبداية عصر الوكلاء الرقميين.
ومن أهم المزايا التي يحتاج إليها المساعد الشخصي البشري، الذاكرة كي يتمكن من معرفة التفاصيل الدقيقة الخاصة بمن يساعده، لينجز المهام الموكلة إليه، بما يتناسب مع متطلباتها وتفضيلات الشخص الذي يعمل معه.
وبتطبيق ذلك على المنصات الذكية، فإن أغلبها تتوفر بداخله حالياً مزايا التذكر، فشركة OpenAI بالفعل تتيح ميزة الذاكرة داخل نموذج ChatGPT، كذلك زودت شركتا “جوجل” و”أنثروبيك” منصاتهما “جيميناي” و”كلاودي”، على الترتيب، بميزة الذاكرة، ويمكن لمستخدم المنصات الثلاث التحكم في محتوى الذاكرة بالحذف والإضافة، وذلك يجعل إجاباتهم على أسئلة المستخدم متوافقة بشكل مستمر مع تفضيلاته وطبيعة استخدامه.
ويحتاج الوكيل الرقمي كذلك إلى اكتساب مهارات استخدام الأدوات الإلكترونية، سواء المتاحة على الإنترنت أو على الأجهزة الشخصية بشكل عام، من أدوات لإدخال البيانات، مثل التحكم في الماوس والكتابة بلوحة المفاتيح، والقدرة على تصفح مواقع الويب والكتابة بداخلها، إلى جانب إمكانية تشغيل واستخدام التطبيقات والخدمات المختلفة.
شركة “أنثروبيك” اختبرت، العام الماضي، ميزة Computer Use، والتي تسمح للمستخدم بأن يوكل مهمة لمنصتها الذكية “كلاودي” لتنفيذ هدف معين، وبالتالي تبدأ المنصة في العمل على تنفيذه عبر استخدام الأدوات المتاحة لديها، من التحكم في مؤشر الماوس، والكتابة داخل الحقول النصية للبحث، والكتابة بشكل عام عبر استخدام لوحة المفاتيح، إضافة إلى استخدام الإنترنت للوصول إلى جميع المعلومات المتاحة واللازمة لتحقيق هدف المستخدم، كل ذلك يحدث بشكل تلقائي، وسيكون على المستخدم فقط الإشراف، وأحياناً الموافقة في حالة كان تحقيق الهدف يتطلب الدفع النقدي مقابل خدمة معينة.
كما اختبرت شركة OpenAI ميزة مشابهة تعرف باسم Operator، بحسب “بلومبرغ”، كما زودت منصة ChatGPT على حواسيب ماك بميزة العمل مع عدد من التطبيقات، والتي تسمح للمنصة الذكية بإنشاء المحتوى النصي أو الأكواد البرمجية مباشرة داخل تلك التطبيقات، والتي وصل عددها حتى الآن 30 تطبيقاً، إلا أن تلك الميزة لم تتضمن بعد استخدام الماوس أو لوحة المفاتيح كما هو الحال مع “كلاودي”.
شركة “جوجل” لم تتأخر كذلك عن الركب، إذ طورت حزمة من الوكلاء الرقميين الأذكياء، مثل مشروع Project Mariner والذي يعمل على تطوير مساعد ذكي لتصفح الإنترنت داخل “جوجل كروم”، والتفاعل مع عناصر الشاشة من صور ونصوص وأزرار وأكواد برمجية داخل نافذة المتصفح، ومشروع مساعد ذكي لكتابة الأكواد البرمجية، يحمل اسم Jules، والذي يساعد في تحديد المعضلة، أو المهمة البرمجية المرغوب في إنجازها، ومن ثم يبدأ العمل على حلها عبر كتابة الأكواد، ثم يبدأ التنفيذ، تحت إشراف كامل من المبرمج البشري.
أما “مايكروسوفت” فقد وضعت أساساً للدخول بمساعدها الذكي “كوبايلوت” إلى هذا السباق، من خلال إتاحة ميزة Copilot Vision لمستخدمي متصفحها “إيدج” المشتركين في خدمة “كوبايلوت برو” المدفوعة، والتي يمكن للمستخدم من خلالها طرح أسئلة واستفسارات متتابعة على Copilot، والذي بدوره يقدم مقترحات، ليصل المستخدم إلى ما يبحث عنه، كذلك يساعد في التعرف على معلومات بشأن ما يظهر داخل المواقع التي يزورها المستخدم خلال جلسة التصفح.
وعرضت “مايكروسوفت” أيضاً إمكانية الاستفادة من قدرات Copilot الجديدة على رؤية المحتوى داخل مواقع الويب في الحصول على تجربة أفضل للتسوق الإلكتروني، بحيث يمكن لمساعد “مايكروسوفت” مساعدة المستخدم في العثور على المنتج الذي يناسب متطلباته.
إدراك العالم
ويحتاج الوكلاء الرقميون أيضاً إلى فهم وإدراك العالم، لذلك فإن النماذج الذكية تطورت لتلبي هذا الاحتياج عبر الارتقاء بقدراتها لتفهم ما يتواجد حول البشر، فأصبحت تسمى World Class AI Models (نماذج بدرجة عالمية).
وأصبحت النماذج الذكية قادرة على فهم العالم، ولديها قدرات متطورة لفهم أبعاد الأشياء وماهيتها، فمثلاً نماذج إنشاء الفيديوهات بالذكاء الاصطناعي، مثل Sora من OpenAI وVeo من جوجل، وهي نماذج يجري تدريبها وتطويرها باستخدام كم ضخم من المقاطع المصورة، ما يجعلها قادرة على تخيل شكل مختلف المشاهد وحركة العناصر بداخلها، وكذلك علاقتها ببعضها البعض والبيئة حولها وفقاً لقوانين الفيزياء.
فهم العالم سيكون مهارة جوهرية للوكلاء الرقميين عند تشغيلهم على أجهزة حاسوبية ذكية، مثل النظارات الذكية، إذاقتربت “ميتا” بمساعدها الذكي Meta AI إلى هذا المستوى من الذكاء، عن طريق تحديث أطلقته الشركة نهاية 2024، والذي يتيح ميزة Live AI، والتي تجعل المساعد الذكي يعمل بشكل مستمر، أو كما يطلق عليه ميزة Always-On AI، إذ يمكنه أن “يسمع” و”يرى” العالم عبر الميكروفون والسماعة الخاصة بنظارة “ميتا” طوال تفعيل الميزة، ويستطيع المستخدم طرح أي أسئلة بشأن ما يدور حوله من مشاهد وأصوات، ولكن حتى الآن ما زالت دقة الميزة متواضعة، إلى جانب تأثيرها الكبير على عمر البطارية، فالميزة تستنفذ الشحن بشكل كامل خلال استخدامها لمدة 30 دقيقة فقط.
ولكن يبدو أن الشركات التقنية تسعى وراء تطوير أكبر، إذ بدأت ميزة مشاركة محتوى الشاشة Screen Share واستخدام كاميرا الموبايل في الوصول إلى تطبيق ChatGPT على الهواتف الذكية، حتى يستطيع المستخدم الحصول على معلومات أو رأي المنصة الذكية في كل ما يراه أمامه، إلى جانب الحصول على المساعدة بأشكال مختلفة مع المحتوى المعروض على شاشته، سواء كان نصياً أو صوراً.
وتحاول “جوجل” أيضاً السير على هذا النهج مع مشروعها المستقبلي Project Astra، والذي يتمثل في مساعد ذكي يفهم العالم من خلال ما يراه ويسمعه عبر ميكروفون وكاميرا نظارة ذكية، خاصة أن الشركة الأميركية وضعت استراتيجية 2025 وبطلها الذكاء الاصطناعي.
مع كل تلك المعطيات من تطور تقني ضخم مرت به نماذج الذكاء الاصطناعي حتى الآن، يمكن القول إن عام 2025 سيكون بداية لعصر جديد كلياً من الوكلاء الرقميين، ولكن لن يكونوا مثل مساعد “مايكروسوفت” الشهير Clippy داخل مستندات “وورد”، فالوكيل الرقمي سيكون أكثر مبادرة ويقظة بشأن أي شيء يتفاعل المستخدم معه، سواء في عالمه الحقيقي في المحيط حوله أو في العالم الرقمي على شاشات الأجهزة الشخصية الذكية، لذلك ربما صدق جيتس عندما قال في تدوينة نشرها في 2023: “يتشابه Clippy مع الوكلاء الرقميين، بنفس طريقة تشابه الهاتف ذي القرص الدوّار مع الهواتف الذكية”.