مهد التعلم العميق deep learning - أحد فروع الذكاء الاصطناعي- تطوير الخوارزميات، لما يشبه محاكاة الدماغ البشري في معالجته للبيانات، من خلال التدريب على عدد من الأمثلة، وتصنيف الاستجابة المختلفة لكل مثال على حده.
ومع مرور الوقت، تزايد الطلب على تحسين الخوارزميات المستخدمة في تحليل البيانات، ومن بينها ما يعرف باسم خوارزميات الترتيب sorting algorithms وهي الخوارزميات المعنيّة بإعادة ترتيب القيم المدخلة اعتمادًا على عامل مقارنةٍ محددٍ، لتُستخدم تريليونات المرات يوميًّا. سابقًا، استغرق تطوير الخوارزميات عقودًا من البحث من قِبل علماء الكمبيوتر والمبرمجين. أما في وقتنا الحاضر، فقد أصبح من الممكن الاستعانة بالتعلم العميق، لتعزيز تطوير الخوارزميات في وقت أقل من خلال اكتشاف إجراءات غير معروفة مسبقًًا.
في دراسة حديثة منشورة في دورية Nature، طوّر فريق من الباحثين، في مختبر أبحاث الذكاء الاصطناعي الرائد DeepMind، خوارزميات ترتيبٍ مستحدثةٍ، ليفوق أداء هذه الخوارزميات نظيراتها الموجودة مسبقًا، والتي طوَّرها العلماء والمهندسون على مدى عقود.
اعتمد الفريق في ذلك على خوارزمية AlphaDev التي تتوصل إلى خوارزميات جديدة كليًّا بدلًا من تحسين الخوارزميات المعروفة، ومن ثم اختيار أسرع الخوارزميات اعتمادًا على ما يُعرف بالتعلم المُعزز reinforcement learning. وتعتمد خوارزمية AlphaDev في ذلك على ما يشبه اللعب المنفرد لكل خوارزمية على حده، إذ تتابع AlphaDev الخوارزمية التي أنشأتها، والمعلومات التي يتم معالجتها، ومن ثم اختيار ما يضاف من تعليمات إلى تلك الخوارزمية. وتعتبر خوارزمية AlphaDev امتدادًا لنظام AlphaZero المستخدم في تطوير خوارزميات الألعاب كالشطرنج، كما تُعد نموذجًا جيدًا لكيفية استغلال الألعاب في تطبيق مفيد.
وبذلك تُبرز هذه الدراسة قدرة الذكاء الاصطناعي على تحقيق خطوات غير مسبوقة لتطوير خوارزميات ذات كفاءة أعلى من نظيراتها المطورة بشريًّا، وذلك بالتدريب على عدد من الأمثلة، دون الحاجة إلى أي توجيه مُسبق.