قام المؤلفون في هذا البحث بتطوير نظام تداول مالي يعتمد على تقنيات الذكاء الصنعي، حيث تم دمج خوارزمية أمثلية مستعمرة النمل (ACO) والخوارزمية الجينية (GA) مع نظام التعلم المُعزّز العودي (RRL) بهدف تحسين أداء التداول المالي. يهدف هذا النظام الهجين، الذي أطلق عليه اسم ACO-GA-RRL، إلى اختيار مجموعة مثالية من المؤشرات الفنية والأساسية لتحسين استقرار وربحية التداول في سوق الأوراق المالية. وقد تم اختبار النظام باستخدام بيانات يومية من سوق دمشق للأوراق المالية، مما أتاح للمؤلفين تقييم أدائه مقارنة بأنظمة تداول أخرى مثل RRL وGA-RRL.
اعتمدت منهجية البحث على دمج الخوارزميات الثلاثة بطريقة تفاعلية. تم استخدام الخوارزمية الجينية (GA) لاختيار المؤشرات المثلى من خلال عمليات الانتقاء الطبيعي والعبور والطفرة، بينما تم استخدام خوارزمية أمثلية مستعمرة النمل (ACO) كمرحلة تحسين إضافية لتحسين نتائج GA. تمثل دور ACO في محاكاة سلوك النمل الطبيعي في البحث عن المسارات المثلى، حيث يتم تحديث كمية الفيرمون لتوجيه عملية البحث نحو الحلول الأفضل. بعد ذلك، تم دمج النتائج مع نظام التعلم المُعزّز العودي (RRL) الذي يعتمد على الشبكات العصبية لتدريب نظام التداول وتحسين أدائه بناءً على العوائد المحققة. استخدم النظام مؤشرات فنية مثل مؤشر القوة النسبية (RSI) ومؤشرات حجم التداول، بالإضافة إلى مؤشرات أساسية مثل نسب السعر إلى التدفق النقدي ونسب الدين إلى السوق.
أظهرت النتائج أن النظام الهجين ACO-GA-RRL تفوق على الأنظمة الأخرى من حيث تحسين نسب الأداء مثل نسبة Sharpe ونسبة Treynor ونسبة Jensen. كما زاد عدد الشركات ذات نسب Sharpe الموجبة، مما يشير إلى استقرار وربحية أعلى للنظام المقترح. وأكد المؤلفون أن دمج المؤشرات المختارة بواسطة ACO-GA مع نظام RRL أدى إلى تحسين الأداء بشكل ملحوظ مقارنة باستخدام RRL أو GA-RRL بشكل منفصل.
على الرغم من النتائج الإيجابية، يمكن توجيه بعض الانتقادات للبحث. أولاً، اقتصرت الدراسة على بيانات سوق دمشق للأوراق المالية، مما يثير تساؤلات حول قابلية تعميم النتائج على أسواق مالية أخرى ذات خصائص مختلفة. ثانياً، لم يتم تقديم تحليل كافٍ حول تأثير كل مؤشر على حدة على أداء النظام، مما قد يحد من فهم العلاقة بين المؤشرات المختارة وأداء التداول. ثالثاً، كان من الممكن تحسين البحث من خلال مقارنة النظام المقترح مع تقنيات حديثة أخرى في مجال الذكاء الصنعي، مثل التعلم العميق أو الشبكات العصبية التكرارية المتقدمة.
بشكل عام، يُعد هذا البحث مساهمة مهمة في مجال أنظمة التداول المالي، حيث يبرز إمكانية دمج تقنيات الذكاء الصنعي المختلفة لتحسين الأداء. ومع ذلك، فإن التوسع في نطاق الدراسة وتحليل أعمق للعوامل المؤثرة قد يعزز من قيمة النتائج ويزيد من موثوقيتها.
الكاتبون في هذا البحث، راميت ساوني، أرناف وادوا، شيفام أغاروال، وراجيف راتن شاه، يركزون على تطوير نهج جديد للتداول الكمي اليومي باستخدام التعلم العميق المعزز (Deep Reinforcement Learning) مع الاستفادة من البيانات النصية مثل الأخبار والتغريدات. يهدف البحث إلى معالجة التحديات المرتبطة بتصميم استراتيجيات تداول مربحة وفعالة في سوق الأسهم، الذي يتميز بطبيعته العشوائية وتأثره الكبير بالبيانات الفوضوية من مصادر متعددة مثل وسائل الإعلام الاجتماعية والأخبار.
المنهجية التي اعتمدها الباحثون تتمثل في صياغة مشكلة التداول كمسألة تعلم معزز، حيث يتم تصميم وكيل تداول يتخذ قرارات استثمارية مدركة للزمن بناءً على إشارات نصية تؤثر على الأسهم. يتم استخدام نموذج "PROFIT" (Policy for Return Optimization using Financial news and online Text)، وهو نموذج تعلم معزز عميق يعتمد على شبكة عصبية مخصصة. هذه الشبكة تتعامل مع النصوص بطريقة هرمية ومدركة للزمن، حيث يتم استخدام تمثيلات نصية مستخلصة من BERT لمعالجة الأخبار والتغريدات، مع دمج آليات الانتباه (Attention Mechanisms) لتحديد النصوص الأكثر تأثيرًا على السوق. كما يتم استخدام LSTM وTime-aware LSTM لمعالجة النصوص المتغيرة زمنيًا، مما يسمح للنموذج بفهم الديناميكيات الزمنية للنصوص وتأثيرها على السوق.
النتائج التي توصل إليها الباحثون أظهرت أن نموذج "PROFIT" يتفوق على الأساليب التقليدية وأحدث النماذج في هذا المجال من حيث العوائد المعدلة بالمخاطر. في عمليات المحاكاة التي أجريت على بيانات تغريدات باللغة الإنجليزية وأخبار مالية باللغة الصينية، حقق النموذج زيادة في العوائد بنسبة تزيد عن 13% مقارنة بالنماذج الأخرى، مع تقليل الخسائر القصوى بنسبة تزيد عن 16%. هذه النتائج تدعم فعالية النموذج كأداة للتداول الكمي، مع تقديمه أداءً قويًا في أسواق متعددة مثل NASDAQ وأسواق الأسهم الصينية.
على الرغم من قوة النتائج، يمكن توجيه بعض الانتقادات للبحث. أولاً، النموذج يعتمد بشكل كبير على جودة البيانات النصية المستخدمة، مثل الأخبار والتغريدات، والتي قد تكون عرضة للتحيز أو عدم الدقة. ثانيًا، لم يتم التطرق بشكل كافٍ إلى كيفية تأثير الأحداث غير المتوقعة أو البيانات غير النصية (مثل المؤشرات الاقتصادية) على أداء النموذج. ثالثًا، على الرغم من أن النموذج يأخذ في الاعتبار تكاليف المعاملات، إلا أن هناك حاجة إلى مزيد من التقييم في بيئات تداول حقيقية لتحديد مدى استدامة النموذج في ظل ظروف السوق المتغيرة.
بشكل عام، يقدم البحث مساهمة مهمة في مجال التداول الكمي باستخدام معالجة اللغة الطبيعية والتعلم المعزز، مع فتح آفاق جديدة لتحسين استراتيجيات التداول. ومع ذلك، فإن تحسين النموذج ليشمل مصادر بيانات أوسع وأكثر تنوعًا، بالإضافة إلى اختباره في بيئات تداول حقيقية، يمكن أن يعزز من فعاليته وقابليته للتطبيق.