هندسة الميزات (Feature Engineering): الصلصة السرية لنماذج التعلم الآلي

القيمة المدخلة السيئة تؤدي إلى نتائج سيئة (Garbage in, garbage out). هذه هي القاعدة الذهبية لعلوم البيانات. يمكنك الحصول على الشبكة العصبية الأكثر تقدمًا في العالم، ولكن إذا قمت بتغذيتها ببيانات أسعار خام وصاخبة، فستفشل. هندسة الميزات هي فن تحويل البيانات الخام إلى مدخلات ذات مغزى.
ما هي الميزة؟
في التداول "السعر" هو بيانات خام.
- مؤشر القوة النسبية (RSI) هو ميزة مشتقة من السعر.
- التقلب (ATR) هو ميزة.
- وقت اليوم هو ميزة.
فن التحويل
تتضمن هندسة الميزات الفعالة إنشاء مدخلات تسلط الضوء على الأنماط التنبؤية.
1. التطبيع (Normalization)
تختلف الأسعار بشكل كبير (البيتكوين عند 100 دولار مقابل 100,000 دولار). نقوم بتطبيع المدخلات (على سبيل المثال، باستخدام العوائد اللوغاريتمية أو درجات Z) بحيث يرى النموذج التغييرات النسبية، وليس الأرقام المطلقة.
2. ميزات التأخر (Lag Features)
يعتمد السعر الحالي على السعر السابق. نقوم بإنشاء إصدارات "متأخرة" من البيانات (t-1، t-2، t-5) لإعطاء النموذج سياقًا زمنيًا.
3. ميزات التفاعل (Interaction Features)
الجمع بين مؤشرين غالبًا ما يكشف أكثر من مؤشر واحد بمفرده. على سبيل المثال، يعطينا الحجم * تغير السعر تدفق المال.
تجنب الاطراد (Overfitting)
إضافة عدد كبير جدًا من الميزات يؤدي إلى "لعنة الأبعاد". يصبح النموذج مشوشًا بسبب الضوضاء. نستخدم تقنيات مثل PCA (تحليل المكونات الرئيسية) لتحديد الميزات الأكثر تأثيرًا فقط.
نهجنا
في TradingMaster، يعتمد تحليل السوق الخاص بنا على مجموعة مختارة من أكثر من 200 ميزة مملوكة، تم اختبارها من أجل القوة عبر ظروف السوق المختلفة.
مقالات ذات صلة
التحليلات التنبؤية مقابل التحليل الفني
النظر من الزجاج الأمامي مقابل النظر في مرآة الرؤية الخلفية. الاختلاف الجوهري بين التحليل الفني القياسي (TA) والذكاء الاصطناعي (AI).
أهمية بيانات الاختبار الخلفي (Backtesting)
الأداء السابق لا يضمن النتائج المستقبلية، لكنه أفضل مؤشر لدينا. لماذا يجب عليك المحاكاة قبل التدوال.
نماذج التعلم الآلي في التمويل
من LSTM إلى الغابات العشوائية. شرح بلغة بسيطة للخوارزميات المحددة التي تشغل TradingMaster.
