הנדסת פיצ'רים (Feature Engineering): הרוטב הסודי של מודלי ML

זבל נכנס, זבל יוצא (Garbage in, garbage out). זהו כלל הזהב של מדעי הנתונים. יכולה להיות לך הרשת העצבית המתקדמת ביותר בעולם, אבל אם תזין אותה בנתוני מחיר גולמיים ורועשים, היא תיכשל. הנדסת פיצ'רים היא האומנות של הפיכת נתונים גולמיים לקלטים משמעותיים.
מהו פיצ'ר?
במסחר, "מחיר" הוא נתונים גולמיים.
- RSI (מדד הכוח היחסי) הוא פיצ'ר הנגזר ממחיר.
- תנודתיות (ATR) היא פיצ'ר.
- שעת היום היא פיצ'ר.
אמנות הטרנספורמציה
הנדסת פיצ'רים יעילה כרוכה ביצירת קלטים המדגישים דפוסים חזויים.
1. נרמול (Normalization)
מחירים משתנים בפראות (ביטקוין ב-$100 לעומת $100,000). אנו מנרמלים קלטים (למשל, באמצעות תשואות לוגריתמיות או ציוני Z) כך שהמודל רואה שינויים יחסיים, לא מספרים מוחלטים.
2. פיצ'רים מעוכבים (Lag Features)
המחיר הנוכחי תלוי במחיר העבר. אנו יוצרים גרסאות "מעוכבות" של נתונים (t-1, t-2, t-5) כדי לתת למודל הקשר זמני.
3. פיצ'רים של אינטראקציה (Interaction Features)
שילוב של שני אינדיקטורים חושף לעתים קרובות יותר מאחד לבד. לדוגמה, נפח * שינוי מחיר נותן לנו זרימת כסף.
הימנעות מהתאמת יתר (Overfitting)
הוספת יותר מדי פיצ'רים מובילה ל"קללת הממדיות". המודל מתבלבל מרעש. אנו משתמשים בטכניקות כמו PCA (ניתוח גורמים ראשיים) כדי לבחור רק את הפיצ'רים המשפיעים ביותר.
הגישה שלנו
ב-TradingMaster, ניתוח השוק שלנו מסתמך על סט אצור של למעלה מ-200 פיצ'רים קנייניים, שנבדקו ליציבות על פני תנאי שוק משתנים.
מאמרים קשורים
ניתוח חזוי לעומת ניתוח טכני
להסתכל דרך השמשה הקדמית לעומת להסתכל במראה האחורית. ההבדל היסודי בין TA סטנדרטי ל-AI.
חשיבות נתוני הבדיקה לאחור (Backtesting)
ביצועי העבר אינם מבטיחים תוצאות עתידיות, אבל הם המנבא הטוב ביותר שיש לנו. למה אתה חייב לבצע סימולציה לפני שאתה סוחר.
מודלי למידת מכונה בפיננסים
מ-LSTM ליערות אקראיים. הסבר בשפה פשוטה על האלגוריתמים הספציפיים המניעים את TradingMaster.
