Feature Engineering: Tajná omáčka modelů ML

Odpadky dovnitř, odpadky ven. Toto je zlaté pravidlo Data Science. Můžete mít nejpokročilejší neuronovou síť na světě, ale pokud ji budete krmit nezpracovanými, hlučnými cenovými daty, selže. Feature Engineering je umění transformace nezpracovaných dat na smysluplné vstupy.
Co je funkce?
Při obchodování jsou „cena“ nezpracovaná data.
- RSI (Relative Strength Index) je funkce odvozená od ceny.
- Volatility (ATR) je funkce.
- Time of Day je funkce.
Umění transformace
Efektivní inženýrství funkcí zahrnuje vytváření vstupů, které zvýrazňují prediktivní vzory.
1. Normalizace
Ceny se velmi liší (Bitcoin za 100 $ vs. 100 000 $). Vstupy normalizujeme (např. pomocí Log Returns nebo Z-scores), takže model vidí relativní změny, nikoli absolutní čísla.
2. Funkce zpoždění
Aktuální cena závisí na minulé ceně. Vytváříme „zpožděné“ verze dat (t-1, t-2, t-5), abychom dali modelu časový kontext.
3. Funkce interakce
Kombinace dvou ukazatelů často odhalí více než jeden samotný. Například „Objem * Změna ceny“ nám poskytuje Peněžní tok.
Vyhněte se nadměrnému vybavení
Přidání příliš mnoha funkcí vede k „prokletí dimenzionality“. Model je zmatený hlukem. K výběru pouze nejpůsobivějších funkcí používáme techniky jako PCA (Principal Component Analysis).
Náš přístup
V TradingMaster se naše Analýza trhu opírá o upravenou sadu více než 200 proprietárních funkcí, testovaných na odolnost v různých tržních podmínkách.
Související články
Prediktivní analytika vs. Technická analýza
Pohled přes čelní sklo vs. pohled do zpětného zrcátka. Zásadní rozdíl mezi standardní TA a AI.
Význam dat pro zpětné testování (Backtesting)
Minulá výkonnost nezaručuje budoucí výsledky, ale je to nejlepší prediktor, který máme. Proč musíte simulovat, než začnete obchodovat.
Modely strojového učení ve financích
Od LSTM po Náhodné lesy. Srozumitelné vysvětlení konkrétních algoritmů pohánějících TradingMaster.
