Ingeniería de funciones: la salsa secreta de los modelos ML

Basura entra, basura sale. Ésta es la regla de oro de la ciencia de datos. Puede tener la red neuronal más avanzada del mundo, pero si le proporciona datos de precios sin procesar y ruidosos, fallará. Ingeniería de funciones es el arte de transformar datos sin procesar en entradas significativas.
¿Qué es una característica?
En el comercio, el "precio" son datos sin procesar.
- RSI (Índice de Fuerza Relativa) es una característica derivada del precio.
- La volatilidad (ATR) es una característica.
- Hora del día es una característica.
El arte de la transformación
La ingeniería de características eficaz implica la creación de entradas que resalten patrones predictivos.
1. Normalización
Los precios varían enormemente (Bitcoin a 100 dólares frente a 100.000 dólares). Normalizamos las entradas (por ejemplo, utilizando retornos logarítmicos o puntuaciones Z) para que el modelo vea cambios relativos, no números absolutos.
2. Funciones de retraso
El precio actual depende del precio pasado. Creamos versiones "retrasadas" de datos (t-1, t-2, t-5) para darle contexto temporal al modelo.
3. Funciones de interacción
La combinación de dos indicadores a menudo revela más de uno por sí solo. Por ejemplo, "Volumen * Cambio de precio" nos da Flujo de dinero.
Evitar el sobreajuste
Agregar demasiadas funciones conduce a la "maldición de la dimensionalidad". El modelo se confunde con el ruido. Utilizamos técnicas como PCA (Análisis de componentes principales) para seleccionar solo las funciones más impactantes.
Nuestro enfoque
En TradingMaster, nuestro Análisis de mercado se basa en un conjunto seleccionado de más de 200 funciones patentadas, cuya solidez se ha probado en diferentes condiciones del mercado.
¿Listo para poner en práctica tus conocimientos?
Comience a operar con confianza impulsada por IA hoy
ComenzarArtículos relacionados
Analítica Predictiva vs. Análisis Técnico
Mirar a través del parabrisas vs. mirar por el espejo retrovisor. La diferencia fundamental entre el AT estándar y la IA.
La Importancia de los Datos de Backtesting
El rendimiento pasado no garantiza resultados futuros, pero es el mejor predictor que tenemos. Por qué debes simular antes de operar.
Modelos de Aprendizaje Automático en Finanzas
De LSTM a Random Forests. Una explicación sencilla de los algoritmos específicos que impulsan a TradingMaster.
