Ai And M L
作者
Sarah Jenkins
1 分钟阅读
特征工程:ML 模型的秘密武器

垃圾进来,垃圾出去。这是数据科学的黄金法则。你可以拥有世界上最先进的神经网络,但如果你向它提供原始的、嘈杂的价格数据,它就会失败。 特征工程是将原始数据转换为有意义的输入的艺术。
什么是功能?
在交易中,“价格”是原始数据。
- RSI(相对强度指数) 是源自价格的特征。
- 波动率 (ATR) 是一项功能。
- 一天中的时间是一项功能。
转型的艺术
有效的特征工程涉及创建突出预测模式的输入。
1. 标准化
价格差异很大(比特币价格为 100 美元 vs 100,000 美元)。我们对输入进行标准化(例如,使用对数返回或 Z 分数),以便模型看到相对变化,而不是绝对数字。
2. 滞后特征
当前价格取决于过去价格。我们创建数据的“滞后”版本(t-1、t-2、t-5)来为模型提供时间上下文。
3.交互功能
结合两个指标通常可以揭示不止一个指标。例如,“成交量 * 价格变化”为我们提供了资金流。
避免过度拟合
添加太多功能会导致“维度诅咒”。模型因噪声而变得混乱。我们使用 PCA(主成分分析)等技术来仅选择最有影响力的特征。
我们的方法
在 TradingMaster,我们的市场分析 依赖于一组精选的 200 多个专有功能,并在不同的市场条件下测试了稳健性。
