Ai And M L
작성자
Sarah Jenkins
1분 읽기
기능 엔지니어링: ML 모델의 비밀 소스

쓰레기는 들어가고 쓰레기는 나옵니다. 이것이 데이터 과학의 황금률입니다. 세계에서 가장 발전된 신경망을 가질 수 있지만 원시적이고 시끄러운 가격 데이터를 제공하면 실패할 것입니다. 기능 엔지니어링은 원시 데이터를 의미 있는 입력으로 변환하는 기술입니다.
기능이란 무엇입니까?
거래에서 "가격"은 원시 데이터입니다.
- **RSI(Relative Strength Index)**는 가격에서 파생되는 특성입니다.
- **변동성(ATR)**은 기능입니다.
- 시간대는 기능입니다.
변화의 예술
효과적인 기능 엔지니어링에는 예측 패턴을 강조하는 입력 생성이 포함됩니다.
1. 정규화
가격은 매우 다양합니다(비트코인 $100 대 $100,000). 모델이 절대 숫자가 아닌 상대적 변화를 볼 수 있도록 입력을 정규화합니다(예: 로그 반환 또는 Z-점수 사용).
2. 지연 기능
현재 가격은 과거 가격에 따라 달라집니다. 모델에 시간적 맥락을 제공하기 위해 "지연된" 버전의 데이터(t-1, t-2, t-5)를 생성합니다.
3. 상호작용 기능
두 개의 지표를 결합하면 종종 하나 이상의 지표가 드러납니다. 예를 들어 '볼륨 * 가격 변화'는 돈 흐름을 제공합니다.
과적합 방지
너무 많은 기능을 추가하면 "차원성의 저주"가 발생합니다. 모델은 소음으로 인해 혼란스러워집니다. 우리는 PCA(주성분 분석)와 같은 기술을 사용하여 가장 영향력 있는 기능만 선택합니다.
우리의 접근 방식
TradingMaster의 시장 분석은 다양한 시장 상황에서 견고성을 테스트한 200개 이상의 독점 기능으로 구성된 선별된 세트를 사용합니다.
