Lab · ML Experiments

ML — Pattern Discovery

Inverted workflow: find conditional edges in BTC data first, build strategies second.
55 experiments

Master-LGBM ohne ETF — Robustness Check

Done
2026-05-19 auditvalidationlightgbmvol-forecast
Hypothesis
Wenn ETF-Flow keine kausale Forward-Info trägt (B4-Befund: residual IC +0.075, CI inkludiert 0), liefert Master-LGBM ohne `etf_flow` Feature nahezu identischen R²-Lift gegen HAR-RV. Ein Drop > 1 pp wäre ein Alarm-Signal, dass das Feature doch Lookahead trägt.
Verdict
**MASTER-LGBM ROBUST** — Entfernung von etf_flow ändert R²-Lift um nur -0.14 pp (10.60 → 10.74). Beide Versionen sind weit über dem 3 pp Promote-Gate. Das Master-LGBM-Ergebnis ist NICHT von einem ETF-Lookahead getragen. Top-Features bleiben: log_rv_7d_ann, iv_ann, stablecoin_d7.
R2_HAR_RV
+0.5541
n_windows
13
R2_LGBM_no_ETF
+0.6615
lift_pp_no_ETF
+10.7397
R2_LGBM_with_ETF
+0.6601
lift_pp_with_ETF
+10.6018
top_3_features_no_etf
['log_rv_7d_ann', 'iv_ann', 'stablecoin_d7']
etf_marginal_contribution_pp
-0.1379

Master-LGBM ohne ETF — Robustness Check

2026-05-19 · status: done · 34.0s

Hypothesis: Wenn ETF-Flow keine kausale Forward-Info trägt (B4-Befund: residual IC +0.075, CI inkludiert 0), liefert Master-LGBM ohne etf_flow Feature nahezu identischen R²-Lift gegen HAR-RV. Ein Drop > 1 pp wäre ein Alarm-Signal, dass das Feature doch Lookahead trägt.

Verdict: MASTER-LGBM ROBUST — Entfernung von etf_flow ändert R²-Lift um nur -0.14 pp (10.60 → 10.74). Beide Versionen sind weit über dem 3 pp Promote-Gate. Das Master-LGBM-Ergebnis ist NICHT von einem ETF-Lookahead getragen. Top-Features bleiben: log_rv_7d_ann, iv_ann, stablecoin_d7.

Key metrics

metric value
R2_HAR_RV +0.5541
R2_LGBM_with_ETF +0.6601
R2_LGBM_no_ETF +0.6615
lift_pp_with_ETF +10.6018
lift_pp_no_ETF +10.7397
etf_marginal_contribution_pp -0.1379
top_3_features_no_etf ['log_rv_7d_ann', 'iv_ann', 'stablecoin_d7']
n_windows 13

Approach

Replikat des Master-LGBM Setups (Exp #22) mit einer einzigen Änderung: Feature etf_flow aus dem all-features-Set entfernt. Vergleicht den OOS R² gegen Baseline HAR-RV und gegen das Original LGBM-mit-ETF. Wenn der Robustness-Check passt, sollte der R²-Lift ohne ETF ähnlich hoch sein.

Pooled OOS comparison

model R2_log IC Lift_vs_HAR_pp n_oos
HAR-RV (baseline) 0.5541 0.7258 0 28,464
LGBM with ETF 0.6601 0.8114 10.6 28,464
LGBM WITHOUT ETF 0.6615 0.8123 10.74 28,464

Marginal-Beitrag des ETF-Features

  • LGBM-mit-ETF Lift: +10.60 pp über HAR-RV

  • LGBM-ohne-ETF Lift: +10.74 pp über HAR-RV

  • Verlust durch ETF-Entfernung: -0.14 pp

Per-window R² (13 windows)

window n har_r2 lgbm_etf_r2 lgbm_no_etf_r2 delta_r2_pp
2023-01-02 → 2023-04-02 2160 0.5331 0.6229 0.6229 0
2023-04-02 → 2023-07-02 2184 0.2852 0.3959 0.3959 0
2023-07-02 → 2023-10-02 2208 0.4665 0.5605 0.5605 0
2023-10-02 → 2024-01-02 2208 0.4091 0.5426 0.5426 0
2024-01-02 → 2024-04-02 2184 0.5275 0.6247 0.6247 0
2024-04-02 → 2024-07-02 2184 0.55 0.6357 0.6377 0.1938
2024-07-02 → 2024-10-02 2208 0.4311 0.5627 0.5665 0.3801
2024-10-02 → 2025-01-02 2208 0.4802 0.6849 0.6916 0.6759
2025-01-02 → 2025-04-02 2160 0.5895 0.7009 0.7107 0.9832
2025-04-02 → 2025-07-02 2184 0.5167 0.6349 0.6332 -0.172
2025-07-02 → 2025-10-02 2208 0.4577 0.6366 0.6385 0.1894
2025-10-02 → 2026-01-02 2208 0.482 0.6484 0.6482 -0.0161
2026-01-02 → 2026-04-02 2160 0.5446 0.7112 0.7118 0.0593

Top-10 Features im ETF-freien LGBM (mean gain)

feature mean_gain
log_rv_7d_ann 473.5
iv_ann 407.5
stablecoin_d7 373.5
hour_cos 365.2
ret_7d 361.9
log_rv_1d_ann 355.8
dow 333.1
ret_24h 299.5
hour_sin 272.6
funding_cum_1d 234.9

per-window R²