Overfitting en backtests para traders de prop firm

El backtest más fácil de vender suele ser el que no sobreviviría mañana. El overfitting es lo que pasa cuando una estrategia aprende las rarezas de la muestra que la creó en vez del edge que podría sobrevivir en real.

Para un trader de prop firm, ese error sale caro dos veces. Primero pagas la evaluación. Luego vuelves a pagar cuando una estrategia que parecía impecable in-sample se topa con costes reales, drawdown real y reglas de pérdida basadas en el camino.

Qué significa realmente el backtest overfitting

Backtest overfitting significa que la estrategia fue ajustada al ruido histórico, no a un comportamiento de mercado repetible. La curva de equity parece precisa porque el modelo se volvió demasiado familiar con los datos que le dieron forma.

Esto suele pasar por alguna mezcla de caza de parámetros, apilar reglas, elegir el régimen bonito y volver a testear una y otra vez sobre la misma muestra. Ningún paso de esos es automáticamente incorrecto. El problema empieza cuando cada ajuste nuevo se juzga sobre la misma historia vieja, hasta que la estrategia deja de generalizar y empieza a memorizar.

Por eso una curva in-sample preciosa demuestra bastante menos de lo que la gente cree. Una curva ordenada puede significar simplemente que el modelo se volvió muy bueno respondiendo el examen de ayer.

Por qué un trader de prop firm lo paga más caro

Un comprador cualquiera de estrategias puede equivocarse despacio. Un trader de prop firm muchas veces no puede.

Las reglas de una prop firm dependen del camino. Un sistema puede tener esperanza positiva a largo plazo y aun así fallar si el tramo malo llega antes de que el edge tenga tiempo de trabajar. Esa es la lógica detrás de cómo funcionan en la práctica el límite de pérdida diaria y la pérdida máxima: la cuenta no falla porque el trade medio fuera malo. Falla porque el camino de pérdidas fue intolerable el día que importó.

Los sistemas sobreajustados son especialmente peligrosos bajo esas reglas porque suelen ser frágiles. A menudo dependen de un régimen, de un entorno de volatilidad o de una textura de mercado muy concreta que casualmente existió en la muestra de diseño. Cuando las condiciones cambian en real, la curva suave se vuelve dentada muy rápido.

Por eso la pregunta de un trader de prop firm no es solo "¿esto es rentable?". Es "¿sobrevive al contacto con un futuro distinto?". Las matemáticas del fondeo van de riesgo del camino, que es justo por lo que cómo modela realbacktesting el tiempo hasta el fondeo y el payout importa más que cualquier métrica de titular favorecedora.

Cuatro señales que suelen decir que la curva está ajustada al pasado

Ninguna señal por sí sola demuestra overfitting, pero estos patrones deberían hacerte frenar.

Señal	Lo que suele significar	Qué preguntar después
Demasiados parámetros ajustables para muy poca evidencia	El modelo puede estar memorizando ruido	¿Cuántos parámetros se ajustaron en relación con el número de trades y años?
Sin prueba out-of-sample, o con un out-of-sample flojo	El edge puede vivir solo en la muestra de entrenamiento	¿Qué pasa en datos realmente apartados?
El edge desaparece cuando añades costes reales	La señal era demasiado fina para sobrevivir al trading real	¿Qué queda después de spread, comisión, swap y slippage?
Un mercado, un año o un régimen hizo casi todo el trabajo	La estrategia puede depender del régimen en vez de ser robusta	¿Sigue comportándose bien en tests walk-forward bajo condiciones distintas?

La primera fila es la trampa clásica. Más parámetros no matan automáticamente una estrategia, pero cada grado extra de libertad sube la exigencia de prueba. Un sistema de tres reglas y uno de treinta no deberían recibir el mismo beneficio de la duda.

La segunda fila es la que más importa. Si el tramo out-of-sample falta, es minúsculo o es claramente más débil que el tramo in-sample pulido, eso no es una nota al pie. Es el evento principal. Una explicación limpia de esto está en nuestra guía sobre out-of-sample testing.

La tercera y la cuarta fila son donde muchos traders de prop firm se la pegan. Una estrategia que solo funciona con costes idealizados o solo durante un año muy tendencial no es lo bastante robusta para una cuenta con reglas. No necesitas una estrategia perfecta. Necesitas una que sobreviva a estar un poco equivocada.

Qué aspecto tiene un proceso de validación más duro

La cura del overfitting no es una estadística mágica. Es un proceso más duro.

Empieza por un test con datos apartados. Una estrategia debería enfrentarse a datos que nunca vio durante el diseño. Luego haz ese test más exigente con retests sucesivos a lo largo del tiempo, que es por lo que el walk-forward testing importa. Un split limpio es útil. Varios splits no vistos son mejores.

Luego añade fricción de trading real. Si el edge no sobrevive a spread, comisión, swap y slippage, nunca fue gran cosa. realbacktesting deja claro ese modelo de costes en methodology.html, porque una curva sin costes te dice casi nada sobre la supervivencia en real.

Después, estresa el camino. Monte Carlo y el análisis de drawdown no predicen el futuro, pero sí te dicen si el camino histórico fue un orden afortunado de trades o algo más sólido. Para prop trading, esa diferencia es práctica y no académica.

La idea de todo esto es simple: un proceso robusto debería hacer que la estrategia parezca peor antes de ganarse el derecho a parecer creíble.

Qué prueba realbacktesting, y qué no

realbacktesting publica sistemas verificables y listos para prop firm en cTrader. La parte útil no es el eslogan. Es la cadena de pruebas.

La metodología publicada actual es explícita: barras M1 del broker de cTrader de 2021-2026, una base modelo de 80,000 EUR, spread real por símbolo, comisión, swap y 1 bps de slippage, 100% de paridad de señal en 13 estrategias y 175,401 barras, y techos de drawdown impuestos en el percentil 95 de 20,000 simulaciones de Monte Carlo, después comprobados en un hold-out out-of-sample del 30%. Esos números están ahí para que un trader escéptico inspeccione el método en vez de admirar el marketing.

El límite honesto importa igual. Esa cadena de pruebas no convierte un backtest en un track record real. Hace que el backtest sea más difícil de falsear y más fácil de reproducir. Eso es una mejora relevante, no una garantía.

Preguntas frecuentes

¿Puede una estrategia tener un win rate alto y aun así estar sobreajustada?

Sí. Un win rate alto puede venir de reglas ajustadas demasiado de cerca a una muestra histórica concreta. Si la lógica no generaliza, el futuro en real lo expondrá rápido.

¿Basta un único split out-of-sample para descartar overfitting?

No. Un tramo out-of-sample es necesario, pero no es un sello mágico de aprobación. Los retests a través del tiempo, los costes reales y el estrés del camino siguen importando.

¿Más complejidad siempre significa más overfitting?

No automáticamente. Algunas estrategias de verdad necesitan más piezas móviles. El punto es que más complejidad exige más pruebas, no más confianza.

¿Por qué el overfitting perjudica más a los traders de prop firm que a otros traders?

Porque las cuentas de prop firm fallan por el camino de las pérdidas, no por la teoría de largo plazo. Un sistema frágil puede romper reglas de pérdida diaria o total antes de que su supuesta esperanza positiva tenga tiempo de importar.

La conclusión terca

La pregunta no es si un backtest parece listo. La pregunta es si sigue pareciendo honesto después de quitarle la ventaja de jugar en casa.

Una estrategia sobreajustada no falla porque el mercado fuera injusto. Falla porque el backtest aprendió el pasado con demasiado detalle como para sobrevivir al siguiente régimen.

Qué significa realmente el backtest overfitting#

Por qué un trader de prop firm lo paga más caro#

Cuatro señales que suelen decir que la curva está ajustada al pasado#

Qué aspecto tiene un proceso de validación más duro#

Qué prueba realbacktesting, y qué no#

Preguntas frecuentes#

¿Puede una estrategia tener un win rate alto y aun así estar sobreajustada?#

¿Basta un único split out-of-sample para descartar overfitting?#

¿Más complejidad siempre significa más overfitting?#

¿Por qué el overfitting perjudica más a los traders de prop firm que a otros traders?#

La conclusión terca#

Qué significa realmente el backtest overfitting

Por qué un trader de prop firm lo paga más caro

Cuatro señales que suelen decir que la curva está ajustada al pasado

Qué aspecto tiene un proceso de validación más duro

Qué prueba realbacktesting, y qué no

Preguntas frecuentes

¿Puede una estrategia tener un win rate alto y aun así estar sobreajustada?

¿Basta un único split out-of-sample para descartar overfitting?

¿Más complejidad siempre significa más overfitting?

¿Por qué el overfitting perjudica más a los traders de prop firm que a otros traders?

La conclusión terca