Benchmark contamination: por qué los rankings de LLM pueden mentirte (sin que nadie “haga trampas”)

Si un benchmark se cuela en el entrenamiento, las métricas se inflan. Qué es la contaminación, cómo detectarla y cómo evaluar mejor.

OPINIÓN & FUTURO

3/5/2026