Cuantización de LLM (GPTQ, AWQ, SmoothQuant): guía práctica para correr modelos baratos (y bien)

Qué método usar según GPU/CPU, latencia y calidad. Incluye checklist de “errores típicos” (y cómo medir la pérdida real).

GUÍAS & TUTORIALES

2/28/2026