Jonatan Matajonmatum.com

conceptos notas experimentos ensayos

© 2026 Jonatan Mata. All rights reserved.v2.1.1

#inference

2 artículos con la etiqueta #inference.

llms.txt
Estándar propuesto para publicar un archivo Markdown en la raíz de un sitio web que permite a los modelos de lenguaje entender y utilizar el contenido del sitio de forma eficiente durante la inferencia.
growing #llms-txt #ai #web-standards #seo #agents #markdown #inference
Optimización de Inferencia
Técnicas para reducir el costo, la latencia y los recursos necesarios para ejecutar modelos de lenguaje en producción, desde cuantización hasta serving distribuido.
seed #inference #optimization #quantization #latency #serving #llm #performance

Todas las etiquetas