jonmatumalpha
conceptosnotasexperimentosensayos

© 2026 Jonatan Mata · alpha · v0.1.0

#inference

2 artículos con la etiqueta #inference.

  • llms.txt

    Estándar propuesto para publicar un archivo Markdown en la raíz de un sitio web que permite a los modelos de lenguaje entender y utilizar el contenido del sitio de forma eficiente durante la inferencia.

    growing#llms-txt#ai#web-standards#seo#agents#markdown#inference
  • Optimización de Inferencia

    Técnicas para reducir el costo, la latencia y los recursos necesarios para ejecutar modelos de lenguaje en producción, desde cuantización hasta serving distribuido.

    seed#inference#optimization#quantization#latency#serving#llm#performance
Todas las etiquetas