2 artículos con la etiqueta #performance.
Técnicas para reducir el costo, la latencia y los recursos necesarios para ejecutar modelos de lenguaje en producción, desde cuantización hasta serving distribuido.
Paradigma de React donde los componentes se ejecutan en el servidor, enviando solo HTML al cliente, reduciendo el bundle de JavaScript y mejorando el rendimiento.