Serverless

¿Qué es?

Serverless es un modelo de ejecución en la nube donde el proveedor asigna recursos dinámicamente y cobra solo por el cómputo consumido. No significa «sin servidores» — significa que el desarrollador no los gestiona. El proveedor se encarga del aprovisionamiento, escalado, parches y disponibilidad.

Características fundamentales

Sin gestión de servidores: no hay instancias que configurar ni mantener
Escalado automático: de cero a miles de instancias según demanda
Pago por uso: se cobra por invocación/duración, no por tiempo idle
Event-driven: las funciones se ejecutan en respuesta a eventos

Servicios serverless en AWS

Servicio	Función
Lambda	Funciones como servicio (FaaS)
API Gateway	APIs HTTP/REST/WebSocket
DynamoDB	Base de datos NoSQL
S3	Almacenamiento de objetos
Step Functions	Orquestación de workflows
EventBridge	Bus de eventos
SQS / SNS	Mensajería

Patrones comunes

API backend: API Gateway → Lambda → DynamoDB
Procesamiento de eventos: S3 upload → Lambda → procesamiento
Workflows: Step Functions orquestando múltiples Lambdas
Cron jobs: EventBridge schedule → Lambda

Ventajas

Tiempo al mercado rápido
Costo cero cuando no hay tráfico
Escalado sin intervención
Menos superficie de ataque (sin OS que parchear)

Limitaciones

Cold starts: latencia en la primera invocación (ver análisis abajo)
Duración máxima: Lambda tiene límite de 15 minutos por invocación
Memoria: máximo 10 GB por función
Payload: 6 MB síncrono, 256 KB asíncrono
Concurrencia: 1.000 ejecuciones simultáneas por defecto (ampliable)
Vendor lock-in: APIs específicas de cada proveedor
Estado: las funciones son stateless por diseño — el estado va en DynamoDB, S3 o ElastiCache

Cold starts

El cold start ocurre cuando Lambda crea un nuevo entorno de ejecución. La latencia varía significativamente por runtime y tamaño del paquete:

Runtime	Cold start típico	Con SnapStart/provisioned
Node.js	100–300 ms	No aplica
Python	150–400 ms	No aplica
Java	1–3 s	200–400 ms con SnapStart
.NET	400–800 ms	100–200 ms con Native AOT
Rust/Go	10–30 ms	No necesario

Estrategias de mitigación:

Provisioned concurrency: mantiene instancias «calientes» — elimina cold starts pero tiene costo fijo
SnapStart (Java): snapshot del entorno inicializado, reduce cold start de segundos a milisegundos
Minimizar dependencias: paquetes más pequeños inicializan más rápido
Inicialización fuera del handler: el código fuera del handler se ejecuta una vez y se reutiliza

Serverless vs. contenedores

Criterio	Serverless (Lambda)	Contenedores (Fargate)
Duración máxima	15 minutos	Sin límite
Escalado	Automático, por invocación	Automático, por métricas (más lento)
Cold start	100 ms – 3 s	30–60 s (provisioning de tarea)
Costo en idle	$0	Costo por vCPU/memoria mientras corre
Costo en alto tráfico	Puede ser alto (por invocación)	Más predecible (por hora)
Estado	Stateless	Puede mantener estado en memoria
Networking	VPC opcional, ENI lento	VPC nativo, networking completo

Usar serverless cuando: tráfico variable o impredecible, ejecuciones cortas (menos de 15 min), equipos pequeños que quieren cero ops, arquitecturas event-driven.

Usar contenedores cuando: procesos de larga duración, necesidad de estado en memoria, tráfico constante y predecible, requisitos de networking complejos.

Modelado de costos

Lambda cobra $0.20 por millón de invocaciones más $0.0000166667 por GB-segundo. Para una API con 1 millón de requests/mes, 256 MB de memoria y 200 ms promedio:

Invocaciones: 1M × $0.20 = $0.20
Cómputo: 1M × 0.2s × 0.25 GB × $0.0000166667 = $0.83
Total: ~$1.03/mes

La misma carga en Fargate (0.25 vCPU, 0.5 GB, corriendo 24/7): ~$9.10/mes. Serverless gana en cargas variables. Pero a 100M requests/mes, Lambda cuesta ~$103 mientras Fargate sigue en ~$9.10 — el punto de cruce depende del patrón de tráfico.

Anti-patrones

Lambda monolítica: una función que hace todo — pierde las ventajas de escalado granular y aumenta cold starts
Cadenas Lambda-a-Lambda: invocar una Lambda desde otra directamente — usar Step Functions o SQS en su lugar
Sobre-orquestación: Step Functions para lógica que cabe en una sola función — añade latencia y costo innecesario
Ignorar límites de concurrencia: sin reserved concurrency, una función puede consumir toda la cuota de la cuenta
Funciones sin timeout: el timeout por defecto es 3 segundos, pero funciones sin ajustar pueden correr 15 minutos por error

¿Por qué importa?

Serverless elimina la gestión de servidores y el pago por capacidad ociosa. Para cargas de trabajo con tráfico variable — APIs, procesamiento de eventos, tareas programadas — el modelo de pago por ejecución puede reducir costos dramáticamente mientras escala automáticamente.

Referencias

Serverless Architectures — AWS — AWS, 2024. Documentación oficial de servicios serverless.
Serverless Land — AWS, 2024. Patrones, ejemplos y recursos para arquitecturas serverless.
Operating Lambda: Performance optimization — AWS Compute Blog, 2022. Análisis detallado de cold starts y estrategias de optimización.
Lambda concurrency — AWS, 2024. Documentación de concurrencia reservada y provisionada.
Serverless Framework — Serverless Inc, 2024. Framework multi-cloud para aplicaciones serverless.

¿Qué es?

Características fundamentales

Sin gestión de servidores: no hay instancias que configurar ni mantener
Escalado automático: de cero a miles de instancias según demanda
Pago por uso: se cobra por invocación/duración, no por tiempo idle
Event-driven: las funciones se ejecutan en respuesta a eventos

Servicios serverless en AWS

Servicio	Función
Lambda	Funciones como servicio (FaaS)
API Gateway	APIs HTTP/REST/WebSocket
DynamoDB	Base de datos NoSQL
S3	Almacenamiento de objetos
Step Functions	Orquestación de workflows
EventBridge	Bus de eventos
SQS / SNS	Mensajería

Patrones comunes

API backend: API Gateway → Lambda → DynamoDB
Procesamiento de eventos: S3 upload → Lambda → procesamiento
Workflows: Step Functions orquestando múltiples Lambdas
Cron jobs: EventBridge schedule → Lambda

Ventajas

Tiempo al mercado rápido
Costo cero cuando no hay tráfico
Escalado sin intervención
Menos superficie de ataque (sin OS que parchear)

Limitaciones

Cold starts: latencia en la primera invocación (ver análisis abajo)
Duración máxima: Lambda tiene límite de 15 minutos por invocación
Memoria: máximo 10 GB por función
Payload: 6 MB síncrono, 256 KB asíncrono
Concurrencia: 1.000 ejecuciones simultáneas por defecto (ampliable)
Vendor lock-in: APIs específicas de cada proveedor
Estado: las funciones son stateless por diseño — el estado va en DynamoDB, S3 o ElastiCache

Cold starts

El cold start ocurre cuando Lambda crea un nuevo entorno de ejecución. La latencia varía significativamente por runtime y tamaño del paquete:

Runtime	Cold start típico	Con SnapStart/provisioned
Node.js	100–300 ms	No aplica
Python	150–400 ms	No aplica
Java	1–3 s	200–400 ms con SnapStart
.NET	400–800 ms	100–200 ms con Native AOT
Rust/Go	10–30 ms	No necesario

Estrategias de mitigación:

Provisioned concurrency: mantiene instancias «calientes» — elimina cold starts pero tiene costo fijo
SnapStart (Java): snapshot del entorno inicializado, reduce cold start de segundos a milisegundos
Minimizar dependencias: paquetes más pequeños inicializan más rápido
Inicialización fuera del handler: el código fuera del handler se ejecuta una vez y se reutiliza

Serverless vs. contenedores

Criterio	Serverless (Lambda)	Contenedores (Fargate)
Duración máxima	15 minutos	Sin límite
Escalado	Automático, por invocación	Automático, por métricas (más lento)
Cold start	100 ms – 3 s	30–60 s (provisioning de tarea)
Costo en idle	$0	Costo por vCPU/memoria mientras corre
Costo en alto tráfico	Puede ser alto (por invocación)	Más predecible (por hora)
Estado	Stateless	Puede mantener estado en memoria
Networking	VPC opcional, ENI lento	VPC nativo, networking completo

Usar serverless cuando: tráfico variable o impredecible, ejecuciones cortas (menos de 15 min), equipos pequeños que quieren cero ops, arquitecturas event-driven.

Usar contenedores cuando: procesos de larga duración, necesidad de estado en memoria, tráfico constante y predecible, requisitos de networking complejos.

Modelado de costos

Lambda cobra $0.20 por millón de invocaciones más $0.0000166667 por GB-segundo. Para una API con 1 millón de requests/mes, 256 MB de memoria y 200 ms promedio:

Invocaciones: 1M × $0.20 = $0.20
Cómputo: 1M × 0.2s × 0.25 GB × $0.0000166667 = $0.83
Total: ~$1.03/mes

Anti-patrones

Lambda monolítica: una función que hace todo — pierde las ventajas de escalado granular y aumenta cold starts
Cadenas Lambda-a-Lambda: invocar una Lambda desde otra directamente — usar Step Functions o SQS en su lugar
Sobre-orquestación: Step Functions para lógica que cabe en una sola función — añade latencia y costo innecesario
Ignorar límites de concurrencia: sin reserved concurrency, una función puede consumir toda la cuota de la cuenta
Funciones sin timeout: el timeout por defecto es 3 segundos, pero funciones sin ajustar pueden correr 15 minutos por error

¿Por qué importa?

Referencias

Serverless Architectures — AWS — AWS, 2024. Documentación oficial de servicios serverless.
Serverless Land — AWS, 2024. Patrones, ejemplos y recursos para arquitecturas serverless.
Operating Lambda: Performance optimization — AWS Compute Blog, 2022. Análisis detallado de cold starts y estrategias de optimización.
Lambda concurrency — AWS, 2024. Documentación de concurrencia reservada y provisionada.
Serverless Framework — Serverless Inc, 2024. Framework multi-cloud para aplicaciones serverless.

Serverless

¿Qué es?

Características fundamentales

Servicios serverless en AWS

Patrones comunes

Ventajas

Limitaciones

Cold starts

Serverless vs. contenedores

Modelado de costos

Anti-patrones

¿Por qué importa?

Referencias

Contenido relacionado

Serverless

¿Qué es?

Características fundamentales

Servicios serverless en AWS

Patrones comunes

Ventajas

Limitaciones

Cold starts

Serverless vs. contenedores

Modelado de costos

Anti-patrones

¿Por qué importa?

Referencias

Contenido relacionado