In-context learning en serio: enseñando a tu modelo con pocos ejemplos
Inteligencia Artificial · Serie LLMs y n8n
In-context learning en serio: enseñando a tu modelo con pocos ejemplos
El modelo aprende del contexto que le das en cada petición. Con pocos ejemplos bien curados puedes guiar su comportamiento sin entrenar nada.
En el post anterior vimos cómo comparar prompts con justicia. Hoy damos el salto a in-context learning (ICL): el arte de elegir y escribir pocos ejemplos para que el modelo generalice correctamente. Es la herramienta más barata para subir calidad sin tocar pesos.
¿Qué es ICL (y qué no)?
- Es mostrar demostraciones (entrada → salida) dentro del prompt para que el modelo imite el patrón.
- No es reentrenar el modelo ni hacer fine-tuning.
- Clave: la calidad y representatividad de tus ejemplos importa más que su cantidad.
Cómo seleccionar buenos ejemplos
- Cobertura: incluye casos típicos, bordes y contrajemplos.
- Proximidad: que se parezcan al caso actual (dominio, idioma, estructura).
- Frescura: si tu dominio cambia, rota el banco de ejemplos periódicamente.
- Balance: evita sesgos (solo casos “bonitos” da resultados engañosos).
Tip Laravel: mantén un “banco de ejemplos” en DB con slug, input, output, tags, idioma, score y updated_at.
Formato que ayuda al modelo
- Delimita con etiquetas claras (p. ej.,
### Ejemplo,Entrada:,Salida:). - Homogeneidad: todos los ejemplos con la misma estructura y estilo.
- Contrato de salida: si quieres JSON, muestra JSON válido en los ejemplos.
- Brevity wins: ejemplos cortos y precisos > ejemplos largos con ruido.
¿Cuántos ejemplos usar?
No hay número mágico, pero como regla práctica:
- 1–2 (one/few-shot): tareas simples o muy bien definidas.
- 3–5: clasificación/transformación con variación moderada.
- 6–8: solo si cada ejemplo aporta un patrón distinto y tienes contexto de sobra.
Recuerda: más ejemplos consumen tokens y pueden diluir la instrucción principal.
Orden y señal
- Del general al caso: pon primero las reglas y el contrato de salida.
- Ejemplos → tarea: ejemplos antes de la entrada real, con el mismo formato.
- Ejemplo “negativo”: uno que muestre qué no hacer puede ser muy útil.
Plantillas de ICL
1) Extracción estructurada (JSON)
Rol: Eres un extractor estricto. Devuelve SOLO JSON válido.
Esquema:
{"nombre":"string","fecha_iso":"YYYY-MM-DD|null","monto":"number|null"}
### Ejemplo 1
Entrada:
"Factura ACME emitida el 2024-11-03 por 129,50 USD para Juan Pérez."
Salida:
{"nombre":"Juan Pérez","fecha_iso":"2024-11-03","monto":129.5}
### Ejemplo 2 (sin monto explícito)
Entrada:
"Orden de compra de Ana García, 3 de mayo de 2025."
Salida:
{"nombre":"Ana García","fecha_iso":"2025-05-03","monto":null}
### Tarea
Entrada:
{TEXTO_REAL}
Salida:
2) Clasificación multietiqueta
Rol: Clasificador. Devuelve {"labels":["..."]} usando solo etiquetas permitidas.
Etiquetas permitidas: ["soporte","factura","legal","marketing"]
### Ejemplo
Entrada: "No llegó mi pedido, ayuda urgente."
Salida: {"labels":["soporte"]}
### Tarea
Entrada: {TEXTO}
Salida:
3) Normalización de estilo
Rol: Editor. Reescribe el texto con tono profesional, 120-150 palabras, sin adjetivos superfluos.
### Ejemplo
Entrada: "Esto es super genial y cambia todo!"
Salida: "Este enfoque aporta mejoras concretas y medibles..."
### Tarea
Entrada: {PARRAFO}
Salida:
Anti-patrones frecuentes
- Ejemplos inconsistentes (formatos distintos entre sí).
- Relleno (historias largas irrelevantes).
- Mezclar idiomas sin aclararlo.
- Casos irrelevantes para la consulta actual (baja proximidad).
- Olvidar el “no sé” cuando falta evidencia.
Micro-workflow en n8n: “Banco de ejemplos dinámico”
- Webhook → recibe
{task, query, lang}. - Function → deriva tags a partir de
task(ej. "extraccion", "facturas"). - HTTP Request → consulta tu API/DB de ejemplos con
tags,langy orden porscoreyupdated_at. - Function → compone el prompt: reglas + 3–5 ejemplos + tarea.
- LLM → ejecuta y devuelve respuesta.
- Database → guarda costo, latencia, éxito y ejemplos usados (para feedback y rotación).
Tip: si el output falla validación, reintenta con menos ejemplos o con los de mayor score.
Conclusión
ICL bien hecho = ejemplos breves, consistentes y cercanos al caso real, con contrato de salida claro. Construye un banco curado, selecciona dinámicamente y mide. Es la vía rápida para mejorar sin reentrenar.
← Anterior: Cómo evaluar prompts sin sesgos (y elegir el mejor)
Artículos Relacionados
Continúa explorando contenido similar.
El impacto transformador de la realidad aumentada en la educación
Leer artículo
Patrones de prompt reutilizables que todo desarrollador debería conocer
Leer artículo
RAG con feedback humano: mejora continua para tu asistente inteligente
Leer artículo
Tokens, contexto y costos: lo que debes saber antes de empezar
Leer artículo
El rol del médico en el mundo automatizado
Leer artículo
SLAs realistas en proyectos de IA: qué puedes prometer (y qué no)
Leer artículo
Realidad aumentada y 3D en procedimientos quirúrgicos
Leer artículo
Seguridad en agentes: protege tu sistema de usos peligrosos o no deseados
Leer artículo
Del notebook al producto: llevando tu proyecto de IA a producción
Leer artículo
Big Data clínico: cómo el análisis de millones de historias salva vidas
Leer artículo
Operación integral de IA con n8n: datos de calidad, resiliencia e integración práctica
Leer artículo
Bases de datos vectoriales explicadas fácil (y cuándo no las necesitas)
Leer artículo
Mapa mental de la Inteligencia Artificial moderna
Leer artículo