Reranking — Glosario de IA

Paso de un pipeline RAG que reordena los documentos recuperados por relevancia real antes de pasarlos al modelo generador.

Qué es Reranking

Reranking es un paso del pipeline RAG que toma los documentos recuperados inicialmente (por similitud vectorial) y los reordena usando un modelo más preciso antes de pasarlos al LLM.

La búsqueda vectorial es rápida pero imprecisa: ordena por distancia coseno, no por relevancia real. El reranker aplica un modelo más sofisticado (cross-encoder) que evalúa cada par (consulta, documento) directamente.

Por qué importa

La búsqueda vectorial puede recuperar 50 candidatos en milisegundos. Pero los primeros resultados no siempre son los más útiles. El reranker selecciona los 5-10 mejores de esos 50 con mucha mayor precisión.

Sin reranking, el LLM recibe fragmentos que son "parecidos" semánticamente pero puede que no respondan exactamente la pregunta.

Cómo se usa

1. Búsqueda vectorial → top-50 candidatos por similitud coseno
2. Reranker evalúa cada (query, chunk) → score de relevancia
3. Selecciona top-10 por score de reranker
4. LLM recibe esos 10 fragmentos como contexto

Los rerankers más usados:

Cohere Rerank — API lista para usar, muy precisa
BGE Reranker — modelo open source, autohosteable
Cross-encoders de sentence-transformers — flexible, varios tamaños

Cuándo añadirlo

El reranking vale la pena cuando:

La búsqueda vectorial recupera documentos irrelevantes con frecuencia
Tienes un corpus grande con muchos documentos similares
La precisión de los resultados es más importante que la latencia

Añade ~100-300ms de latencia pero mejora significativamente la calidad del RAG.

Errores comunes

Reranquear muy pocos candidatos: Si la búsqueda vectorial solo devuelve 5 candidatos, el reranker tiene poco con qué trabajar. Mejor: busca 20-50, reranquea, quédate con los mejores 5.

Usar reranking sin medir: Añadir reranking y asumir que mejora. Mide con RAGAS u otro framework antes y después.

Términos relacionados

[[rag]] — El pipeline en el que vive el reranking
[[embeddings]] — La búsqueda vectorial que precede al reranking
[[semantic-search]] — La técnica que el reranking mejora