Reranking
Paso de un pipeline RAG que reordena los documentos recuperados por relevancia real antes de pasarlos al modelo generador.
Qué es Reranking
Reranking es un paso del pipeline RAG que toma los documentos recuperados inicialmente (por similitud vectorial) y los reordena usando un modelo más preciso antes de pasarlos al LLM.
La búsqueda vectorial es rápida pero imprecisa: ordena por distancia coseno, no por relevancia real. El reranker aplica un modelo más sofisticado (cross-encoder) que evalúa cada par (consulta, documento) directamente.
Por qué importa
La búsqueda vectorial puede recuperar 50 candidatos en milisegundos. Pero los primeros resultados no siempre son los más útiles. El reranker selecciona los 5-10 mejores de esos 50 con mucha mayor precisión.
Sin reranking, el LLM recibe fragmentos que son "parecidos" semánticamente pero puede que no respondan exactamente la pregunta.
Cómo se usa
1. Búsqueda vectorial → top-50 candidatos por similitud coseno
2. Reranker evalúa cada (query, chunk) → score de relevancia
3. Selecciona top-10 por score de reranker
4. LLM recibe esos 10 fragmentos como contexto
Los rerankers más usados:
- Cohere Rerank — API lista para usar, muy precisa
- BGE Reranker — modelo open source, autohosteable
- Cross-encoders de sentence-transformers — flexible, varios tamaños
Cuándo añadirlo
El reranking vale la pena cuando:
- La búsqueda vectorial recupera documentos irrelevantes con frecuencia
- Tienes un corpus grande con muchos documentos similares
- La precisión de los resultados es más importante que la latencia
Añade ~100-300ms de latencia pero mejora significativamente la calidad del RAG.
Errores comunes
Reranquear muy pocos candidatos: Si la búsqueda vectorial solo devuelve 5 candidatos, el reranker tiene poco con qué trabajar. Mejor: busca 20-50, reranquea, quédate con los mejores 5.
Usar reranking sin medir: Añadir reranking y asumir que mejora. Mide con RAGAS u otro framework antes y después.
Términos relacionados
- [[rag]] — El pipeline en el que vive el reranking
- [[embeddings]] — La búsqueda vectorial que precede al reranking
- [[semantic-search]] — La técnica que el reranking mejora
Pon en práctica lo que has aprendido
Tenemos una herramienta gratuita directamente relacionada con este concepto.
Checklist de RAG →Artículo relacionado
→ Qué es RAGTérminos relacionados
Embeddings
Representaciones numéricas de texto que capturan su significado semántico. Son la base de la búsqueda semántica, RAG y muchas aplicaciones de IA.
RAG
Retrieval-Augmented Generation: técnica que combina búsqueda de información en una base de conocimiento con generación de texto para producir respuestas precisas y verificables.
Semantic Search
Búsqueda por significado en lugar de por palabras exactas. Usa embeddings para encontrar contenido relevante aunque no coincidan las palabras clave.
Vector Database
Base de datos especializada en almacenar embeddings y buscar por similitud semántica. Componente central de los sistemas RAG.
Recibe lo mejor de Contextología
Diseño de contexto, agentes y workflows de IA directamente en tu correo.