Semantic Search
Búsqueda por significado en lugar de por palabras exactas. Usa embeddings para encontrar contenido relevante aunque no coincidan las palabras clave.
Qué es
Semantic search (búsqueda semántica) es una técnica de búsqueda que entiende el significado de la consulta en lugar de buscar coincidencias exactas de palabras. Usa embeddings para encontrar contenido conceptualmente relacionado.
Por qué importa
La búsqueda por palabras clave tiene un problema fundamental: requiere que el usuario use exactamente las mismas palabras que están en el documento. La búsqueda semántica entiende la intención.
Búsqueda por keywords: "cancelar suscripción" → Solo encuentra documentos con esas palabras exactas
Búsqueda semántica: "cancelar suscripción" → También encuentra "dar de baja", "anular mi cuenta", "dejar de pagar el servicio"
Cómo funciona
- Los documentos se convierten en embeddings (vectores numéricos)
- La consulta también se convierte en embedding
- Se calcula la similitud coseno entre la consulta y todos los documentos
- Se devuelven los más similares
Aplicaciones principales
- Motor de RAG: recuperar fragmentos relevantes para responder preguntas
- Búsqueda interna de documentos corporativos
- Sistemas de recomendación de contenido
- Detección de duplicados o contenido similar
- Clasificación automática de tickets o solicitudes
Búsqueda híbrida
En producción, la búsqueda semántica pura no siempre es suficiente. La búsqueda híbrida combina:
- Dense retrieval: búsqueda semántica por embeddings
- Sparse retrieval: búsqueda por palabras clave (BM25)
La combinación suele dar mejores resultados que cualquiera de las dos por separado, especialmente para términos técnicos, nombres propios o códigos específicos.
Errores comunes
- Esperar que la búsqueda semántica funcione bien para términos muy técnicos o acrónimos sin contexto
- No usar búsqueda híbrida en producción
- No filtrar por metadatos antes de la búsqueda vectorial (afecta rendimiento y relevancia)
Términos relacionados
Pon en práctica lo que has aprendido
Tenemos una herramienta gratuita directamente relacionada con este concepto.
Analizador de context window →Artículo relacionado
→ Qué es RAGTérminos relacionados
Embeddings
Representaciones numéricas de texto que capturan su significado semántico. Son la base de la búsqueda semántica, RAG y muchas aplicaciones de IA.
RAG
Retrieval-Augmented Generation: técnica que combina búsqueda de información en una base de conocimiento con generación de texto para producir respuestas precisas y verificables.
Vector Database
Base de datos especializada en almacenar embeddings y buscar por similitud semántica. Componente central de los sistemas RAG.
Reranking
Paso de un pipeline RAG que reordena los documentos recuperados por relevancia real antes de pasarlos al modelo generador.
Recibe lo mejor de Contextología
Diseño de contexto, agentes y workflows de IA directamente en tu correo.