LLM
Large Language Model: modelo de lenguaje de gran escala entrenado con enormes cantidades de texto para entender y generar lenguaje natural.
Qué es
Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado con cantidades masivas de texto para aprender patrones del lenguaje humano. Puede entender instrucciones en lenguaje natural y generar texto coherente y útil.
Los ejemplos más conocidos: GPT-4 (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta).
Por qué importa
Los LLMs son el núcleo de casi todas las aplicaciones de IA generativa actuales. Chatbots, asistentes de código, generadores de contenido, sistemas de análisis de documentos — todos se construyen sobre LLMs.
Cómo funcionan (sin matemáticas)
Un LLM aprende prediciendo la siguiente palabra (o token) en un texto, millones de veces, con textos de toda la internet. Después de este entrenamiento, ha internalizado patrones del lenguaje tan complejos que puede responder preguntas, razonar, traducir, programar y mucho más.
Modelos principales (2026)
| Modelo | Empresa | Notas | |---|---|---| | Claude Sonnet/Opus | Anthropic | Excelente en razonamiento y seguir instrucciones | | GPT-4o | OpenAI | Multimodal, muy versátil | | Gemini 1.5 Pro | Google | Context window enorme | | Llama 3 | Meta | Open source, para uso local | | Mistral | Mistral AI | Eficiente, open source |
LLM vs aplicación de IA
Un LLM es el motor. Una aplicación de IA es el vehículo completo. ChatGPT es una aplicación construida sobre GPT-4. Un agente de soporte es una aplicación construida sobre un LLM con system prompt, herramientas y base de conocimiento.
Limitaciones importantes
- Conocimiento limitado a la fecha de corte del entrenamiento
- Puede "alucinar" (generar información incorrecta con confianza)
- No tiene acceso a información privada sin RAG o herramientas
- No recuerda conversaciones anteriores sin memoria explícita
Términos relacionados
Pon en práctica lo que has aprendido
Tenemos una herramienta gratuita directamente relacionada con este concepto.
Comparador de modelos LLM →Artículo relacionado
→ Qué es Context EngineeringTérminos relacionados
Context Window
La cantidad máxima de texto (medida en tokens) que un modelo de lenguaje puede procesar en una sola llamada.
Fine-tuning
Proceso de ajuste de un modelo de lenguaje preentrenado con datos específicos de un dominio para mejorar su rendimiento en tareas concretas.
Tokens
Unidades básicas de texto que usan los modelos de lenguaje para procesar información. Los costes de API y los límites de context window se miden en tokens.
Temperature (LLM)
Parámetro que controla la aleatoriedad de las respuestas de un modelo de lenguaje. Valor entre 0 y 2: más bajo = más determinista, más alto = más creativo.
Recibe lo mejor de Contextología
Diseño de contexto, agentes y workflows de IA directamente en tu correo.