LLM

Large Language Model: modelo de lenguaje de gran escala entrenado con enormes cantidades de texto para entender y generar lenguaje natural.

Qué es

Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado con cantidades masivas de texto para aprender patrones del lenguaje humano. Puede entender instrucciones en lenguaje natural y generar texto coherente y útil.

Los ejemplos más conocidos: GPT-4 (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta).

Por qué importa

Los LLMs son el núcleo de casi todas las aplicaciones de IA generativa actuales. Chatbots, asistentes de código, generadores de contenido, sistemas de análisis de documentos — todos se construyen sobre LLMs.

Cómo funcionan (sin matemáticas)

Un LLM aprende prediciendo la siguiente palabra (o token) en un texto, millones de veces, con textos de toda la internet. Después de este entrenamiento, ha internalizado patrones del lenguaje tan complejos que puede responder preguntas, razonar, traducir, programar y mucho más.

Modelos principales (2026)

| Modelo | Empresa | Notas | |---|---|---| | Claude Sonnet/Opus | Anthropic | Excelente en razonamiento y seguir instrucciones | | GPT-4o | OpenAI | Multimodal, muy versátil | | Gemini 1.5 Pro | Google | Context window enorme | | Llama 3 | Meta | Open source, para uso local | | Mistral | Mistral AI | Eficiente, open source |

LLM vs aplicación de IA

Un LLM es el motor. Una aplicación de IA es el vehículo completo. ChatGPT es una aplicación construida sobre GPT-4. Un agente de soporte es una aplicación construida sobre un LLM con system prompt, herramientas y base de conocimiento.

Limitaciones importantes

Conocimiento limitado a la fecha de corte del entrenamiento
Puede "alucinar" (generar información incorrecta con confianza)
No tiene acceso a información privada sin RAG o herramientas
No recuerda conversaciones anteriores sin memoria explícita