En los últimos años, los modelos de lenguaje de gran escala (LLMs) han demostrado capacidades relevantes en tareas como redacción, análisis de texto y recuperación de información. Sin embargo, su aplicación en contextos legales requiere una comprensión precisa de sus límites técnicos y de las arquitecturas necesarias para operar de forma confiable.
Este artículo describe los principales avances técnicos en inteligencia artificial que impactan el trabajo jurídico estructurado, así como las brechas actuales que deben resolverse para lograr sistemas más robustos.
Los LLMs actuales operan como sistemas de predicción de tokens basados en grandes volúmenes de texto. Su fortaleza principal es la capacidad de:
Desde un punto de vista técnico, estos modelos no “razonan” en sentido causal o simbólico. Funcionan como aproximadores estadísticos de distribuciones lingüísticas.
En el contexto legal, esto implica que su uso es especialmente efectivo en:
Una de las extensiones más relevantes es la incorporación de sistemas de recuperación de información (RAG), que permiten al modelo operar sobre fuentes externas.
Arquitectura básica:
Esto permite:
En flujos legales, RAG es fundamental para mantener consistencia normativa.
El uso de agentes introduce una capa de control sobre el comportamiento del modelo.
En lugar de una única interacción, se define un flujo compuesto por:
Este enfoque permite transformar al modelo en un componente dentro de un sistema mayor.
Ejemplo en un flujo legal:
A pesar de su utilidad, existen limitaciones estructurales relevantes:
Los LLMs no poseen representaciones internas de causalidad. No pueden:
Esto limita su uso en análisis complejos de responsabilidad o daño.
Los modelos no mantienen memoria continua del caso. Cada interacción depende de:
Por esta razón, cualquier sistema legal basado en IA requiere una capa adicional que gestione el estado del proceso, cronología y documentación acumulada.
La generación de “planes” por parte del modelo es principalmente secuencial y no implica exploración de múltiples escenarios. No existe:
Los modelos no tienen un mecanismo interno confiable para estimar su nivel de certeza. Esto implica que la confianza expresada en el texto no es necesariamente indicativa de precisión y se requieren validaciones externas.
Gran parte del funcionamiento práctico del sistema legal depende de factores no formalizados: tiempos reales de respuesta, prácticas administrativas y comportamientos recurrentes de actores. Este tipo de información no suele estar disponible en bases de datos estructuradas.
Dado lo anterior, la tendencia técnica no es reemplazar sistemas existentes, sino construir arquitecturas híbridas.
Una arquitectura típica incluye:
Este enfoque permite aumentar consistencia, reducir errores operativos y estandarizar procesos.
Existen varias áreas en desarrollo que pueden impactar estos sistemas:
Actualmente, estas líneas se encuentran en etapas tempranas o intermedias de desarrollo.
Los modelos de lenguaje actuales constituyen una herramienta eficiente para el procesamiento y generación de información jurídica, especialmente en tareas estructuradas y repetitivas.
Sin embargo, su uso efectivo requiere integrarlos dentro de sistemas más amplios que compensen sus limitaciones mediante estructuras de datos, validaciones y control de procesos.
El valor no se encuentra únicamente en el modelo, sino en la arquitectura que lo rodea.