¿Cómo hacer de la IA un aliado fiable?

Imagen generada con ChatGPT

Imagen generada con ChatGPT ¿Dejarías que un agente de IA gestionara tu correo y respondiera en tu nombre? ¿O que clasificara automáticamente a tus potenciales clientes y les enviara mensajes comerciales?

Si has respondido que sí al menos a una de estas preguntas, sigue leyendo.

🕒 Resumen para gente con prisa

Tiempo estimado de lectura del artículo completo: 10 minutos.

La IA no es magia. Es una herramienta que, bien usada, puede multiplicar la productividad, y mal usada, puede convertirse en una fábrica de errores convincentes. Los modelos de lenguaje son impresionantes, sí, pero carecen de juicio. Y por eso la clave no está en dejarles el control, sino en diseñarles un marco claro: cuándo usarlos, cómo limitar su alcance y en qué no delegar jamás.

Aquí propongo una guía práctica para domar los LLM: usar programación clásica cuando la tarea es determinista, definir buenos prompts con contexto y objetivo, elegir el modelo adecuado según la tarea y siempre, siempre, validar el resultado humano en mano.

También hablo de la importancia de tener planes de respaldo, personalizar los modelos con tus propios datos y no dejarse cegar por la moda del automatismo total.

La IA puede ser un aliado fiable si la tratamos con la misma disciplina que cualquier otra herramienta. Pero si esperamos milagros, acabaremos recibiendo respuestas poéticas… y equivocadas.

El talento y la trampa de los LLM

La IA, y en concreto los LLM, es capaz de realizar tareas sorprendentes: redactar artículos, resumir libros, generar imágenes realistas o incluso componer música. Y en muchas ocasiones lo hace con una calidad asombrosa.

El problema es que carecen de juicio. Y junto a sus conocidas alucinaciones (información inventada que se presenta como cierta), esto se convierte en un riesgo. Por ejemplo, un LLM podría escribir sobre el descubrimiento de América y afirmar con total seguridad que ocurrió en 1378 en lugar de 1492.

En mi experiencia profesional, donde uso LLM para marketing, gestión comercial y desarrollo de software, la fiabilidad es siempre un reto. La clave no es renunciar a estas herramientas, sino aprender a poner límites y diseñar mecanismos que las hagan más aprovechables y seguras.

En este artículo quiero compartir una serie de técnicas para que las aproveches en tu día a día.

Si se puede programar, prográmalo

Cualquier tarea que pueda resolverse con un algoritmo determinista no debería delegarse a la IA. Para eso tenemos la programación clásica. La IA es buena para lo difuso: interpretar, detectar patrones, resumir, generar ideas.

La IA puede hacer muchas cosas, pero pedirle que calcule una suma es como contratar a un poeta para llevar la contabilidad.

La importancia de un buen prompt

Al igual que las personas, los LLM necesitan contexto. Un buen prompt es la diferencia entre un resultado mediocre y uno brillante. Existen diversas técnicas más o menos probadas. A mí me funciona muy bien RCO (Rol-Contexto-Objetivo), pero supongo que varía según la tarea o el área de especialización.

Funciona muy bien definir un rol de partida. De esta manera, el modelo limita su campo de búsqueda a un área concreta y ofrece mejores resultados. El contexto le da al modelo información suficiente para acotar su respuesta. Por último, el objetivo define lo que queremos que nos proporcione.

**Rol:**Actúa como un coach experto en productividad y organización personal, especializado en ayudar a profesionales con exceso de carga de trabajo a mejorar su gestión del tiempo.

**Contexto:**Estoy trabajando en varios proyectos a la vez y tengo la sensación de no avanzar. Cada día surgen tareas urgentes que me obligan a posponer las importantes. Además, dedico mucho tiempo a reuniones improductivas y me cuesta concentrarme durante largos periodos.

**Objetivo:**Necesito que me propongas un plan de trabajo semanal que me ayude a:

Reducir el tiempo perdido en reuniones.
Mejorar mi capacidad de concentración.
Organizar las tareas por prioridad.
Incluye ejemplos concretos de rutinas diarias, técnicas de gestión del tiempo (como Pomodoro o GTD) y una tabla con un modelo de horario semanal adaptable.

Hay otras opciones interesantes, como el formato de salida. Yo lo uso mucho cuando trabajo con APIs para interactuar con un modelo. Les pido que me devuelvan la respuesta en formato JSON, CSV, XML, y puedo validarla para detectar posibles errores.

También puedes ponerle límites, o si quieres parecer entendido, constraints o guardrails:

No superes las 400 palabras y limita cada recomendación a un máximo de 3 frases.
Usa un tono profesional y empático, sin frases motivacionales vacías ni citas de autoayuda.
No incluyas referencias a métodos pseudocientíficos ni menciones a figuras públicas.

Por último, puedes usar un modelo para pedirle que te genere un prompt estructurado y completo, que puedes ajustar manualmente antes de enviarlo.

No mates moscas a cañonazos

No siempre hace falta usar el modelo más grande o sofisticado. Si necesitas clasificar correos por urgencia, un modelo pequeño y rápido será más eficiente que uno de última generación. GPT-4o puede ser útil para crear el boceto de un plan de negocio. Mistral o Gemini Flash son más que suficientes para clasificar correos.

Eso sí, no confíes en que un modelo te recomiende cuál es el mejor modelo para realizar cada tarea porque no suelen tener información fiable o actualizada, y además podrían presentar sesgos interesados.

Ten un plan B (y C)

Hay situaciones en las que un modelo proporciona un resultado más satisfactorio que otros, y no siempre depende de que sea un modelo propicio para ese caso de uso, como hemos visto en el apartado anterior.

En este escenario, es recomendable que un modelo actúe como plan de respaldo del principal. Por ejemplo, en Vinicio, nuestro sommelier virtual, si ChatGPT dice que un vino no existe, lanzamos la misma consulta a Grok. Puede que el primero falle, pero el segundo acierte. Incluso se pueden encadenar tres o más modelos si el bolsillo te da para ello.

Personaliza la experiencia

Cada vez más modelos permiten usar datos privados para enriquecer sus respuestas, como NotebookLM de Google, o más recientemente, ChatGPT con el concepto de proyectos.

Puedes subir documentos de una gran variedad de formatos, incluidos multimedia y código fuente, que el modelo analiza y tiene en cuenta como contexto predeterminado en sus respuestas. Esto es algo que también hacen ya muchos asistentes de código, lo que facilita inmensamente abarcar bases de código muy extensas.

Verifica siempre lo esencial

Como gestores de modelos, no debemos delegar nunca la verificación de calidad. Confiar ciegamente en un modelo es garantía de catástrofe antes o después. Sólo una persona tiene el discernimiento suficiente para saber si algo es correcto o incorrecto.

Yo estoy totalmente en contra de la delegación de tareas críticas a modelos o agentes no supervisados. ¿Cómo vas a dejar que acudan a una reunión por ti? Si llegamos a ese punto, estamos reconociendo que ya no somos necesarios, y entonces, como decía José Mota, ir pa ná es tontería.

No te quites de la ecuación

La IA es poderosa pero no infalible, y como dice mi buen amigo Hipólito, una de las personas más inteligentes que conozco, estos fallos “no son un bug que se puede resolver con poco esfuerzo sino algo emergente de la tecnología”.

Nuestra labor no es, por tanto, echarnos a un lado y dejar que la IA asuma todas nuestras competencias, sino aprender a integrarla con criterio. Por mucho que ahora proliferen los “expertos en IA”, seguimos en una fase muy temprana en la que toca equivocarse y aprender muchísimo de nuestros errores.

🚀 Cada semana reflexiones como esta en tu bandeja. Suscríbete a Charcos Tecnológicos