Enseñando a los Modelos de Lenguaje a usar Herramientas
Enseñando a modelos a usar herramientas de lenguaje
El uso de herramientas nos hace más capaces como seres humanos. ¿Es lo mismo cierto para los LLM?

A medida que aprendemos más sobre ellos, los modelos de lenguaje grandes (LLMs) se vuelven cada vez más interesantes. Estos modelos pueden resolver una variedad de tareas complejas con precisión. Al mismo tiempo, sin embargo, tienen dificultades con ciertas funcionalidades que nosotros, como seres humanos, consideramos básicas. Por ejemplo, los LLMs suelen cometer errores aritméticos, carecen de acceso a información actualizada e incluso tienen dificultades para comprender la progresión del tiempo. Ante estas limitaciones, podríamos preguntarnos qué se puede hacer para que los LLMs sean más capaces. ¿Están condenados los LLMs a sufrir estas limitaciones para siempre?
Muchos avances en la raza humana han sido catalizados por el acceso a herramientas nuevas e innovadoras (por ejemplo, la imprenta o la computadora). ¿Podría aplicarse el mismo hallazgo a los LLMs? En esta descripción general, estudiaremos una dirección reciente de investigación que tiene como objetivo enseñar a los LLMs cómo utilizar herramientas externas, que se ponen a disposición a través de API de texto a texto simples. Utilizando estas herramientas, los LLMs pueden delegar tareas como realizar cálculos aritméticos o buscar información actualizada en una herramienta especializada. Luego, la información devuelta por esta herramienta puede ser utilizada como contexto por el LLM al generar la respuesta, lo que lleva a respuestas más precisas y fundamentadas.
![(de [1] y ChatGPT Plus)](https://miro.medium.com/v2/resize:fit:640/format:webp/0*R2NjIxyxXQCJQMtg.png)
Hacer que los LLMs sean más capaces
Darle a un LLM acceso a una herramienta externa es una forma confiable de resolver algunas de las limitaciones que enfrentan estos modelos. Sin embargo, los LLMs no sabrán cómo utilizar las herramientas de forma natural, lo que plantea la pregunta: ¿Cómo enseñamos a nuestro modelo a aprovechar las herramientas externas? En esta sección, exploraremos algunas de las opciones que tenemos y enumeraremos varias herramientas útiles para construir aplicaciones de LLMs.
Diferentes tipos de aprendizaje

Enseñar a un LLM a aprovechar las herramientas no es diferente a aprender cómo resolver cualquier otra tarea con un LLM. Dado que estos modelos aprenden de varias formas, repasaremos…