ChatGPT y los modelos de lenguaje natural
Desde que OpenAI lanzara ChatGPT a finales de noviembre del año pasado, las herramientas de inteligencia artificial más populares y que más polémica han generado son las IA generativas de texto. En el ámbito escolar y académico la polémica ha llegado a través de noticias sobre tareas escolares realizadas por ChatGPT, exámenes superados por ChatGPT [como la prueba para la obtención de la licencia médica en USA] o la prohibición en algunos congresos del uso de este tipo de herramientas para generar artículos científicos. Sobre las mejoras de rendimiento de los sucesivos modelos de ChatGPT en la superación de tests escolares o académicos ha dado información la propia OpenAI.
ChatGPT, la herramienta de OpenAI que ahora mismo cuenta con dos versiones [GPT-3.5 de acceso gratuito y GPT-4 de pago], es una IA generativa de texto, un tipo de herramienta que se engloba en una categoría más genérica que sería el de los modelos de lenguaje natural basados en inteligencia artificial. En particular, ChatGPT está basado en una tecnología clave para el desarrollo de estos modelos, los Transformers, que permiten identificar relaciones entre palabras situadas a gran distancia en un texto, lo cual permite a la herramienta comprender el contexto de una forma más efectiva.
Ya en 2018, cuando OpenAI lanzó su primera versión de ChatGPT [GPT-1], Google trabajaba en la mejora de las funcionalidades de su buscador a través de inteligencia artificial mediante el desarrollo de BERT [acrónimo de Bidirectional Encoder Representations from Transformers], su propio modelo de lenguaje natural que buscaba ajustar los resultados de las búsquedas permitiendo a Google Search comprender el contexto de la cadena de términos facilitados por el usuario. Llevamos por tanto años usando, sin ser conscientes de ello, herramientas mejoradas con tecnologías de inteligencia artificial.
Además de los modelos Transformer, ChatGPT y otros modelos de lenguaje natural son modelos pre-entrenados con grandes cantidades de texto. Adicionalmente el aprendizaje supervisado y el aprendizaje por refuerzo juegan un papel clave para mejorar los resultados que ofrecen las IA generativas. Así es que sin ser tampoco conscientes, también llevamos años entrenando a muchas de estas herramientas a través de los famosos captchas que encontramos en numerosas páginas web para demostrar que no somos un bot. Comenzamos reconociendo caracteres para terminar identificando semáforos, vehículos o cualquier otro objeto en imágenes, esto último especialmente útil para el entrenamiento de IA generativas de imágenes como Midjourney o DALL·E.
Si aún no has utilizado [conscientemente] una IA generativa de texto, puedes hacerlo directamente con ChatGPT y su versión gratuita sin más que acceder con tu correo electrónico y vinculando tu número de teléfono. Esta versión gratuita de ChatGPT ha sido entrenada con millones de páginas web pero sólo tiene acceso a información hasta septiembre de 2021, ya que es en el momento en el que completó su entrenamiento. Por tanto, si necesitas información sobre la situación actual en Ucrania o en la Franja de Gaza no conseguirás nada útil en esta versión. Quienes tienen contratado ChatGPT Plus, que da acceso a GPT-4, sí que podrán conseguir información relevante ya que esta versión de ChatGPT puede navegar por Internet y acceder, por tanto, a fuentes de información actualizadas.
Si quieres probar la experiencia de GPT-4 sin pagar la suscripción mensual de 20$, puedes probar con Bing, el navegador de Microsoft que incluye un chatbot conversacional conectado a Internet basado en GPT-4. Esta opción, además de gratuita, te permitirá también tener acceso a la IA generativa de imágenes de OpenAI (DALL·E 3), accesible vía GPT4. El acceso gratuito [debes tener cuenta de correo de Microsoft] tiene como consecuencia una mayor latencia del servicio, y a veces aplica filtros de automoderación en relación a determinadas creaciones, especialmente en el caso de imágenes, con los que GPT-4 no presenta [al menos esa es a la conclusión a la que llegamos @mallemar y servidor haciendo experimentos el pasado jueves en Madrid].
El uso de GPT-4 desde Bing es posible en primer lugar gracias al acuerdo [millonario] entre Microsoft y OpenAI, y en segundo lugar a la posibilidad de acceder, desde el pasado 6 de julio, a la API de GPT-4 por parte de los desarrolladores. Así es como han surgido herramientas como la española LuzIA, un asistente virtual integrado en WhatsApp que te permite acceder a la potencia de ChatGPT desde tu dispositivo móvil y sin pagar nada, incluida la generación de imágenes. En este caso hay una limitación a 5 imágenes diarias, y para solicitarlas debes empezar tu Prompt usando la palabra «Imagina».
Para usar Luzia en tu móvil [o en la opción web de WhatsApp] no tienes más que acceder a la web luzia.com desde tu navegador y hacer clic en «Pruébalo» [esquina superior derecha de tu pantalla]. A continuación, se abrirá la aplicación de WhatsApp y podrás comenzar a interactuar con LuzIA.
El acceso a la tecnología de ChatGPT desde Bing o Luzia nos da la pista de cómo vamos a utilizar las herramientas de inteligencia artificial de aquí en adelante. No como herramientas específicas a las que accedamos desde su propia página web o App, sino integradas en diferentes herramientas que ya utilizamos desde hace tiempo. Estas integraciones permiten expandir y aumentar las funcionalidades de herramientas ya conocidas. Es el caso de Canva, que ha incorporado una nueva funcionalidad, Magic Write, para crear textos. Otro ejemplo: Shortly.ai, un asistente de escritura basado en ChatGPT que puede generar artículos sobre casi cualquier tema en pocos minutos.
¿Para qué podemos utilizar una IA generativa de texto?
Los modelos de lenguaje natural basados en inteligencia artificial hacen algunas cosas muy bien y pueden ser de gran ayuda en el día a día, tanto para el docente como para el aprendiz. Podemos usarlas para:
- Clasificar: podemos introducir información y pedirle que la ordene, la clasifique o la agrupe. Podemos dar información explícita sobre los criterios que queremos que siga, si simplemente dejar al modelo que identifique patrones y nos haga una propuesta.
- Tabular información: podemos pedirle que nos devuelva cierta información en formato tabla, incluso ampliando la misma a partir de la información con la que ha sido entrenado. No deja de ser una forma de organizar o clasificar información, pero en este caso conviene facilitar qué columnas queremos que tenga la tabla.
- Resumir: podemos pedirle que nos haga un resumen de un texto o que destaque las ideas claves.
- Buscar: podemos pedirle que amplíe información de un tema o que nos de información sobre una cuestión en particular. La limitación en este caso está en las fuentes con las que ha sido entrenada la IA y si tiene o no acceso a información a través de búsquedas en Internet.
- Editar: podemos introducir un texto y pedirle que lo reelabore cambiando el tono o enfoque del mismo.
- Elaborar listas: sobre una temática específica podemos pedirle que nos elabore un listado.
- Romper el folio en blanco: a veces lo más complicado de un proceso creativo es el primer paso. Estas tecnologías pueden ser nuestras particulares musas, y darnos algunas ideas con las que empezar a trabajar.
Y cerramos este resumen dominical sobre IA, centrado especialmente en los modelos de lenguaje natural y las IA generativas de texto, con una recomendación televisiva: The Architect, serie noruega dirigida por Kerren Lumer-Klabbers y disponible en Filmin que presenta un sombrío retrato de un futuro donde el turbocapitalismo y la deshumanización comparten escenario con la inteligencia artificial. La historia sigue a una joven arquitecta que se ve forzada a trabajar como becaria y vivir en un estacionamiento subterráneo, ya que las élites de la ciudad han abandonado sus residencias, dejando los estacionamientos vacíos. Estas infraviviendas se dividen por líneas de pintura blanca y cortinas finas, donde trabajadores precarios luchan contra la pobreza. La serie destaca las duras realidades de la vida en un mundo cada vez más desigual y la ilusión de que la pobreza sea una moda.