IA y Educación: Directorios de Herramientas de IA, Extensiones para Chrome y la presentación de Gemini
Este artículo pertenece a una serie donde cada semana comparto una selección curada de lecturas sobre Inteligencia Artificial y Educación. Espero que te resulte interesante. Si quieres estar al tanto de cada nueva publicación te recomiendo que o bien te suscribas al feed del blog con una herramienta como feedly, o bien te suscribas vía e-mail. Encontrarás ambas opciones en la columna lateral.
En esta ocasión, además de otras lecturas, encontrarás varios directorios de herramientas de IA que te serán de utilidad para explorar posibles herramientas para usar tanto en el aula como para tu propio desarrollo profesional. También te hablo de tres extensiones con IA de Chrome que uso habitualmente y que me facilitan enormemente la navegación por Internet y la gestión de contenidos digitales. Finalmente, el gran tema de la semana, Google ha presentado Gemini, una familia de modelos multimodales que prometen igualar, o incluso mejorar, las prestaciones de los servicios de Google a las que actualmente ofrecen las de Microsoft gracias a GPT. ¡Comenzamos!
En el artículo Recursos Edu&IA: ética en IA, asistentes virtuales basados en GPT y herramientas que no necesitan registro enlazaba el grupo de Telegram ChatGPT-IA-edu que modera Juanjo de Haro un buen espacio para el intercambio de recursos educativos relacionados con la Inteligencia Artificial. Otro grupo de Telegram más que interesante, al que te recomiendo que te suscribas, es Inteligencia Artificial en Educación, que puso en marcha y gestiona otro buen amigo: Javier Monteagudo. En este grupo, que ya ha superado los mil usuarios, encontrarás no sólo herramientas y aplicaciones de la IA en el aula, sino también artículos para seguir profundizando en el impacto de la IA en el ámbito educativo. Entre los recursos que he descubierto gracias a este grupo durante esta última semana destacaría AIgor, una web que te permite crear mapas conceptuales mediante IA a partir de fotos, audios y textos.
Otro de los recursos compartidos a través de este grupo durante los últimos días es una reciente publicación [17 de noviembre] del Departamento de Educación del Gobierno de Australia: se trata del Marco Australiano para el uso de Inteligencia Artificial Generativa en las Escuelas. El objetivo de este marco es orientar en el uso responsable y ético de herramientas de IA generativa de manera que beneficie al alumnado, a las escuelas y a la sociedad. El marco comprende seis principios: Enseñanza y Aprendizaje, Bienestar Humano y Social, Transparencia, Equidad y Responsabilidad y, finalmente, Privacidad y Seguridad [entendida esta última en un sentido amplio de protección contra daños, que podría incluirse en el ámbito de protección de datos y ciberseguridad].
En las dos últimas páginas del documento se detallan los principios fundamentales que desarrollan cada uno de los principios de este interesante marco.
El pasado martes tuve ocasión de compartir aula con el alumnado de secundaria de mi amiga Irene de Haro y uno de sus alumnos me preguntaba sobre el funcionamiento ‘interno’ de los modelos de lenguaje natural como GPT. Recordó que el neozelandés Brendan Bycroft ha creado una página web para visualizar un LLM similar al que está detrás de ChatGPT. La visualización, renderizada en 3D, muestra todos los pasos para ejecutar una inferencia de un solo token.
Si te interesa estar al día en las herramientas de IA disponibles puedes usar alguno de los siguientes directorios, que organizan las mismas por categorías:
- AIfindy. Directorio en castellano que cuenta con más de 50 categorías, entre las que destacan la de Educación, la de Asistentes, la de herramientas de Texto a Voz, Análisis de Datos o las vinculadas a GPT. Una misma herramienta puede aparecer en varias categorías. Cuenta también con un blog cuyos contenidos tienen toda la pinta de estar elaborados con IA generativas. Para cada herramienta se muestra el tipo de uso que permite [gratuita, fremium o de pago, y en este último caso el precio de la licencia].
- Futurepedia. La sección de categorías muestra un listado de categorías y subcategorías, indicando el número de herramientas que hay en cada una de estas últimas. Por ejemplo, dentro de la categoría «Imágenes», podemos encontrar subcategorías como Arte [con 147 herramientas], Avatares [con 109 herramientas] o Generadores de Imágenes [con 266 herramientas]. En este caso la web está en inglés pero además de la info del tipo de uso que permite cada herramienta ofrece una valoración social que puede servir de indicador a la hora de probar unas u otras herramientas.
Desde nuestra querida México, y de la mano de Andrea Oviedo, nos llega la siguiente infografía realizada con Genially con la Tabla Periódica de Aplicaciones Gratuitas de Inteligencia Artificial [puedes pasar el cursor por encima de cada icono para que te muestre una breve descripción y el enlace a la aplicación]:
Una forma muy práctica de utilizar herramientas de IA es mediante las extensiones del navegador web, esos superpoderes que los desarrolladores vienen incorporando a los diferentes navegadores y que nos permiten ampliar las posibilidades de interacción con los contenidos que vamos visitando. Yo trabajo con dos navegadores, Chrome y Firefox, aunque paso más tiempo en el primero que el segundo, así es que es ahí [en Google Chrome] donde tengo más extensiones instaladas. Te dejo a continuación tres de mis favoritas:
- YouTube Summary with ChatGPT & Claude es una extensión gratuita para Chrome, que combina las tecnologías de ChatGPT y Claude [el asistente de IA desarrollado por Anthropic], para resumir rápidamente videos de YouTube, artículos web y PDFs. Esta extensión cuenta con más de 900.000 descargas y 484 valoraciones, con una media de 4,1 sobre 5.
- Grammarly: Grammar Checker and AI Writing App es la extensión para Chrome de una aplicación de escritorio multiplataforma que te ofrece sugerencias en tiempo real para ayudarte a escribir lo mejor posible en línea [en inglés], sin importar qué aplicación estés usando en tu navegador. A través de un pequeño botón con desplegable te va mostrando sugerencias cuando identifica errores gramaticales. Esta extensión cuenta con más de 51M de descargas y 41900 valoraciones, con una media de 4,5/5.
- Monica – Tu asistente de inteligencia artificial GPT-4, es una extensión multifunción que usa diferentes herramientas de IA generativa para facilitar el trabajo. El plan gratuito permite hacer 40 consultas diarias. El Plan Unlimited además de acceso a GPT-4 permite consultas diarias ilimitadas. Mónica no sólo te permite resumir, traducir, reescribir, expandir, revisar gramaticalmente o explicar textos, sino que también es capaz de responder a preguntas o explicar códigos de programación. Actualmente supera el millón de usuarios y con más de 9000 valoraciones tiene una puntuación de 4,9/5.
La siguiente imagen muestra el aspecto de la ventana del navegador al hacer una búsqueda, y como el asistente propone contenidos y nuevas preguntas para expandir los resultados:
Puedes buscar las versiones de estas extensiones para Firefox, Safari y Microsoft Edge.
Y terminamos con la gran noticia de la semana, Google presentó el pasado 6 de diciembre Gemini, una nueva familia de modelos multimodales desarrollado por el equipo Google DeepMind, que muestra novedosas capacidades para la comprensión de imágenes, audio, video y texto, y que entran por tanto en la batalla por un espacio que había conquistado y monopolizado OpenAI durante todo el año 2023 con GPT. La familia Gemini incluye modelos de diferentes tamaños: Ultra, Pro y Nano, adecuados para aplicaciones que van desde tareas de razonamiento complejo hasta casos de uso con restricciones de memoria en dispositivos, y que serán implementadas en los distintos productos de Google. Por ejemplo Gemini Nano irá a Pixel, el smartphone de Google. El siguiente vídeo es un buen resumen de las capacidades de esta nueva familia de modelos de IA multimodal:
En paralelo a las publicaciones en su blog, Google ha compartido un artículo que lleva por título Gemini: A Family of Highly Capable Multimodal Models [pdf], en el que el equipo de investigación detalla la arquitectura de los modelos, la infraestructura de entrenamiento, el conjunto de datos de entrenamiento y varias evaluaciones que muestran que el modelo Gemini Ultra, el más potente de la familia, avanza el estado del arte en 30 de 32 puntos de referencia examinados. El documento también aborda la implementación responsable de estos modelos, incluyendo la evaluación de impacto, las políticas de modelos y las medidas para reducir o contrarrestar los efectos de estos modelos antes de las decisiones de despliegue. Además, se discuten las implicaciones más amplias de Gemini, sus limitaciones y sus posibles aplicaciones, allanando el camino para una nueva era de investigación e innovación en inteligencia artificial.
La siguiente imagen [puedes pinchar sobre ella para ampliarla], extraída del artículo citado anteriormente, muestra la capacidad de estos modelos para entender prompts multimodales, en este caso combinando texto con una imagen que incluye la resolución de un problema de física por parte de un alumno. En el prompt se pide que razone el problema paso a paso y que, si la respuesta del alumno no es correcta, indique dónde está el error y cuál sería la solución correcta. Incluso es capaz de usar LaTeX para escribir la notación matemática en la resolución del problema.
Carlos Santana, en su habitual excelente labor de divulgación sobre los avances de la IA, nos dejó el pasado miércoles 6 de diciembre este directo donde repasaba las publicaciones de Google en torno a Gemini. Te dejo el vídeo y te deseo un buen fin de semana:
Imagen de cabecera | Generada con Dall·e respondiendo al siguiente prompt: A classroom scene with a majority of caucasian primary school students in the foreground, including two boys and two girls. They are engaging with technology tools for learning. The background features other students in a blurred effect. The classroom is modern, well-lit, and has educational decor.