La empresa desarrolladora de herramientas de Inteligencia Artificial, Open IA, presentó una nueva versión del ChatGPT que permite el procesamiento y la creación de texto, audio y video. Radio UNNE dialogó con especialistas del Grupo de Investigación en Calidad de Software de la Facultad de Ciencias Exactas y Naturales y Agrimensura (FaCENA) sobre las características del aplicativo.
Emanuel Irrazabal, docente y director del equipo, explicó que GPT significa Generative Pre-Trained Transformer (transformador generativo preentrenado). Se trata de un modelo de lenguaje basado en inteligencia artificial, capaz de ser perfeccionado: las preguntas e interacciones suman información que, a base de correcciones a lo largo del tiempo, va “entrenándose” para realizar de forma automática la tarea para la que ha sido diseñada.
Irrazabal detalló que el ChatGPT se destaca por su capacidad de interacción con el usuario. Desde su lanzamiento en el 2018, fueron presentadas diferentes innovaciones, pero fue su versión 3.5 del año 2022 que generó el boom: las últimas mediciones de Open IA dieron cuenta de que en el mes de abril tuvieron 180.5 millones de usuarios activos en todo el mundo.
“Estamos ante una siguiente generación de tecnología. Hace un año y medio ya tenía cientos de gigas de información que lo habían alimentado para tener conversaciones. Sólo un giga de información se estima que es como leer 12 horas al día durante tres años. Es decir que había leído e interpretado 200 años de información”, señaló el investigador.
“En su nueva versión, esta capacidad se multiplicó por 10. Ahora ha sido mejorada y agilizada, es capaz de responder en tiempo real”, destacó Irrazabal. A la fecha, el chatbot estaba entrenado para trabajar con tareas relacionadas con el lenguaje escrito. La versión 4o también procesa imágenes, audios y videos, resuelve problemas matemáticos y puede describir los objetos que le muestran los usuarios a través de la cámara de su dispositivo.
“El chat GPT es el presente y el futuro”, aseveró Irrazabal y explicó que, así como alrededor del principio del milenio las recomendaciones de estudio extracurricular eran la informática y el inglés, el cambio de época invita a que “nos hagamos buenos en ChatGPT”. “Debemos perfeccionarnos todos cómo ingenieros de prompt. Generacionalmente nos fuimos haciendo mejores en el uso de la informática y los dispositivos digitales, pasará lo mismo con esta herramienta”, sostuvo.
Ser buenos ingenieros
Andrea Lezcano, licenciada en Sistemas de la Información y estudiante del Doctorado en Informática (FaCENA) participó del diálogo con la 99.7 y anticipó que las potencialidades del ChatGPT-4º “apuntan a explotar esta tecnología para optimizar los procesos, las tareas y hacer más sencillo y más eficiente”.
“La o viene de omnicanal, que significa todos los canales. Antes procesaba sólo texto y ahora también acepta entradas de imágenes, audio, video”. La investigadora indicó que la clave de este desarrollo está en la ingeniería de prompt o ingeniería de las instrucciones: “es la entrada que le damos a estos modelos para interactuar con ellos, se trata de refinar, reajustar estas interacciones para tener la mejor respuesta posible o la más óptima”.
“No va a ser lo mismo que le pregunte qué es la fotosíntesis, a que se ponga en un determinado rol y que me explique qué es la fotosíntesis como si fuera un tutor de biología para el nivel secundario. Van a ser respuestas bastante diferentes. Esta ingeniería va a refinar cómo nos comunicamos con estos modelos para obtener respuestas más variadas y precisas, la más óptima”, precisó Lezcano.
En su última versión, el ChatGPT ofrece un diálogo que también puede tener distintos roles y propósitos: percibe emociones y entonaciones, adapta su tono de conversación para generar respuestas más naturales según el contexto. Esta función está disponible en más de 50 idiomas, por lo que también tiene la habilidad de traducción e interpretación.