Más información sobre los anuncios de OpenAI en ChatGPT4-o

Publicado el

17/5/2024

GPT-4o encarna realmente la convergencia de tecnologías para ofrecer una experiencia de usuario sin precedentes

Francis Lelong, CEO de Alegria.group, analiza los anuncios de OpenAI de mayo de 2024

Me complace anunciar un gran avance en el campo de la Inteligencia Artificial, ¡que supone un progreso significativo hacia la interacción perfecta con la tecnología! Sí, estoy hablando del nuevo modelo multimodal de OpenAI, GPT-4o, un gran paso hacia una interacción hombre-máquina más natural y fluida que nunca.

GPT-4o encarna realmente la convergencia de tecnologías para ofrecer una experiencia de usuario sin precedentes. Imagine poder comunicarse con un sistema informático utilizando cualquier medio: texto, audio, imagen o vídeo, y obtener respuestas en el mismo formato, ya sea texto, audio o imagen. Esto ya es posible gracias a OpenAI y a su increíble innovación, GPT-4o.

Lo que hace que GPT-4o sea realmente excepcional es su capacidad para comprender y responder a las entradas de audio en un tiempo récord, tan rápido como 232 milisegundos, con una media de 320 milisegundos. Este nivel de capacidad de respuesta es comparable al tiempo de respuesta humano en una conversación, y obviamente estamos pensando en todas las posibilidades que esto abre en los centros de llamadas, por ejemplo.

Pero eso no es todo. GPT-4o también ofrece un rendimiento notable en términos de comprensión y visión del lenguaje natural. Iguala el rendimiento de GPT-4 Turbo en texto y código en inglés, al tiempo que ofrece una mejora significativa en texto en otros idiomas, incluido, por supuesto, el francés. Después de hacer algunas pruebas desde ayer, ¡es realmente muy rápido! Además, es un 50% más barato en términos de uso de la API, lo cual no es nada desdeñable si tenemos en cuenta los problemas de recursos que plantea el uso de la IA a gran escala.

Para lograr estos impresionantes resultados, OpenAI se ha replanteado la forma en que los sistemas de IA procesan los datos. Con GPT-4o, han entrenado un único modelo para todas las modalidades, desde el texto hasta la visión y el audio. Esto significa que todas las entradas y salidas son procesadas por la misma red neuronal, lo que elimina la pérdida de información y permite interacciones más ricas y contextuales que nunca.

A estas alturas, la seguridad de los datos es al menos tan importante como el rendimiento, por lo que OpenAi tampoco dejó pasar la oportunidad de mejorar su herramienta en este aspecto. Por eso GPT-4o incorpora mecanismos de seguridad de extremo a extremo, desde el filtrado de los datos de entrenamiento hasta el refinamiento del comportamiento del modelo tras el entrenamiento. OpenAI también ha implementado nuevos sistemas de seguridad para controlar la salida de audio, garantizando una experiencia de usuario segura y fiable. Evitar las falsificaciones profundas será sin duda una cuestión crucial en los próximos meses.

En definitiva, OpenAI nos ofrece una evolución muy fina de GPT, con el objetivo de reavivar la competencia con Google, que también celebraba su gran conferencia esta semana, y los demás modelos. La interacción será aún más fluida, y sin duda estaremos un paso más cerca de la IA que habla con Joaquin Phoenix en la famosa película "HER". Es un placer acompañarles cada semana para descubrir esta revolución de la IA que se está construyendo ante nuestros ojos.

Francis Lelong Director General, Alegria.group

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

masterclass gratuita