ChatGPT se hace más inteligente: tendrá voz para hablar con nosotros y analizar las imágenes que subimos

OpenAI agrega desde hoy mismo nuevas características que potencian su inteligencia artificial

Levart Photographer Drwpcjkvxuu Unsplash
Sin comentarios Facebook Twitter Flipboard E-mail

Desde que ChatGPT comenzó a funcionar hace ya unos meses a nivel de consumo, muchos de nosotros lo hemos usado como un simple buscador de información como si se tratase Google. La única diferencia es que se puede usar un lenguaje mucho más natural para poder solicitar tener delante de nuestros ojos un texto que debemos presentar en clase, un poema, una novela y en definitiva todo lo que tiene que ver con texto.

Pero OpenAI quiere ir un paso más allá con su IA generativa al permitir que sea más interactiva al agregar desde hoy mismo las nuevas IA basadas en voz e imagen a lo que conocíamos. Y todo esto llega justo cuando Amazon decidió invertir en Antrophic un total de 4.000 millones de dólares, siendo este uno de los grandes rivales de ChatGPT.

Un vistazo a…
CHAT GPT-4 en 4 MINUTOS

ChatGPT agrega la compatibilidad con voz e imágenes

Con este cambio ChatGPT va a ser compatible con la entrada de instrucciones a través de voz como si fuera un asistente personal. Esto gracias a la tecnología LMM que permitirá una comprensión de todas estas instrucciones que se lancen con voz de manera precisa. Esto hará que le podamos preguntar algo con voz o darle pautas para que cuente una historia con las modificaciones que tú le solicitas.

Openai

La función de voz está fundamentada en una tecnología que permite convertir texto en voz, haciendo que la IA tenga una tonalidad lo más similar a la humana a partir del texto que genera. Todo esto gracias a la asociación de OpenAI con diferentes actores de doblaje (cinco en total), aunque todo esto en fase beta actualmente. Pero además de esta función de voz, también se agrega otra relacionada con las imágenes como la que tenemos disponible en Google Bard.

En concreto se va a poder subir una imagen a ChatGPT para obtener respuestas sobre este contenido. Por ejemplo, si se sube la imagen de un paisaje la IA va a ser capaz de describirla o las instrucciones para resolver algún problema que haya en la imagen. Y como decimos, esta es la respuesta para la misma función que cuenta con la subida de imágenes, e incluso también la lectura de los PDF.

Estas novedades son realmente importantes, como por ejemplo para permitir traducir podcast enteros de inglés a español u a otro idioma de una manera sencilla. Y esto es algo que está haciendo ya Spotify como uno de los socios de OpenAI. De esta manera, son cambios significativos que pueden llegar a evolucionar por completo esta IA que comenzó como un simple buscador y que se acerca a ser realmente completa en un corto periodo de tiempo.

Más información | OpenAI

Imágenes | Viralyft Levart_Photographer

En Genbeta | Haz tu vida más fácil con estas 11 formas de usar ChatGPT en el día a día

Comentarios cerrados
Inicio