Universidades descubren que ChatGPT desconoce muchas palabras españolas y que, en general, no entiende muy bien el idioma

Gracias a una aplicación de código abierto, tres universidades españolas pueden ver el conocimiento que ChatGPT tiene de los idiomas
Hay que tener esto en cuenta para evitar ir perdiendo léxico si se usan muchos las inteligencias artificiales para crear textos

4 diciembre 2023, 09:01

Bárbara Bécares

ChatGPT aterrizó en el mercado hace un año revolucionando el mundo de la inteligencia artificial ya que trajo una herramienta muy potente a manos de todo el mundo. Es una IA generativa que nos puede ayudar a reducir el tiempo que gastamos en ciertas tareas laborales y hasta se cree que puede eliminar muchos puestos de trabajo.

Ahora, la Universidad Politécnica de Madrid junto con investigadoras de otros grandes centros educativos, han hecho una investigación para poner a prueba el software de OpenAI.

En Genbeta

El CEO de OpenAI cree que este será el único empleo que no será reemplazado por ChatGPT u otra IA

Han partido de la base, según sus palabras, de que "tenemos un conocimiento muy limitado de estas herramientas", como que ignoramos algo tan básico como cuántas palabras de idiomas como el español puede identificar ChatGPT,

Te adelantamos que esta herramienta entrenada con muchos datos de internet, millones de repositorios públicos, incluyendo código del propio GitHub, según las informaciones públicas al respecto, puede ser que conozca muy bien el idioma inglés (su sede principal está en Estados Unidos), pero está limitada en cuanto al español.

Un vistazo a…

ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

90.000 palabras del diccionario de la RAE

Investigadores de la Universidad Politécnica de Madrid (UPM), junto a colegas de la Universidad Carlos III de Madrid (UC3M) y la Universidad de Valladolid (UVa), se propusieron descubrir el conocimiento que ChatGPT tiene del castellano.

El primer paso fue crear una aplicación nueva de nombre ChatWords. Su objetivo: evaluar el conocimiento léxico que el software más famoso de OpenAI tiene de diferentes idiomas. Probaron las más de 90.000 palabras del diccionario de la RAE.

El modelo ChatGPT3.5 turbo desconoce aproximadamente el 20%. Y no solo eso. Del 80% restante, ofrece significados erróneos en algunos casos, en torno al 5%.

En Genbeta

ChatGPT se hace más inteligente: tendrá voz para hablar con nosotros y analizar las imágenes que subimos

Javier Conde, profesor ayudante en la Escuela Técnica Superior de Ingenieros de Telecomunicación (ETSIT) de la UPM dice que analizando los significados que da ChatGPT de las palabras, vemos que hay un porcentaje no despreciable en que el sentido que señala es incorrecto y que "quizás ChatGPT no sea hoy en día tan sabio como aparenta".

Esta es una de las conclusiones principales aunque cabe decir que, según estudios, un hispanohablante reconoce 30.000 palabras de media.

Un escenario con cada vez menos vocabulario

Pedro Reviriego, profesor titular de la ETSIT , ve una preocupación respecto a esto: considera que resulta “muy factible un escenario en que el contenido recién generado tenga un número cada vez menor de palabras distintas” y esto hay que tenerlo en cuenta para "garantizar la riqueza léxica en el texto creado por inteligencia artificial".

En Genbeta

ChatGPT puede corregir tus textos y mejorarlos mucho mejor que Word. Cinco trucos para que sea el mejor corrector

La aplicación ChatWords es de código abierto. El objetivo ahora es usarla para evaluar otros idiomas y para comprender mejor el conocimiento léxico que tienen las herramientas de inteligencia artificia.

Según el estudio oficial, este trabajo se enmarca en el proyecto Redes del Futuro para Centros de Procesados de Datos y Operadores, financiado por la Agencia Estatal de Investigación, y cuenta con el apoyo de OpenAI, laboratorio estadounidense responsable de ChatGPT.

Vía | Wired

Imagen| Foto de Jon Tyson en Unsplash

Ver todos los comentarios en https://www.genbeta.com

VER 5 Comentarios

Portada de Genbeta

Universidades descubren que ChatGPT desconoce muchas palabras españolas y que, en general, no entiende muy bien el idioma

Gracias a una aplicación de código abierto, tres universidades españolas pueden ver el conocimiento que ChatGPT tiene de los idiomas

Hay que tener esto en cuenta para evitar ir perdiendo léxico si se usan muchos las inteligencias artificiales para crear textos

90.000 palabras del diccionario de la RAE

Un escenario con cada vez menos vocabulario