El Estado del arte en modelos de lenguaje en español

Jueves 24 de febrero de 2022 | 19:00h | @Spain_AI_

Jueves 24 de febrero de 2022

19:00h

Hoy día los modelos de lenguaje son la piedra angular de la gran mayoría de soluciones de Procesamiento del Lenguaje Natural. Casos como GPT-3 nos demuestran la capacidad que tienen estos modelos para generar textos verosímiles y de resolver una gran variedad de tareas de tratamiento del texto escrito. Sin embargo, la gran mayoría de los modelos de lenguaje del estado del arte funcionan única o principalmente en el idioma inglés, dejando en un segundo plano a todos los demás idiomas, incluyendo el español.

En este webinar repasaremos los modelos de lenguaje que se han desarrollado específicamente para el español, estudiando cómo se han construído y su rendimiento. Comprobaremos también qué diferencias existen con los modelos del estado del arte en inglés, y qué podemos aprender de estos modelos más avanzados.

Finalmente presentaremos RigoBERTa, nuestro proyecto de crear un modelo de lenguaje del español, con el que hemos logrado batir records del estado del arte en el procesamiento del lenguaje natural en nuestro idioma.

Si quieres saber más... ¡no te pierdas este webinar y regístrate ya!

Ponentes

Álvaro Barbero: PhD, Chief Data Scientist en el Instituto de Ingeniería del Conocimiento (IIC). Investigador en el grupo de Aprendizaje Automático de la UAM.

Ingeniero Superior, Máster y Doctor en Ingeniería Informática especialidad Aprendizaje Automático. https://www.linkedin.com/in/álvaro-barbero-jiménez-6056005/

Alejandro Vaca: Data Scientist en el Departamento de Ingeniería Algorítmica del IIC. Máster en Data Science y Big Data de AFI Escuela de Finanzas.

Mejor Data Scientist Hackaton SpainAI 2021 y Primer premio en el Cajamar UniversityHack 2020 (Minsait Land Classification). https://www.linkedin.com/in/alejandro-vaca-serrano/