¿Cómo anotar corpus lingüísticos para entrenar LLMs?

Marta Guerrero Nieto· 20 mar 2024· 30 mins

En esta charla, Marta Guerrero compartirá su experiencia y conocimientos sobre cómo anotar corpus lingüísticos para entrenar LLMs, utilizando como ejemplo los corpus donados por el IIC para la futura primera leaderboard de LLMs en español.

¿Qué vas a aprender al asistir a esta charla?

  • Técnicas y metodologías para anotar corpus lingüísticos para entrenar LLMs
  • Cuáles son algunos de los corpus que van a formar parte de la leaderboard de LLMs en español

Charlas relacionadas


Marta Guerrero Nieto

Marta Guerrero Nieto es directora técnica en Business and Language Analytics, donde se encarga de llevar el grupo de Lingüistas computacionales, y de liderar proyectos de Procesamiento de Lenguaje Natural en el Instituto de Ingeniería del Conocimiento (IIC). Máster en Lingüística general (2010), licenciada en Lingüística (2009) y Filología Hispánica (2002) por la Universidad Autónoma de Madrid. Desde hace más de una década lidera proyectos de Procesamiento del Lenguaje Natural en el IIC entre los que pueden destacarse proyectos de clasificación automática de textos, detección de entidades, análisis semántico, etc. Ha participado en el desarrollo de RigoBERTa, el modelo del lenguaje para el español creado en el IIC. También forma parte de la junta directiva de la SEPLN (Sociedad Española para el Procesamiento del Lenguaje Natural).