Presentamos

SomosNLP

SomosNLP logo

Somos una comunidad internacional de personas hispanohablantes apasionadas por el PLN. Nuestra misión es acercar la IA a 600 millones de personas hispanohablantes alrededor del mundo. Y nuestra visión, conseguir una justa representación del español y lenguas cooficiales en el mundo digital.

Proyectos actuales

Próximos eventos

Hemos lanzado el Proyecto #Somos600M con el objetivo de representar en los modelos de lenguaje la riqueza de nuestras lenguas. Tenemos varias iniciativas:

Implementar una leaderboard abierta para evaluar LLMs generativos en español y lenguas cooficiales.V1 live el 1 de julio
Validar las traducciones de bases de datos de evaluación: MMLU, RAC-C y HellaSwag.Esfuerzo colaborativo
Validar la traducción del conjunto de prompts de la iniciativa Data Is Better Together (DIBT).Esfuerzo colaborativo
Campaña de recolección de corpus: buscamos especialmente corpus que representen diversas variedades del español y lenguas cooficiales,Comparte tu corpus
Creación un gran corpus de instrucciones, los equipos del Hackathon SomosNLP 2024 crearon la primera versión.Proyectos Hackathon 2024
Recolección de proyectos, eventos y grupos de investigación que están impulsando el PLN en español.Descubre las iniciativas

Buscamos colaboraciones con grupos de investigación de LATAM, el Caribe y España, ¡contáctanos!

Saber más

Casi 600M de hispanohablantes*

¡Somos el 7.5% de la población mundial! La investigación en PLN está centrada en el inglés y descuida las dificultades particulares de los otros idiomas. Vamos a darle a nuestro idioma tan extendido y colorido una representación justa en el ámbito del PLN. Nuestra misión es impulsar el desarrollo del PLN en español, ¿cómo?

Hemos creado la mayor red internacional de hispanohablantes que estudian, trabajan e investigan en PLN. ¡Ya somos 2000!Únete a Discord
Organizamos gran variedad de actividades educativas: contamos con +50 talleres prácticos y charlas de especialistas con 20k visualizaciones y hemos diseñado un curso práctico de 0 a 100 con 35k visualizaciones.Aprende en comunidad
Conectamos talento con empresas y grupos de investigación gracias a nuestraBolsa de Empleo


* "El español en cifras", El español en el mundo, Anuario del Instituto Cervantes 2024

Comunidad internacional

Eventos anteriores

Charla de Elena González-BlancoCharla de Gabriel MartínCharla de Amanda CurryFine-tuning de grandes modelos de lenguajeDetección del lenguaje ofensivoEvaluación con desacuerdoEvento 01Evento 02Evento 03Evento 04Evento 05Evento 06
Ver todos los eventos