Finaliza nuestro hackathon 2025

Descubre los proyectos finales y las charlas impartidas

María Grandury · 31 jul 2025 · 6min

Ha finalizado la cuarta edición del hackathon de SomosNLP, ¡vaya experiencia!

Cartel Hackathon 2025

🚀 Proyectos

El enfoque de este hackathon ha sido la generación de recursos abiertos para la evaluación y mejora de la adecuación cultural de los LLMs con los países iberoamericanos.

¿Tienes curiosidad por ver los proyectos que se han desarrollado durante el Hackathon SomosNLP 2025? ¡Aquí están!

🎦 Los vídeos de las presentaciones están disponibles en esta playlist de YouTube junto a los talleres y charlas de especialistas celebrados durante el hackathon.

🤗 Todos los recursos están disponibles en el Hub de Hugging Face: hf.co/somosnlp-hackathon-2025

Esperamos que os gusten y que surjan muchas aplicaciones utilizando estos nuevos recursos abiertos 💛

📚 Benchmark de conocimiento cultural: INCLUDE

Este reto consistía en recolectar exámenes de opción múltiple y extraer las preguntas para generar un gran benchmark de evaluación LLMs enfocado en el conocimiento regional.

En total hemos recogido más de 38.000 preguntas de 23 países 🔥

En particular, conseguimos más de 1.000 preguntas para México, Colombia, Perú, Argentina, Bolivia, España y Ecuador.

¡Muchas gracias por vuestro esfuerzo!

Las personas que más prompts contribuyeron fueron...
PuestoNombrePreguntas extraídas
🥇Francisco-Javier Rodrigo-Ginés4599
🥈Pablo Carrera2830 *
🥉Alfonso Amayuelas2300
4Naira Paola Arnez Jordan1581
5Oscar Cumbicus1280
6Jorge Vallego927
7Juan Calderón902 *
8Reewos Talla608 *
9Carlos Arriaga598
10Andrea Parra577
11Jorge Téllez561 *
12Susana Zhou560
13Enrique Paiva502
14David Quispe449 *
15Gonzalo Martínez436
16Guido Ivetta393
17Javier Conde377
18Fabian Perez372
19Andrés Sebastian370
20Gerardo Huerta353
21Marcos J. Gómez348
22David Nazareno Campo303
23Roverico303 *
24Henry Mantilla302
25Constanza Jeldres300
26Rasel Agüero Fernández300
27Rosabel F. Medina Sarmiento300
28Adrián Sáez227 *
29Gabriela Palomeque120

La tabla incluye el número de preguntas extraídas (no recolectadas) por cada participante. Los números con asterisco indican que para el pago de la compensación hace falta que la persona confirme la licencia de algunos exámenes. Todas las personas con más de 300 preguntas serán co-autoras del paper de INCLUDE.

📚 Benchmark de conocimiento cultural: BLEND

Este reto consistía en responder preguntas sobre su país para extender el benchmark abierto BLEND de evaluación del conocimiento cultural de LLMs.

Los países con mayor participación fueron España, México, Chile, Cuba y Perú. ¡Gran trabajo! 👏

¡El espacio de anotación sigue abierto, únete!

📚 Validación de estereotipos

Este reto consistía en la recolección y validación de estereotipos respecto a diferentes nacionalidades. En total, conseguimos casi 1.000 estereotipos que nos ayudarán a mitigar los sesgos de los LLMs.

Las personas que más prompts contribuyeron fueron...
PuestoDiscord IDEstereotipos validados
🥇bea esparcia126
🥈neovalleltd122
🥉dreamripper185
4andres_seba70
5alexis_castillo68
6elena w.57
7alebravo30
8jedzill427
9gonznm24
10agumeister21
11adriszmar20
12jorge.vallego14
13jorgeav13
14maria isabel ll12
15clauvallory5
16dramos75
17enpaiva933
18lucase#55963
19alvaro8gb2
20mcdaqc2
21xat.2
22freddyalfonsoboulton1
23roverico1
24valaery1
25yee511

📚 Dataset de preferencias

Este reto consistía en el diseño de prompts que evaluaran la adecuación cultural con cada país y posterior elección de la mejor respuesta en un LLM Arena.

🤗 El dataset con el conjunto de prompts está disponible en Hugging Face: hf.co/datasets/somosnlp-hackathon-2025/dataset-preferencias-dpo-v0

Los países con mayor participación fueron Colombia, Chile, España, Perú, Paraguay, Nicaragua y México.

Las personas que más prompts contribuyeron fueron...
PuestoDiscord IDPreferencias
🥇rasel3132430
🥈bel21093206
🥉conilinguist196
4roverico164
5pablo.ce153
6steminism133
7andres_seba120
8mcdaqc118
9susanazhou111
10enpaiva93107
11dreamripper183
12bea esparcia80
13angustias2263
14henry mantilla58
15luceldasilva58
16fabianpp50
17alvaro8gb42
18ghuerta17035
19edmenciab30
20adriszmar22
21diegoacheve21
22danielcavilla19
23helenpy19
24gonzalo_401468

El número de preferencias es el número de prompts que cada participante mandó a la Arena y votó cuál era la mejor respuesta de las generadas por los LLMs. Este número puede no coincidir con el número de prompts diseñados y subidos al dataset de Hugging Face por cada equipo si no todos los prompts se mandaron a la Arena.

Y los tres mejores corpus fueron… 🥁🥁🥁

  • 🥇 TralaleloTralala-MemeAlign
  • 🥈 IberoTales
  • 🥉 HoCV-COL

Felicidades a los equipos finalistas (por orden alfabético):

  • 👏 Comida Colombia + Ecuador
  • 👏 Cresia
  • 👏 Equipo LeIA
  • 👏 Falsos Amigos
  • 👏 Refranero Afro-Cubano
  • 👏 Sabiduría Popular Castellana
  • 👏 Think Paraguayo

¡Enhorabuena a tooodos los equipos!

🎁 Premios y próximos pasos

  • Durante el mes de agosto compartiremos más información sobre las menciones de honor y contactaremos a todos los equipos para entregarles los premios correspondientes.
  • Si tenéis alguna duda respecto al recuento de puntos, no dudéis en preguntar. El mapeo email-Discord ID se ha hecho con los datos del formulario de registro.
  • Si queréis seguir contribuyendo a los mini retos y tener una participación más activa en los papers que vamos a escribir, podéis avisarnos en el canal #compare-tu-proyecto y os invitaremos a los canales privados correspondientes.
  • Si en el formulario de entrega mostrasteis interés en publicar un paper presentando vuestro proyecto os contactaremos en septiembre para las mentorías, podéis comenzar a redactar vuestros experimentos en forma de artículo (introducción/motivación, metodología, resultados y análisis).

💛 ¡Muchas gracias y hasta la próxima!