#HackathonSomosNLP 2026

Somos 600M de hispanohablantes y 265M de personas lusófonas en el mundo. El español y el portugués son los idiomas principales en 29 países, cada uno de ellos con una gran riqueza cultural. Aunque los modelos de lenguaje muestran cada vez mayores capacidades multilingües, ¿son realmente multiculturales? Únete ya al #HackathonSomosNLP, el mayor hackathon open-source de Procesamiento del Lenguaje Natural para Iberoamérica 🚀

El enfoque de esta edición es generar recursos y utilizar técnicas de post-entrenamiento para mejorar la calidad de las respuestas de los LLMs en las lenguas de Iberoamérica. ¿Cómo definimos “calidad”? Razonamiento correcto, respuestas seguras y adaptadas al contexto cultural.

La participación es gratuita y a tu ritmo, con acceso a cómputo y premios de hasta 1000 USD, con retos para todos los niveles.

📝 Inscríbete ya 🎨 Material de difusión

Fechas importantes:

11 de mayo: Taller inaugural de Sergio Paniego @Hugging Face, sorteo de libros, inscríbete en el mismo enlace ⬆️
17 de mayo: Cierre de inscripciones y sorteo entre las personas que hayan difundido el evento
29 de mayo: Entrega de los proyectos

(Em português, in English)

📊 ¡Lanzamos la quinta edición!

Desde 2022, sumamos…

Ediciones

1500+

Participantes

Países

100+

Proyectos

Charlas

En esta quinta edición nos vamos a centrar en la creación de recursos que nos permitan mejorar la calidad de las respuestas de los LLMs en las lenguas de Iberoamérica. Además de la capacidad de razonamiento, queremos mejorar la adecuación cultural de los modelos respecto a cada uno de los países de LATAM y la Península Ibérica.

¿Lo mejor? ¡TODO EL MUNDO puede colaborar! 🎉

🚀 Cómo participar

💬 Únete a Discord para hablar con tu equipo y la comunidad.
🤗 Únete a HuggingFace, el hub de IA abierta al que subiremos los recursos.
📝 Inscríbete en Eventbrite (gratis, ~2 minutos).

Hay dos vías de participación, elige según tu nivel y formación:

📚

Preferencias (toda la comunidad)

Manda preguntas culturales a modelos de IA y elige las mejores respuestas. Sin programar y desde el navegador. ¡Apto para todos los públicos!

💻

Post-entrenamiento (comunidad techie)

En equipos de 1 a 5 personas: crea un dataset, post-entrena un modelo (SFT, DPO, RLVR) y publica una demo. ¡Te apoyamos con recursos y mentorías!

📝 Inscríbete ya

Al participar tendrás la oportunidad de:

✨ Aprender con talleres y charlas
✨ Acceder a cientos de USD en créditos GPU y API para tu proyecto
✨ Ganar premios de 1000, 600 y 300 USD (por equipo)
✨ Ganar nominaciones a la red de talento Nova (personales)
✨ Ganar sesiones de mentoría con personas relevantes del campo
✨ Participar en sorteos de libros y entradas a conferencias
✨ Co-publicar papers en conferencias internacionales de PLN
✨ Conseguir un certificado de participación (¡o de equipo ganador!)

¡A por ello! 🚀

¿Tienes dudas? Revisa las preguntas frecuentes e información de contacto al final.

🙌 Otras formas de apoyar

¿No puedes participar pero quieres echar una mano? El hackathon es un evento gratuito y sin ánimo de lucro, toda ayuda suma!

📣

Difunde el evento

Ayúdanos a llegar a más personas. Con 4 publicaciones añadimos vuestro logo a la web.

Cómo difundir

🤗

Únete al equipo

Colabora creando contenido, tutoriales y recursos de apoyo.

Apuntarme

🧑‍🏫

Ofrece una mentoría

Comparte tu experiencia con los equipos. Puede ser una sesión puntual o un acompañamiento semanal durante mayo.

Ofrecer mentoría

🎓

Invita a tu alumnado

Quiero que mi universidad colabore con el hackathon o difundirlo entre el alumnado.

Cómo colaborar

🙌

Patrocina el hackathon

Apoya nuestra misión con visibilidad, créditos, premios o donaciones. SomosNLP es una asociación sin ánimo de lucro.

Ver opciones

💡 Ponencias y mentorías

¡Tendrás la oportunidad de aprender de líderes de la academia y la industria!

📝 Inscríbete ya

Para una revisión completa de todos los conceptos, recomendamos el curso gratuito online de la UPM “Introducción a la IA generativa a través de LLMs” (50h).

Para refrescar conceptos, te recomendamos estas charlas (< 1h):

Más charlas

🏆 Casos de éxito

Los proyectos del hackathon generan impacto real:

20221er Premio

🏅 BiomedIA

Sistema voz-a-voz de Q&A biomédico. Paper en NAACL 2022 con el Premio a la Mejor Presentación de Póster.

20222do Premio

⚖️ Modelo Jurídico Mexicano

Modelo de conocimiento jurídico utilizado por la Suprema Corte de Justicia de la Nación de México.

20241er Premio

📰 NoticIA

Corpus artículos de noticias clickbait en español con resúmenes de alta calidad, abordando la desinformación digital. Paper en SEPLN 2024.

20242do Premio

🤝 AsistenciaRefugiados

Asistente legal para personas en situación de refugio, facilitando el acceso a información sobre legislación en España.

20241er Premio

🤝 BERT Sostenible

Identificación de textos sobre cambio climático y sustentabilidad en español. LatinX in AI (LXAI) Workshop @NAACL 2024. Best paper @KHIPU 2025.

20241er Premio

🤝 Cocina saludable

Aprendiendo a cocinar de manera saludable con LLMs, SFT y RAG. LatinX in AI (LXAI) Research Workshop @NAACL 2024.

2024Logro colectivo

📚 Dataset de instrucciones

Generamos más de 1M instrucciones, creando el mayor dataset de entrenamiento supervisado en español. Paper #Somos600M publicado en el workshop LatinX in NLP @NAACL 2024. Entrevista en el periódico El País.

2025Logro colectivo

📚 INCLUDE: Benchmark de conocimiento cultural

Recolectamos más de 38.000 preguntas de exámenes de 23 países, contribuyendo al mayor benchmark de evaluación de conocimiento cultural para LLMs. Paper WIP.

Más proyectos

👏 Agradecimientos

Muchísimas gracias por vuestro tiempo y por apoyarnos para que nuestra iniciativa llegue más lejos. ¡Vamos a hacer los modelos de lenguaje más inclusivos!

🚀 Organizado por

Con el apoyo de

🥇 Patrocinios Oro

🥈 Patrocinios Plata

❓ Preguntas frecuentes

¿Por qué debería participar?

Al unirte a este hackathon tendrás la oportunidad de:

✅ Comprender cómo funcionan los grandes modelos del lenguaje, tanto textuales (LLMs) como multimodales (VLLMs) y descubrir los retos de cada etapa de su desarrollo: creación del corpus, entrenamiento, alineamiento y evaluación
✅ Participar en la creación del primer corpus de preferencias de calidad y diverso para alinear LLMs con la cultura de los países de LATAM y la Península Ibérica (top como experiencia y top para el CV)
✅ Ser parte del equipo que cree algunas de las bases de datos de la primera leaderboard abierta de LLMs en español: La Leaderboard
✅ Resolver tus dudas sobre PLN durante sesiones de mentoría “Ask My Anything”
✅ Recibir apoyo para presentar tu trabajo en un paper
✅ Ganar premios para seguir creciendo como profesional y conseguir un certificado que poder compartir en LinkedIn
✅ Unirte a la mayor comunidad open-source iberoamericana de PLN

¿Qué nivel necesito tener?

Cualquier nivel. En ediciones anteriores han participado desde grupos de investigación con doctorado hasta estudiantes de grado. Si nunca has hecho un proyecto de IA, los mini retos son un buen punto de partida.

Para acompañarte tendrás:

📖 Talleres prácticos que te enseñan paso a paso cómo desarrollar el proyecto y notebooks de ejemplo.
❓ Sesiones AMA (“Ask Me Anything”, o sea “pregúntame lo que quieras”) con personas expertas que resolverán tus dudas.

¿Cómo de difícil es el reto principal?

Tú decides. Os daremos un ejemplo base que muestra paso a paso cómo crear un dataset, entrenar un modelo y publicar una demo. A partir de ahí, cada equipo decide cuánto quiere profundizar: el tema, de dónde sacar los datos, qué técnica de entrenamiento usar, lo elaborada que sea la demo… ¡Tenéis libertad total!

¿Necesito de verdad 4 semanas?

No. Dependiendo de tu disponibilidad se puede sacar un buen proyecto en una semana. Damos un plazo amplio porque sabemos que la mayoría de la gente estudia o trabaja, por lo que dejamos más tiempo del necesario para que todo el mundo pueda participar.

¿Hasta cuándo puedo crear un equipo?

Puedes crear un equipo nuevo hasta el 15 de mayo. La fecha límite para entregar los proyectos es el 31 de mayo.

¿Cómo me uno a un equipo?

Lee la sección “Para crear un equipo:” al comienzo de esta página y el README en el canal #encuentra-equipo de nuestro servidor de Discord :)

¿Puede haber equipos de 1 persona?

Sí, aceptamos equipos de 1 a 5 personas.

¿Cómo nos recomendáis organizarnos en equipo?

Usad el canal de vuestro proyecto en Discord para comunicaros y organizaros.
Como es un hackathon internacional, recomendamos comunicación asíncrona (mensajes que cada persona contesta cuando puede) o reuniones pequeñas, ya que la gente está en zonas horarias distintas.
Para hablar en directo, podéis usar las salas de voz de Discord (categoría “SALAS DE REUNIÓN”).
Fijad los mensajes importantes (reparto de tareas, próxima reunión…) en el canal del equipo: pulsad los tres puntos sobre el mensaje y elegid “Fijar mensaje”.
Os puede ayudar tener un documento compartido (Google Docs, Notion…) con el objetivo del proyecto y el reparto de tareas. Fijad el enlace en el chat.

Es mi primera vez en Discord, ¿qué canales miro?

📣 #anuncios: publicamos aprox 2 veces por semana. Te recomendamos activar las notificaciones de este canal.
🆘 #pide-ayuda: pregunta aquí tus dudas. Si una persona tiene tu duda, seguramente otras también la tengan, así la respuesta sirve para todo el mundo.
📅 #eventos: anunciamos talleres y mentorías. También puedes añadir nuestro calendario de Google al tuyo.

¿Cómo me puedo enterar de los eventos?

Anunciamos los eventos en el canal #eventos
Los añadimos al calendario de Google
Los anunciamos en redes sociales (LinkedIn, X (Twitter))
Síguenos en YouTube y guarda la playlist del hackathon 2026

¿Cómo puedo dar feedback del evento?

Nos puedes dar feedback para mejorar las guías de los retos con este formulario (anónimo)
Compartiremos también un formulario de feedback general al final del evento

🤗 ¡Conecta!

Para estar al día de todos los eventos y avances:

Únete a la comunidad de +2000 personas en Discord (¡es gratis!)
Presta atención a los canales de Discord #anuncios y #eventos
Síguenos en X y LinkedIn
Suscríbete a nuestro canal de YouTube
Únete al calendario de Google