#HackathonSomosNLP

Únete al mayor hackathon open-source de Procesamiento del Lenguaje Natural en español


Somos 600M de personas hispanohablantes y 265M lusófonas en el mundo. El español y el portugués son los idiomas principales en 29 países, cada uno de ellos con una gran riqueza cultural. Aunque los modelos de lenguaje muestran cada vez mayores capacidades multilingües, ¿son realmente multiculturales?

Participa en el #HackathonSomosNLP, una competición internacional online cuyo principal objetivo es crear recursos diversos y abiertos de PLN las lenguas de Iberoamérica 🚀

¿Lo mejor? ¡TODO EL MUNDO puede colaborar!

Hackathon 2026

Ediciones anteriores

Este año celebramos la quinta edición, ¿tienes curiosidad por los resultados de los años anteriores?

Proyectos ganadores

Hackathon SomosNLP 2025: Adecuación Cultural

Los tres mejores corpus del reto de preferencias son:

  • 🥇 TralaleloTralala-MemeAlign
  • 🥈 IberoTales
  • 🥉 HoCV-COL

Equipos finalistas:

  • 👏 Comida Colombia + Ecuador
  • 👏 Cresia
  • 👏 Equipo LeIA
  • 👏 Falsos Amigos
  • 👏 Refranero Afro-Cubano
  • 👏 Sabiduría Popular Castellana
  • 👏 Think Paraguayo

Logros colectivos destacados:

  • 📚 INCLUDE: +38.000 preguntas de exámenes de 23 países
  • 📚 BLEND: extensión del benchmark de conocimiento cultural
  • 📚 ~1.000 estereotipos recolectados y validados

Más información sobre los proyectos del Hackathon 2025

Hackathon SomosNLP 2024: #Somos600M

Los tres proyectos ganadores son:

  • 🥇 NoticIA: Resumen de Noticias Clickbait
  • 🥈 AsistenciaRefugiados: Asistencia legal para refugiados
  • 🥉 TraductorInclusivo: Reescritura de textos utilizando lenguaje inclusivo

Y el proyecto más querido por la comunidad es:

  • 💛 AviaciónInteligente: Navegación del Reglamento Aeronáutico Colombiano

Mención especial a los proyectos:

  • 👏 ThinkParaguayo: Conoce la cultura guaraní
  • 👏 LenguajeClaro: Simplificación de lenguaje administrativo
  • 👏 BERTIN-ClimID: BERTIN-Base Climate-related text Identification

Y a los corpus:

  • 📚 SMC: Spanish Medical Corpus
  • 📚 RecetasDeLaAbuel@: Corpus de recetas de países hispanoamericanos
  • 📚 LingComp_QA: Un corpus educativo de lingüística computacional en español
  • 📚 KUNTUR: Constitución política de Perú de 1993
  • 📚 Identificación de provincias y resúmenes del Corpus Oral y Sonoro del Español Rural

Hackathon SomosNLP 2023: LLMs en español

En esta segunda edición participaron más de 500 personas de 30 países que desarrollaron 22 proyectos y 3 papers publicados.

Más información sobre el Hackathon 2023

Hackathon SomosNLP 2022: PLN en español

En la primera edición participaron más de 500 personas de 29 países. Proyectos destacados:

Más información sobre el Hackathon 2022

Charlas y talleres

Charla de Selene BaezCharla de Alfonso AmayuelasCharla de Andrés MarafiotiCharla de Elena González-BlancoCharla de Gabriel MartínCharla de Amanda CurryFine-tuning de grandes modelos de lenguajeDetección del lenguaje ofensivoEvaluación con desacuerdoEvento 04Evento 05Evento 06
Ver todos los eventos