El hackathon de este año se centra en la creación de recursos que permitan la evaluación y el alineamiento de modelos de lenguaje con la cultura de los países de LATAM y la Península Ibérica. El hackathon se ha extendido hasta el 31 DE MAYO.
El hackathon consta de un reto principal y varios mini retos con los que también podéis acumular puntos para los premios finales y ganar premios extra. La puntuación máxima total es de 10 puntos.
En esta página encontrarás información sobre:
- Primeros pasos
- Incentivos y premios
- Mini retos
- Reto principal
- Preguntas frecuentes
¡Mucho éxito! 🚀
👣 Primeros pasos
Antes de comenzar, todas las personas tienen que:
- ✅ Unirse al servidor de Discord de SomosNLP
- ✅ Crear una cuenta en Hugging Face
- ✅ Rellenar el formulario de registro
- ✅ Unirse a la organización de Hugging Face del hackathon, donde se compartirán los datasets, modelos y demos
Para crear un equipo:
- Puedes apuntarte con gente que ya conozcas (por ejemplo, tu grupo de clase o del trabajo) o conocer a gente de la comunidad de SomosNLP de otros países, universidades y empresas. Si quieres conocer a gente, revisa el canal #encuentra-equipo
- Una vez que hayáis creado el equipo, UNA persona tiene que registrar el equipo
👏 Incentivos y premios
Al participar tendrás la oportunidad de:
- ✨ Aprender con talleres y charlas en directo
- ✨ Conseguir acceso a 500 USD de la API de Cohere
- ✨ Conseguir acceso a una GPU L40S de Hugging Face
- ✨ Ganar 1000 USD en créditos de la API de Mistral
- ✨ Ganar cientos de USD en créditos GPU y libros de IA y lenguaje
- ✨ Ganar acceso a un Máster online de IA
- ✨ Ganar una entrada para la conferencia online de WomenTech Network
- ✨ Ganar una nominación a la red de talento Nova
- ✨ Ganar mentorías con personas relevantes en el campo del PLN
- ✨ Co-publicar papers en conferencias de PLN internacionales
- ✨ Conseguir un certificado de participación (o equipo ganador) del hackathon
¡A por ello! 🚀
✨ Mini retos
Participa en estos mini retos para contribuir a la creación de bases de datos que evalúen el conocimiento cultural y estereotipos de los LLMs. ¡Podrás acumular puntos y ganar premios extra!
🔥 Reto principal
- Genera un dataset de preferencias
- Alinea un modelo textual (opción A) o multimodal (opción B), a elegir
- Crea una demo de tu proyecto
- Presenta tu proyecto en un vídeo de 5 mins
- (Opcional) escribe un paper presentando tu proyecto
❓ Preguntas frecuentes
¿Por qué debería participar?
Al unirte a este hackathon tendrás la oportunidad de:
- ✅ Comprender cómo funcionan los grandes modelos del lenguaje, tanto textuales (LLMs) como multimodales (VLLMs) y descubrir los retos de cada etapa de su desarrollo: creación del corpus, entrenamiento, alineamiento y evaluación
- ✅ Participar en la creación del primer corpus de preferencias de calidad y diverso para alinear LLMs con la cultura de los países de LATAM y la Península Ibérica (top como experiencia y top para el CV)
- ✅ Ser parte del equipo que cree algunas de las bases de datos de la primera leaderboard abierta de LLMs en español: La Leaderboard
- ✅ Resolver todas tus dudas sobre PLN durante sesiones de mentoría “Ask My Anything”
- ✅ Recibir apoyo para presentar tu trabajo en un paper
- ✅ Ganar premios para seguir creciendo como profesional y conseguir un certificado que poder compartir en LinkedIn
- ✅ Unirte a la mayor comunidad de hispanohablantes que estudian, trabajan e investigan en PLN
¿Cuál es el nivel necesario?
Desde el equipo de SomosNLP queremos animarte a participar independientemente de tus conocimientos actuales. En ediciones anteriores hemos contado con grupos de institutos de investigación y grupos de estudiantes de grado, ¡todos los proyectos suman!
- 📖 Impartiremos una serie de talleres prácticos mostrándote cómo desarrollar un proyecto para que tengas un ejemplo de referencia.
- ❓ Organizaremos AMAs (del inglés, Ask Me Anything) con expertas y mentores para que puedan solucionar tus dudas.
¿De qué depende la complejidad de los proyectos?
Proporcionaremos un ejemplo de cómo crear un dataset, entrenar un modelo y crear una demo. Depende de ti y tu equipo elegir cuánto investigar y trabajar para mejorar la versión base. La dificultad también depende del caso de uso, el origen de los datos, el tiempo que dediquéis a su curación, la técnica de entrenamiento, las iteraciones que hagáis y lo elaborada que queráis que sea vuestra demo. ¡Sois libres de elegir todo!
¿De verdad se necesitan 4 semanas?
No, depende de tu disponibilidad, puedes desarrollar un buen proyecto en una semana. Tenemos en cuenta que las personas estudian y trabajan, por lo que dejamos más tiempo del necesario para que todo el mundo pueda participar. También queremos daros tiempo extra para que disfrutéis la oportunidad de asistir en directo a las ponencias y mentorías celebradas durante el hackathon.
¿Hasta cuándo puedo crear un equipo?
EDITADO: Damos la bienvenida a nuevos equipos hasta el 23 de mayo. El día final para entregar proyectos es el 31 de mayo.
¿Cómo me uno a un equipo?
Lee la sección “Para crear un equipo:” al comienzo de esta página y el README en el canal #encuentra-equipo de nuestro servidor de Discord :)
¿Puede haber equipos de 1 persona?
Sí, aceptamos equipos de 1 a 5 personas.
¿Cómo nos recomendáis organizarnos?
- Utilizar el canal de vuestro proyecto en Discord para comunicaros y organizaros.
- Dado que es un hackathon internacional recomendamos una comunicación asíncrona o que os repartáis el trabajo y hagáis reuniones de menos personas
- Fijar reuniones o hablar espontáneamente utilizando los nuevos canales de voz de la categoría “SALAS DE REUNIÓN” de Discord
- Fijar en el canal del proyecto los mensajes importantes, e.g.: repartición de tareas, día de la próxima reunión, … Para fijar un mensaje haz click en los tres puntitos y selecciona “Fijar mensaje”
- Para mayor claridad también podéis crear un documento compartido con las personas del equipo en el que escribir el objetivo del proyecto, repartir tareas y demás (y fijar el enlace en el chat)
No entiendo Discord, ¿cuáles son los canales más importantes?
- Revisa el canal #anuncios, recomendamos activar las notificaciones del canal, publicamos 2/3 veces a la semana
- Pregunta tus dudas en el canal #pide-ayuda de Discord para que todo el mundo pueda beneficiarse de la respuesta
- Los eventos los anunciamos en el canal #eventos y los añadimos al calendario de Google
¿Cómo me puedo enterar de los eventos?
- Anunciamos los eventos en el canal #eventos
- Los añadimos al calendario de Google
- Los anunciamos en redes sociales (LinkedIn, X (Twitter))
- Síguenos en YouTube y guarda la playlist del hackathon 2025
¿Cómo puedo dar feedback del evento?
- Nos puedes dar feedback para mejorar las guías de los retos con este formulario (anónimo)
- Compartiremos también un formulario de feedback general al final del evento
Si te hemos dicho que en esta página hay info que no encuentras, borra las cookies y recarga la página.
🙌 Otras maneras de apoyar la adecuación cultural de los LLMs
¿Cómo puedo colaborar?
- Comparte los posts de las cuentas de @SomosNLP (LinkedIn, X (Twitter)), ¡invita a tus colegas del trabajo, compañeros y compañeras de clase a crear un equipo!
- ¿Estás en la uni? Comparte esta info con tu profe o alguien del grupo de IA/informática para que tu universidad colabore con el evento.
- ¿Quieres apoyar la iniciativa dando visibilidad, patrocinando vales o con una donación económica? ¡Patrocina el hackathon!