Hackathon SomosNLP 2023: Los LLMs hablan Español

Construye al lado de profesionales, expertas y mentores la siguiente generación de modelos de PLN en tu idioma


La segunda edición de nuestro hackathon ya ha finalizado, te animamos a echar un vistazo a losproyectosde los equipos participantes y visualizar las grabaciones de lascharlas y talleresimpartidas por especialistas en el campo del PLN.

¡Únete a nuestros próximos eventos!


Después de una primera edición en la que contamos con más de 500 participantes de 29 países distintos, superamos las 5.000 visualizaciones de nuestros eventos, aprendimos de 11 ponentes, finalizamos 22 proyectos y publicamos 3 papers.... ¡Volvemos a por eso y mucho más!

¡Únete a la segunda edición del mayor hackathon open-source de Procesamiento del Lenguaje Natural en español!

Cartel del Hackathon 2023

La democratización del PLN en español es el objetivo principal de SomosNLP y creemos que una de las mejores maneras de avanzar hacia este objetivo es creando más recursos abiertos de PLN en nuestro idioma.

Con este hackathon te animamos a unirte a nuestro esfuerzo ycrear datasets y modelos que apliquen el potencial de los grandes modelos del lenguaje (LLMs) a una buena causa.

Los equipos que desarrollen un proyecto enfocado a uno de losObjetivos de Desarrollo Sostenibletendrán un punto extra 💛


🚀 Por qué participar

Al unirte a este evento, además de ayudarnos a crear recursos abiertos y democratizar el PLN en tu idioma, tendrás la oportunidad de:

  • Asistir a charlas y talleres impartidas por profesionales del mundo del PLN, independientemente de si participas en el hackathon
  • Comprender cómo funcionan los grandes modelos del lenguaje (LLMs) y aprender a aprovechar su potencial
  • Unirte a la mayor comunidad de hispanohablantes que estudian, trabajan e investigan en PLN
  • Consultar tus dudas sobre PLN con mentores y mentoras en sesiones "Ask My Anything"
  • Recibir apoyo para presentar tu proyecto como paper a una conferencia o para desarrollar tu idea y llevarla al mercado
¡Regístrate ya!

📝 Índice


💡 Keynotes de especialistas

Durante dos días del hackathon (martes 28 de marzo y 4 de abril), tendrán lugar diversas keynotes impartidas por profesionales del mundo del Procesamiento del Lenguaje Natural. Estos eventos están abiertos a todas las personas, independientemente de si participan en el hackathon.¡Ya están las grabaciones disponibles!

    Martes 28 de marzo: Día de Keynotes
  • "Tecnologías clave de ChatGPT: Reinforcement Learning from Human Feedback", con Alejandro Vaca, Data Scientist @IIC y ganador de la primera edición del hackathon
  • "Detección y mitigación de sesgos en modelos de lenguaje", con María Grandury, ML Research Engineer @neurocat y Fundadora @SomosNLP
  • "Impacto de los LLM en el mundo actual", con Carlos Alarcón, Director de la escuela de datos & IA @Platzi
  • "Inteligencia Artificial y los feminismos en América Latina: la experiencia del proyecto AymurAI", con Ivana Feldfeber, Directora Ejecutiva @DataGénero
  • Miércoles 29 de marzo: Taller de Emprendimiento
  • "De la idea a la startup", con Lucas Fernández, Ingeniero Industrial y Fundador @AgilMentor
  • Lunes 3 de abril: BERTIN Monday
  • "Estrategias de simplificación para modelos grandes de lenguaje", con Paulo Villegas, Experto tecnológico en Telefónica Chief Digital Office
  • "Proyecto BERTIN: Entrenando modelos de lenguaje en Español de manera abierta", con Javier de la Rosa, NLP Research Scientist @Nasjonalbibl AI-Lab y Álvaro Pérez, Investigador @linhd
  • Martes 4 de abril: Día de Keynotes
  • "Detección del lenguaje ofensivo en la era digital: retos y avance", con Flor PLaza, Postdoc @MilaNLP Uni Bocconi
  • "Evaluación con desacuerdo en tareas subjetivas: caso del sexismo en redes sociales", con Julio Gonzalo, Director del grupo de investigación nlp.uned.es

Para estar al día de los eventos:


💻 Bases del Hackathon

Todo lo que necesitas saber para desarrollar un buen proyecto para el hackathon está aquí.

📖 Talleres y AMAs

Desde el equipo de SomosNLP queremos animarte a participar independientemente de tus conocimientos actuales.

  • Durante los primeros días del hackathon daremos una serie detalleres prácticosmostrándote cómo hacer fine-tuning de un LLM y cómo etiquetar tu base de datos para que tengas un ejemplo de referencia.
  • Fine-tuning LLMsEtiquetado de datos con Argilla
  • OrganizaremosAMAs(del inglés, Ask Me Anything) con expertas y mentores para que puedan solucionar tus dudas.
  • AMA con Omar SansevieroAMA con Natalia ElviraAMA con Manuel RomeroAMA con Alejandro Vaca

🏆 Evaluación y Premios

A la hora de evaluar los proyectos, dado que cada equipo utilizará un dataset diferente y entrenará su modelo para resolver una tarea diferente, además de tener en cuenta el valor de las métricas, los criterios de evaluación incluirán el impacto social del proyecto, la originalidad de la idea y la dificultad técnica.Más detalles aquí.

    TODAS las personas que entreguen un proyecto completo conseguiréis:
  • ⚙️ GPU VMs para entrenar vuestros modelos
  • ⚙️ GPU grants durante el evento para que tengáis NVIDIA T4s en vuestros Spaces
  • 🤗 Swag de Hugging Face exclusivo del evento
  • 💜 Descuento de 20% en tickets para asistir a la WomenTech Network Global Conference 2023 y la opción de ganar 3 tickets completamente gratis
  • 🚀 Descuento de 20% para participar en el programa de incubación de cuatro meses y medio de AgilMentor y crear un MVP a partir de vuestro proyecto
  • 📜 Certificado de participación o de equipo ganador del "Hackathon SomosNLP 2023: Los LLMs hablan Español" (verificado en nuestra web)
    Además de los tres proyectos ganadores elegidos por el jurado, habrá varias menciones de honor:
  • 🤗 Proyecto con más likes en el Hub de Hugging Face (leaderboard)
  • 💛 Proyecto con mayor impacto social: Beca del 50% de descuento para participar en el programa de incubación de cuatro meses y medio de AgilMentor y crear un MVP a partir de tu proyecto
  • ✍️ Mejor dataset etiquetado: 200€ de crédito en el Hub de Hugging Face patrocinado por Argilla
  • 🚀 Proyecto con más opciones de llegar al mercado: Beca del 75% de descuento para participar en el programa de incubación de cuatro meses y medio de AgilMentor y crear un MVP a partir de tu proyecto

Premios para el tercer puesto:

  • ✨ Nominaciones para entrar en la red global de talento Nova y la oportunidad de participar en su curso de Personal Branding (persona elegida por el equipo de Nova)
  • 🚀 Beca del 50% de descuento para participar en el programa de incubación de cuatro meses y medio de AgilMentor y crear un MVP a partir de tu proyecto
  • 👀 Certificado, reconocimiento en la página web y redes sociales y rol honorífico en el servidor de Discord "🏆Hackathon23"

Premios para el segundo puesto:

  • ✨ Nominaciones para entrar en la red global de talento Nova y la oportunidad de participar en su curso de Personal Branding (persona elegida por el equipo de Nova)
  • 🚀 Beca del 50% de descuento para participar en el programa de incubación de cuatro meses y medio de AgilMentor y crear un MVP a partir de tu proyecto
  • 👀 Certificado, reconocimiento en la página web y redes sociales y rol honorífico en el servidor de Discord "🏆Hackathon23"

Premios para el primer puesto:

  • ✨ Nominaciones para entrar en la red global de talento Nova y la oportunidad de participar en su curso de Personal Branding (persona elegida por el equipo de Nova)
  • 🚀 Beca del 50% de descuento para participar en el programa de incubación de cuatro meses y medio de AgilMentor y crear un MVP a partir de tu proyecto
  • 📚 Libros patrocinados por Argilla a elegir entre "NLP with Transformers", "Human-in-the-loop Machine Learning" and "Designing Machine Learning Systems"
  • 👀 Certificado, reconocimiento en la página web y redes sociales y rol honorífico en el servidor de Discord "🏆Hackathon23"
¡Más detalles sobre los patrocinios de oro aquí!

👏 Patrocinios

Muchísimas gracias por vuestro tiempo y por apoyarnos para que nuestra iniciativa llegue más lejos. ¡Vamos a democratizar el PLN en español!

🥇 Patrocinadores de oro

ArgillaQ BlocksHugging FaceInstituto Milenio Fundamentos de los DatosNovaAgilMentorWomen Tech Global Conference

🥈 Patrocinadores de plata

Spain AINarrativaDataGéneroInstituto de Ingeniería del ConocimientoUNED Research Group in NLP & IRMeaning Cloud

🥉 Patrocinadores de bronce

AI The New SexyBig OnionCapítulo Estudiantil AAAIMXDiverTLesGrupo de Ingeniería Lingüística de la UNAMIBiDatMCD UNISONMujeres TechNLP SpainNLP Webinar MXSaturdays AISoftware ThemisUniversidad Nacional de Loja