#HackathonSomosNLP 2026

Vamos impulsionar a criação de modelos de linguagem alinhados com a cultura dos países da América Latina e da Península Ibérica.


Somos 600M de hispanofalantes e 265M de pessoas lusófonas no mundo. O espanhol e o português são os idiomas principais em 29 países, cada um deles com uma grande riqueza cultural. Embora os modelos de linguagem mostrem capacidades multilíngues cada vez maiores, são eles realmente multiculturais? Junte-se já ao #HackathonSomosNLP, o maior hackathon open-source de Processamento de Linguagem Natural em espanhol e português 🚀

(Em espanhol, Em inglês)


📊 Lançamos a quinta edição!

Desde 2022, somamos…

4
Edições
1500+
Participantes
30
Países
100+
Projetos
60
Eventos

Nesta quinta edição vamos nos concentrar na criação de recursos que nos permitam avaliar e melhorar a adequação cultural dos grandes modelos de linguagem em relação a cada um dos países da América Latina e da Península Ibérica.

O melhor? TODO MUNDO pode colaborar! 🎉

GIF Hackathon #Somos600M


🚀 Como participar

📚

Envie perguntas sobre sua cultura para LLMs

Faça perguntas a LLMs e escolha quais estão mais alinhados com sua cultura. Apto para todos os públicos!

💻

Crie um modelo de linguagem

Desenvolva um LLM alinhado com sua cultura. Equipes de 1 a 5 pessoas: gere um dataset, alinhe um modelo e crie uma demo.

Ao participar, você terá a oportunidade de:

  • ✨ Aprender com workshops e palestras ao vivo
  • ✨ Acessar centenas de dólares em créditos de GPU e API para desenvolver seu projeto
  • ✨ Ganhar prêmios no valor de 1500, 1000 ou 500 USD (1º, 2º e 3º prêmio)
  • ✨ Ganhar ingressos para conferências e indicações para a rede de talentos Nova
  • ✨ Ganhar mentorias com pessoas muito relevantes da área de PLN
  • ✨ Copublicar papers em conferências internacionais de PLN
  • ✨ Conseguir um certificado de participação (ou de equipe vencedora) do hackathon

Mãos à obra!

Tem dúvidas? Confira as perguntas frequentes e as informações de contato no final.


🚀 Como apoiar mais

Apoie a organização deste evento gratuito e sem fins lucrativos!

📣

Divulgue o evento

Ajude-nos a fazer com que esta iniciativa chegue a mais pessoas. Com 4 publicações, adicionamos o logo de vocês ao site.

Divulgue
🤗

Junte-se à equipe

Colabore criando conteúdo, recursos de apoio, tutoriais, artigos ou pesquisando sobre Cultural NLP.

Junte-se
🧑‍🏫

Ofereça uma mentoria

Compartilhe sua experiência apoiando as equipes a criar datasets de qualidade e treinar bons LLMs. Mentorias pontuais ou contínuas.

Ofereça mentoria
🙌

Patrocine o evento

Apoie nossa missão oferecendo visibilidade, vales ou doações. A SomosNLP é uma comunidade sem fins lucrativos.

Ver opções

🏆 Casos de sucesso

Os projetos do hackathon geram impacto real:

20221º Prêmio

🏅 BiomedIA

Sistema voz a voz de perguntas e respostas biomédicas. Deu origem a um paper no NAACL 2022 com o Prêmio de Melhor Apresentação de Pôster.

20222º Prêmio

⚖️ Modelo Jurídico Mexicano

Modelo de conhecimento jurídico utilizado pela Suprema Corte de Justiça da Nação do México.

20241º Prêmio

📰 NoticIA

Corpus de 850 artigos de notícias clickbait em espanhol com resumos de alta qualidade, abordando a desinformação digital. Publicado no SEPLN 2024.

20242º Prêmio

🤝 AsistenciaRefugiados

Assistente jurídico para pessoas em situação de refúgio, facilitando o acesso à informação sobre legislação na Espanha.

20241º Prêmio

🤝 BERT Sustentável

Identificação de textos relacionados à mudança climática e à sustentabilidade utilizando modelos de linguagem pré-treinados em espanhol. LatinX in AI (LXAI) Research Workshop @NAACL 2024. Melhor paper no KHIPU 2025.

20241º Prêmio

🤝 Cozinha saudável

Aprendendo a cozinhar de forma saudável com Large Language Models, Supervised Fine Tuning e Retrieval Augmented Generation. LatinX in AI (LXAI) Research Workshop @NAACL 2024.

2024Conquista coletiva

📚 Dataset de instruções

Foram geradas mais de 1M de instruções, criando o maior dataset de treinamento supervisionado em espanhol. Paper #Somos600M publicado no workshop LatinX in NLP @NAACL 2024. Entrevista no jornal El País.

2025Conquista coletiva

📚 INCLUDE: Benchmark de conhecimento cultural

Foram coletadas mais de 38.000 perguntas de exames de 23 países, criando o maior benchmark de avaliação de conhecimento cultural para LLMs em espanhol e português.

Mais exemplos

💡 Palestras e mentorias

Você terá a oportunidade de aprender com líderes da academia e da indústria. Iremos anunciando novas palestras e mentorias!


👏 Agradecimentos

Muitíssimo obrigado pelo seu tempo e por nos apoiar para que nossa iniciativa chegue mais longe. Vamos tornar os modelos de linguagem mais inclusivos!

🚀 Organizado por

SomosNLPUNED

🥇 Patrocínios Ouro

NextGenerationEUSEDIAredesPERTEUNED
Hugging Face

🥈 Patrocínios Prata

Universidad Politécnica de MadridCENIA

❓ Perguntas frequentes

Por que eu deveria participar?

Ao se juntar a este hackathon você terá a oportunidade de:

  • ✅ Entender como funcionam os grandes modelos de linguagem, tanto textuais (LLMs) quanto multimodais (VLLMs) e descobrir os desafios de cada etapa do seu desenvolvimento: criação do corpus, treinamento, alinhamento e avaliação
  • ✅ Participar da criação do primeiro corpus de preferências de qualidade e diverso para alinhar LLMs com a cultura dos países da América Latina e da Península Ibérica (excelente como experiência e excelente para o currículo)
  • ✅ Fazer parte da equipe que cria algumas das bases de dados do primeiro leaderboard aberto de LLMs em espanhol: La Leaderboard
  • ✅ Tirar todas as suas dúvidas sobre PLN durante sessões de mentoria “Ask Me Anything”
  • ✅ Receber apoio para apresentar seu trabalho em um paper
  • ✅ Ganhar prêmios para continuar crescendo profissionalmente e conseguir um certificado para compartilhar no LinkedIn
  • ✅ Juntar-se à maior comunidade de hispanofalantes que estudam, trabalham e pesquisam em PLN
Qual é o nível necessário?

Na equipe da SomosNLP queremos incentivá-lo a participar independentemente dos seus conhecimentos atuais. Em edições anteriores, contamos com grupos de institutos de pesquisa e grupos de estudantes de graduação — todos os projetos somam!

  • 📖 Ministraremos uma série de workshops práticos mostrando como desenvolver um projeto para que você tenha um exemplo de referência.
  • ❓ Organizaremos AMAs (do inglês, Ask Me Anything) com especialistas e mentores para que possam tirar suas dúvidas.
Do que depende a complexidade dos projetos?

Forneceremos um exemplo de como criar um dataset, treinar um modelo e criar uma demo. Depende de você e da sua equipe decidir o quanto pesquisar e trabalhar para melhorar a versão base. A dificuldade também depende do caso de uso, da origem dos dados, do tempo que dedicarem à curadoria deles, da técnica de treinamento, das iterações que fizerem e do quão elaborada quiserem que seja sua demo. Vocês têm liberdade para escolher tudo!

São realmente necessárias 4 semanas?

Não, depende da sua disponibilidade — você pode desenvolver um bom projeto em uma semana. Levamos em conta que as pessoas estudam e trabalham, por isso damos mais tempo do que o necessário para que todo mundo possa participar. Também queremos lhes dar tempo extra para que aproveitem a oportunidade de assistir ao vivo às palestras e mentorias realizadas durante o hackathon.

Até quando posso criar uma equipe?

EDITADO: Damos as boas-vindas a novas equipes até 23 de maio. O dia final para a entrega dos projetos é 31 de maio.

Como faço para entrar em uma equipe?

Leia a seção “Para criar uma equipe:” no início desta página e o README no canal #encuentra-equipo do nosso servidor do Discord :)

Pode haver equipes de 1 pessoa?

Sim, aceitamos equipes de 1 a 5 pessoas.

Como vocês recomendam nos organizarmos?
  • Usar o canal do seu projeto no Discord para se comunicar e se organizar.
  • Como é um hackathon internacional, recomendamos uma comunicação assíncrona ou que vocês dividam o trabalho e façam reuniões com menos pessoas.
  • Marcar reuniões ou conversar espontaneamente utilizando os novos canais de voz da categoria “SALAS DE REUNIÃO” do Discord.
  • Fixar no canal do projeto as mensagens importantes, por exemplo: divisão de tarefas, dia da próxima reunião, … Para fixar uma mensagem, clique nos três pontinhos e selecione “Fixar mensagem”.
  • Para maior clareza, vocês também podem criar um documento compartilhado com as pessoas da equipe em que escrevam o objetivo do projeto, dividam as tarefas, etc. (e fixem o link no chat).
Não entendo o Discord. Quais são os canais mais importantes?
  • Confira o canal #anuncios — recomendamos ativar as notificações do canal, publicamos 2 ou 3 vezes por semana.
  • Tire suas dúvidas no canal #pide-ayuda do Discord para que todo mundo possa se beneficiar da resposta.
  • Anunciamos os eventos no canal #eventos e os adicionamos ao calendário do Google.
Como posso ficar sabendo dos eventos?
Como posso dar feedback do evento?
  • Você pode nos dar feedback para melhorar os guias dos desafios com este formulário (anônimo)
  • Também compartilharemos um formulário de feedback geral ao final do evento

Se dissemos a você que nesta página há informações que não está encontrando, apague os cookies e recarregue a página.


🤗 Conecte-se!

Para ficar por dentro de todos os eventos e novidades: