Desafios #HackathonSomosNLP 2026

O hackathon deste ano foca na criação de recursos que permitam avaliar e alinhar modelos de linguagem com a cultura dos países da América Latina e da Península Ibérica. O hackathon foi prorrogado até 31 DE MAIO.

O hackathon é composto por um desafio principal e por vários mini desafios, com os quais vocês também podem acumular pontos para os prêmios finais e ganhar prêmios extras. A pontuação máxima total é de 10 pontos.

Nesta página você vai encontrar informação sobre:

Primeiros passos
Incentivos e prêmios
Mini desafios
Desafio principal
Perguntas frequentes

Boa sorte! 🚀

👣 Primeiros passos

Antes de começar, todo mundo precisa:

✅ Entrar no servidor do Discord da SomosNLP
✅ Criar uma conta no Hugging Face
✅ Preencher o formulário de inscrição
✅ Entrar na organização do hackathon no Hugging Face, onde os datasets, modelos e demos vão ser compartilhados

Para criar uma equipe:

Você pode se inscrever com pessoas que já conhece (por exemplo, a galera da turma ou do trabalho) ou conhecer pessoas da comunidade SomosNLP de outros países, universidades e empresas. Se quiser conhecer pessoas novas, dá uma olhada no canal #encuentra-equipo
Depois de formar a equipe, UMA pessoa precisa registrar a equipe

👏 Incentivos e prêmios

Ao participar você terá a oportunidade de:

✨ Aprender com workshops e palestras ao vivo
✨ Ganhar acesso a 500 USD em créditos da API da Cohere
✨ Ganhar acesso a uma GPU L40S do Hugging Face
✨ Ganhar 1000 USD em créditos da API da Mistral
✨ Ganhar centenas de USD em créditos GPU e livros de IA e linguagem
✨ Ganhar acesso a um Mestrado online de IA
✨ Ganhar um ingresso para a conferência online da WomenTech Network
✨ Ganhar uma indicação para a rede de talentos Nova
✨ Ganhar mentorias com pessoas de referência da área de PLN
✨ Copublicar papers em conferências internacionais de PLN
✨ Conseguir um certificado de participação (ou de equipe vencedora) do hackathon

Mãos à obra! 🚀

✨ Mini desafios

Participe destes mini desafios para ajudar a criar bases de dados que avaliem o conhecimento cultural e os estereótipos dos LLMs. Você vai acumular pontos e pode ganhar prêmios extras!

Exames (INCLUDE)

Procure exames de múltipla escolha para avaliar o quanto os LLMs sabem sobre o seu país. Priorize exames em línguas diferentes do espanhol e/ou focados em temas culturais (e.g. história, literatura).

9 de abril a 31 de maio

Puntos máximos: 1 ponto

Requisitos: Saber pesquisar na internet

Perguntas culturais (BLEND)

Responda perguntas sobre o seu país para avaliar o conhecimento cultural dos LLMs. Vamos usar essas respostas para estender o benchmark aberto BLEND.

14 de abril a 31 de maio

Puntos máximos: 2 pontos

Requisitos: Ter vivido em sociedade

🔥 Desafio principal

Gere um dataset de preferências
Alinhe um modelo textual (opção A) ou multimodal (opção B), à sua escolha
Crie uma demo do seu projeto
Apresente seu projeto num vídeo de 5 minutos
(Opcional) escreva um paper apresentando o seu projeto

1. Gere um dataset de preferências

Crie prompts que avaliem a adequação cultural com o seu país e escolha a melhor resposta numa LLM Arena. Os prompts e as respostas serão coletados e compartilhados com todas as equipes participantes como dataset de preferências v0 para a fase de alinhamento.

14 de abril a 21 de maio

Puntos máximos: 3 pontos

Requisitos: Ter vivido em sociedade e querer entender bem o conceito de adequação cultural

2.A. Alinhe um modelo textual (LLM)

Processe, filtre e estenda o dataset de preferências v0 adaptando para o seu caso de uso. Use o dataset para alinhar um LLM com técnicas de treinamento otimizado e alinhamento como LoRA, quantização e otimização direta de preferências (DPO).

21 de abril a 31 de maio (Máx. 2 semanas)

Puntos máximos: 3 pontos

Requisitos: Saber programar

2.B. Alinhe um modelo multimodal

Gere um dataset de imagens e descrições usando a API da Cohere. Use o dataset para criar um modelo multimodal (VLLM) que gere descrições de imagens levando em conta o contexto, com as últimas técnicas de treinamento otimizado.

21 de abril a 31 de maio (Máx. 2 semanas)

Puntos máximos: 3 pontos

Requisitos: Ter experiência em PLN

3. Crie uma demo

Crie uma demo do seu projeto num Space do Hugging Face para que todo mundo possa ver o seu trabalho.

Até 31 de maio

Puntos máximos: 0,5 pontos

Requisitos: Ter completado um desafio principal

4. Grave um vídeo

Grave um vídeo de 5 minutos apresentando seu projeto para o júri e para o resto da comunidade.

Envio até 1 de junho

Puntos máximos: 0,5 pontos

Requisitos: Ter completado um desafio principal

5. (Opcional) Escreva um paper

Escreva um paper descrevendo o seu projeto. Se tiver interesse, podemos te orientar e ajudar a submeter para um workshop do LatinX in NLP.

A partir de junho

Puntos máximos: 0,5 pontos

Requisitos: Ter completado um desafio principal

❓ Perguntas frequentes

Por que eu deveria participar?

Ao entrar neste hackathon, você terá a oportunidade de:

✅ Entender como funcionam os grandes modelos de linguagem, tanto textuais (LLMs) quanto multimodais (VLLMs), e descobrir os desafios de cada etapa do desenvolvimento: criação do corpus, treinamento, alinhamento e avaliação
✅ Participar da criação do primeiro corpus de preferências de qualidade e diverso para alinhar LLMs com a cultura dos países da América Latina e da Península Ibérica (excelente como experiência e ótimo para o currículo)
✅ Fazer parte da equipe que cria algumas das bases de dados da primeira leaderboard aberta de LLMs em espanhol: La Leaderboard
✅ Tirar todas as suas dúvidas sobre PLN durante sessões de mentoria “Ask Me Anything”
✅ Receber apoio para apresentar seu trabalho em um paper
✅ Ganhar prêmios para continuar crescendo profissionalmente e um certificado para compartilhar no LinkedIn
✅ Entrar na maior comunidade de pessoas lusófonas e hispanofalantes que estudam, trabalham e pesquisam em PLN

Qual é o nível necessário?

A equipe da SomosNLP quer incentivar você a participar, independentemente dos seus conhecimentos atuais. Em edições anteriores contamos com grupos de institutos de pesquisa e grupos de estudantes de graduação. Todos os projetos contam!

📖 Vamos dar uma série de workshops práticos mostrando como desenvolver um projeto, para você ter um exemplo de referência.

❓ Vamos organizar AMAs (do inglês, Ask Me Anything) com especialistas e mentores para tirar suas dúvidas.

De que depende a complexidade dos projetos?

Vamos disponibilizar um exemplo de como criar um dataset, treinar um modelo e criar uma demo. Cabe a você e à sua equipe decidir o quanto pesquisar e trabalhar para melhorar a versão base. A dificuldade também depende do caso de uso, da origem dos dados, do tempo dedicado à curadoria, da técnica de treinamento, das iterações que fizerem e do quão elaborada quiserem que seja a demo. Vocês têm liberdade para escolher tudo!

São mesmo necessárias 4 semanas?

Não, depende da sua disponibilidade. Você pode desenvolver um bom projeto em uma semana. Sabemos que as pessoas estudam e trabalham, por isso damos mais tempo do que o necessário para que todo mundo possa participar. Também queremos te dar tempo extra para aproveitar a oportunidade de assistir ao vivo às palestras e mentorias do hackathon.

Até quando posso criar uma equipe?

EDITADO: Damos as boas vindas a novas equipes até 23 de maio. O dia final para a entrega de projetos é 31 de maio.

Como entro em uma equipe?

Leia a seção “Para criar uma equipe:” no início desta página e o README no canal #encuentra-equipo do nosso servidor do Discord :)

Pode haver equipes de 1 pessoa?

Sim, aceitamos equipes de 1 a 5 pessoas.

Como vocês recomendam que a gente se organize?

Usem o canal do projeto de vocês no Discord para se comunicar e se organizar.
Como é um hackathon internacional, recomendamos comunicação assíncrona ou que vocês dividam o trabalho e façam reuniões com menos pessoas.
Marquem reuniões ou conversem espontaneamente usando os novos canais de voz da categoria “SALAS DE REUNIÓN” do Discord.
Fixem no canal do projeto as mensagens importantes. Por exemplo: divisão de tarefas, dia da próxima reunião, etc. Para fixar uma mensagem, clique nos três pontinhos e selecione “Fixar mensagem”.
Para maior clareza, vocês também podem criar um documento compartilhado entre os membros da equipe para anotar o objetivo do projeto, dividir tarefas e por aí vai (e fixem o link no chat).

Não entendo o Discord. Quais são os canais mais importantes?

Confira o canal #anuncios. Recomendamos ativar as notificações do canal, publicamos 2 a 3 vezes por semana.
Tire suas dúvidas no canal #pide-ayuda do Discord para que todo mundo possa se beneficiar da resposta.
Anunciamos os eventos no canal #eventos e adicionamos ao Google Calendar.

Como posso ficar sabendo dos eventos?

Anunciamos os eventos no canal #eventos
Os adicionamos ao Google Calendar
Divulgamos nas redes sociais (LinkedIn, X (Twitter))
Siga a gente no YouTube e salve a playlist do hackathon 2026

Como posso dar feedback sobre o evento?

Você pode dar feedback para a gente melhorar os guias dos desafios neste formulário (anônimo)
Vamos compartilhar um formulário de feedback geral no final do evento

Se a gente disse que tem alguma informação nesta página que você não está achando, apague os cookies e recarregue a página.

🙌 Outras formas de apoiar a adequação cultural dos LLMs

Como posso colaborar?

Compartilhe as publicações das contas da @SomosNLP (LinkedIn, X (Twitter)) e convide seus colegas de trabalho e da turma a formar uma equipe!

Está na universidade? Compartilhe esta informação com o seu professor(a) ou com alguém do grupo de IA/informática para que sua universidade colabore com o evento.

Quer apoiar a iniciativa com visibilidade, vouchers patrocinados ou uma doação financeira? Patrocine o hackathon!