Somos 600M de hispanofalantes e 265M de pessoas lusófonas no mundo. O espanhol e o português são os idiomas principais em 29 países, cada um deles com uma grande riqueza cultural. Embora os modelos de linguagem mostrem capacidades multilíngues cada vez maiores, são eles realmente multiculturais? Junte-se já ao #HackathonSomosNLP, o maior hackathon open-source de Processamento de Linguagem Natural em espanhol e português 🚀
📊 Lançamos a quinta edição!
Desde 2022, somamos…
Nesta quinta edição vamos nos concentrar na criação de recursos que nos permitam avaliar e melhorar a adequação cultural dos grandes modelos de linguagem em relação a cada um dos países da América Latina e da Península Ibérica.
O melhor? TODO MUNDO pode colaborar! 🎉

🚀 Como participar
Envie perguntas sobre sua cultura para LLMs
Faça perguntas a LLMs e escolha quais estão mais alinhados com sua cultura. Apto para todos os públicos!
Crie um modelo de linguagem
Desenvolva um LLM alinhado com sua cultura. Equipes de 1 a 5 pessoas: gere um dataset, alinhe um modelo e crie uma demo.
Ao participar, você terá a oportunidade de:
- ✨ Aprender com workshops e palestras ao vivo
- ✨ Acessar centenas de dólares em créditos de GPU e API para desenvolver seu projeto
- ✨ Ganhar prêmios no valor de 1500, 1000 ou 500 USD (1º, 2º e 3º prêmio)
- ✨ Ganhar ingressos para conferências e indicações para a rede de talentos Nova
- ✨ Ganhar mentorias com pessoas muito relevantes da área de PLN
- ✨ Copublicar papers em conferências internacionais de PLN
- ✨ Conseguir um certificado de participação (ou de equipe vencedora) do hackathon
Mãos à obra!
Tem dúvidas? Confira as perguntas frequentes e as informações de contato no final.
🚀 Como apoiar mais
Apoie a organização deste evento gratuito e sem fins lucrativos!
Divulgue o evento
Ajude-nos a fazer com que esta iniciativa chegue a mais pessoas. Com 4 publicações, adicionamos o logo de vocês ao site.
DivulgueJunte-se à equipe
Colabore criando conteúdo, recursos de apoio, tutoriais, artigos ou pesquisando sobre Cultural NLP.
Junte-seOfereça uma mentoria
Compartilhe sua experiência apoiando as equipes a criar datasets de qualidade e treinar bons LLMs. Mentorias pontuais ou contínuas.
Ofereça mentoriaPatrocine o evento
Apoie nossa missão oferecendo visibilidade, vales ou doações. A SomosNLP é uma comunidade sem fins lucrativos.
Ver opções🏆 Casos de sucesso
Os projetos do hackathon geram impacto real:
🏅 BiomedIA
Sistema voz a voz de perguntas e respostas biomédicas. Deu origem a um paper no NAACL 2022 com o Prêmio de Melhor Apresentação de Pôster.
⚖️ Modelo Jurídico Mexicano
Modelo de conhecimento jurídico utilizado pela Suprema Corte de Justiça da Nação do México.
📰 NoticIA
Corpus de 850 artigos de notícias clickbait em espanhol com resumos de alta qualidade, abordando a desinformação digital. Publicado no SEPLN 2024.
🤝 AsistenciaRefugiados
Assistente jurídico para pessoas em situação de refúgio, facilitando o acesso à informação sobre legislação na Espanha.
🤝 BERT Sustentável
Identificação de textos relacionados à mudança climática e à sustentabilidade utilizando modelos de linguagem pré-treinados em espanhol. LatinX in AI (LXAI) Research Workshop @NAACL 2024. Melhor paper no KHIPU 2025.
🤝 Cozinha saudável
Aprendendo a cozinhar de forma saudável com Large Language Models, Supervised Fine Tuning e Retrieval Augmented Generation. LatinX in AI (LXAI) Research Workshop @NAACL 2024.
📚 Dataset de instruções
Foram geradas mais de 1M de instruções, criando o maior dataset de treinamento supervisionado em espanhol. Paper #Somos600M publicado no workshop LatinX in NLP @NAACL 2024. Entrevista no jornal El País.
📚 INCLUDE: Benchmark de conhecimento cultural
Foram coletadas mais de 38.000 perguntas de exames de 23 países, criando o maior benchmark de avaliação de conhecimento cultural para LLMs em espanhol e português.
💡 Palestras e mentorias
Você terá a oportunidade de aprender com líderes da academia e da indústria. Iremos anunciando novas palestras e mentorias!
👏 Agradecimentos
Muitíssimo obrigado pelo seu tempo e por nos apoiar para que nossa iniciativa chegue mais longe. Vamos tornar os modelos de linguagem mais inclusivos!
🚀 Organizado por
🥇 Patrocínios Ouro
🥈 Patrocínios Prata
❓ Perguntas frequentes
Por que eu deveria participar?
Ao se juntar a este hackathon você terá a oportunidade de:
- ✅ Entender como funcionam os grandes modelos de linguagem, tanto textuais (LLMs) quanto multimodais (VLLMs) e descobrir os desafios de cada etapa do seu desenvolvimento: criação do corpus, treinamento, alinhamento e avaliação
- ✅ Participar da criação do primeiro corpus de preferências de qualidade e diverso para alinhar LLMs com a cultura dos países da América Latina e da Península Ibérica (excelente como experiência e excelente para o currículo)
- ✅ Fazer parte da equipe que cria algumas das bases de dados do primeiro leaderboard aberto de LLMs em espanhol: La Leaderboard
- ✅ Tirar todas as suas dúvidas sobre PLN durante sessões de mentoria “Ask Me Anything”
- ✅ Receber apoio para apresentar seu trabalho em um paper
- ✅ Ganhar prêmios para continuar crescendo profissionalmente e conseguir um certificado para compartilhar no LinkedIn
- ✅ Juntar-se à maior comunidade de hispanofalantes que estudam, trabalham e pesquisam em PLN
Qual é o nível necessário?
Na equipe da SomosNLP queremos incentivá-lo a participar independentemente dos seus conhecimentos atuais. Em edições anteriores, contamos com grupos de institutos de pesquisa e grupos de estudantes de graduação — todos os projetos somam!
- 📖 Ministraremos uma série de workshops práticos mostrando como desenvolver um projeto para que você tenha um exemplo de referência.
- ❓ Organizaremos AMAs (do inglês, Ask Me Anything) com especialistas e mentores para que possam tirar suas dúvidas.
Do que depende a complexidade dos projetos?
Forneceremos um exemplo de como criar um dataset, treinar um modelo e criar uma demo. Depende de você e da sua equipe decidir o quanto pesquisar e trabalhar para melhorar a versão base. A dificuldade também depende do caso de uso, da origem dos dados, do tempo que dedicarem à curadoria deles, da técnica de treinamento, das iterações que fizerem e do quão elaborada quiserem que seja sua demo. Vocês têm liberdade para escolher tudo!
São realmente necessárias 4 semanas?
Não, depende da sua disponibilidade — você pode desenvolver um bom projeto em uma semana. Levamos em conta que as pessoas estudam e trabalham, por isso damos mais tempo do que o necessário para que todo mundo possa participar. Também queremos lhes dar tempo extra para que aproveitem a oportunidade de assistir ao vivo às palestras e mentorias realizadas durante o hackathon.
Até quando posso criar uma equipe?
EDITADO: Damos as boas-vindas a novas equipes até 23 de maio. O dia final para a entrega dos projetos é 31 de maio.
Como faço para entrar em uma equipe?
Leia a seção “Para criar uma equipe:” no início desta página e o README no canal #encuentra-equipo do nosso servidor do Discord :)
Pode haver equipes de 1 pessoa?
Sim, aceitamos equipes de 1 a 5 pessoas.
Como vocês recomendam nos organizarmos?
- Usar o canal do seu projeto no Discord para se comunicar e se organizar.
- Como é um hackathon internacional, recomendamos uma comunicação assíncrona ou que vocês dividam o trabalho e façam reuniões com menos pessoas.
- Marcar reuniões ou conversar espontaneamente utilizando os novos canais de voz da categoria “SALAS DE REUNIÃO” do Discord.
- Fixar no canal do projeto as mensagens importantes, por exemplo: divisão de tarefas, dia da próxima reunião, … Para fixar uma mensagem, clique nos três pontinhos e selecione “Fixar mensagem”.
- Para maior clareza, vocês também podem criar um documento compartilhado com as pessoas da equipe em que escrevam o objetivo do projeto, dividam as tarefas, etc. (e fixem o link no chat).
Não entendo o Discord. Quais são os canais mais importantes?
- Confira o canal #anuncios — recomendamos ativar as notificações do canal, publicamos 2 ou 3 vezes por semana.
- Tire suas dúvidas no canal #pide-ayuda do Discord para que todo mundo possa se beneficiar da resposta.
- Anunciamos os eventos no canal #eventos e os adicionamos ao calendário do Google.
Como posso ficar sabendo dos eventos?
- Anunciamos os eventos no canal #eventos
- Adicionamos ao calendário do Google
- Divulgamos nas redes sociais (LinkedIn, X (Twitter))
- Siga-nos no YouTube e salve a playlist do hackathon 2026
Como posso dar feedback do evento?
- Você pode nos dar feedback para melhorar os guias dos desafios com este formulário (anônimo)
- Também compartilharemos um formulário de feedback geral ao final do evento
Se dissemos a você que nesta página há informações que não está encontrando, apague os cookies e recarregue a página.
🤗 Conecte-se!
Para ficar por dentro de todos os eventos e novidades:









