Somos 265M de pessoas lusófonas e 600M de hispanofalantes no mundo. O português e o espanhol são as línguas principais de 29 países, cada um com uma enorme riqueza cultural. Os modelos de linguagem mostram capacidades multilíngues cada vez maiores, mas será que são realmente multiculturais? Participe do #HackathonSomosNLP, o maior hackathon open source de Processamento de Linguagem Natural em português e espanhol 🚀
📊 Chegou a quinta edição!
Desde 2022, já somamos…
Nesta quinta edição vamos focar na criação de recursos que nos permitam avaliar e melhorar a adequação cultural dos grandes modelos de linguagem para cada um dos países da América Latina e da Península Ibérica.
E o melhor? TODO MUNDO pode colaborar! 🎉

🚀 Como participar
Faça perguntas sobre sua cultura para LLMs
Envie prompts para LLMs e escolha quais estão mais alinhados com sua cultura. Aberto para todos os públicos!
Crie um modelo de linguagem
Desenvolva um LLM alinhado com sua cultura. Equipes de 1 a 5 pessoas: gere um dataset, alinhe um modelo e crie uma demo.
Ao participar, você terá a oportunidade de:
- ✨ Aprender com workshops e palestras ao vivo
- ✨ Acessar centenas de dólares em créditos de GPU e API para desenvolver seu projeto
- ✨ Ganhar prêmios no valor de 1500, 1000 ou 500 USD (1º, 2º e 3º prêmio)
- ✨ Ganhar ingressos para conferências e indicações para a rede de talentos Nova
- ✨ Ganhar mentorias com pessoas de referência na área de PLN
- ✨ Copublicar papers em conferências internacionais de PLN
- ✨ Conseguir um certificado de participação (ou de equipe vencedora) do hackathon
Mãos à obra!
Tem dúvidas? Confira as perguntas frequentes e as informações de contato no final.
🚀 Como apoiar mais
Apoie a organização deste evento gratuito e sem fins lucrativos!
Divulgue o evento
Ajude a gente a fazer essa iniciativa chegar a mais pessoas. Com 4 publicações, adicionamos o logo de vocês ao site.
DivulgueEntre na equipe
Colabore criando conteúdo, recursos de apoio, tutoriais e artigos, ou pesquisando sobre Cultural NLP.
Quero entrarOfereça uma mentoria
Compartilhe sua experiência apoiando as equipes a criar datasets de qualidade e treinar bons LLMs. Mentorias pontuais ou contínuas.
Ofereça mentoriaPatrocine o evento
Apoie nossa missão com visibilidade, vouchers ou doações. A SomosNLP é uma comunidade sem fins lucrativos.
Ver opções🏆 Casos de sucesso
Os projetos do hackathon geram impacto real:
🏅 BiomedIA
Sistema voz a voz de Q&A biomédico. Deu origem a um paper na NAACL 2022 com o Prêmio de Melhor Apresentação de Pôster.
⚖️ Modelo Jurídico Mexicano
Modelo de conhecimento jurídico utilizado pela Suprema Corte de Justiça da Nação do México.
📰 NoticIA
Corpus de 850 artigos de notícias clickbait em espanhol com resumos de alta qualidade, combatendo a desinformação digital. Paper publicado em SEPLN 2024.
🤝 AsistenciaRefugiados
Assistente jurídico para pessoas em situação de refúgio, facilitando o acesso a informações sobre legislação na Espanha.
🤝 BERT Sustentável
Identificação de textos relacionados às mudanças climáticas e à sustentabilidade utilizando modelos de linguagem pré treinados em espanhol. LatinX in AI (LXAI) Research Workshop @NAACL 2024. Melhor paper no KHIPU 2025.
🤝 Cozinha saudável
Aprendendo a cozinhar de forma saudável com Large Language Models, Supervised Fine Tuning e Retrieval Augmented Generation. LatinX in AI (LXAI) Research Workshop @NAACL 2024.
📚 Dataset de instruções
Foram geradas mais de 1M de instruções, criando o maior dataset de treinamento supervisionado em espanhol. Paper #Somos600M publicado no workshop LatinX in NLP @NAACL 2024. Entrevista no jornal El País.
📚 INCLUDE: Benchmark de conhecimento cultural
Foram coletadas mais de 38.000 perguntas de exames de 23 países, criando o maior benchmark de avaliação de conhecimento cultural para LLMs em espanhol e português.
💡 Palestras e mentorias
Você terá a oportunidade de aprender com pessoas de referência da academia e da indústria!
👏 Agradecimentos
Muito obrigada pelo seu tempo e por nos apoiar para que essa iniciativa chegue mais longe. Vamos tornar os modelos de linguagem mais inclusivos!
🚀 Organizado por
🥇 Patrocínios Ouro
🥈 Patrocínios Prata
❓ Perguntas frequentes
Por que eu deveria participar?
Ao entrar neste hackathon, você terá a oportunidade de:
- ✅ Entender como funcionam os grandes modelos de linguagem e descobrir os desafios de cada etapa do desenvolvimento: criação do corpus, treinamento, alinhamento e avaliação
- ✅ Participar da criação do primeiro corpus de preferências de qualidade e diverso para alinhar LLMs com a cultura dos países da América Latina e da Península Ibérica (excelente como experiência e ótimo para o currículo)
- ✅ Tirar todas as suas dúvidas sobre PLN durante sessões de mentoria “Ask Me Anything”
- ✅ Receber apoio para apresentar seu trabalho em um paper
- ✅ Ganhar prêmios para continuar crescendo profissionalmente e um certificado para compartilhar no LinkedIn
- ✅ Entrar na maior comunidade de pessoas lusófonas e hispanofalantes que estudam, trabalham e pesquisam em PLN
Qual é o nível necessário?
A equipe da SomosNLP quer incentivar você a participar, independentemente dos seus conhecimentos atuais. Em edições anteriores contamos com grupos de institutos de pesquisa e grupos de estudantes de graduação. Todos os projetos contam!
- 📖 Vamos dar um workshop mostrando como desenvolver um projeto, para você ter um exemplo de referência.
- ❓ Vamos organizar AMAs (do inglês, Ask Me Anything) com especialistas e mentores para tirar suas dúvidas.
Do que depende a complexidade dos projetos?
Vamos disponibilizar um exemplo de como criar um dataset, treinar um modelo e criar uma demo. Cabe a você e à sua equipe decidir o quanto pesquisar e trabalhar para melhorar a versão base. A dificuldade também depende do caso de uso, da origem dos dados, do tempo dedicado à curadoria, da técnica de treinamento, das iterações que fizerem e do quão elaborada quiserem que seja a demo. Vocês têm liberdade para escolher tudo!
São mesmo necessárias 4 semanas?
Não, depende da sua disponibilidade. Você pode desenvolver um bom projeto em uma semana. Sabemos que as pessoas estudam e trabalham, por isso damos mais tempo do que o necessário para que todo mundo possa participar. Também queremos te dar tempo extra para aproveitar a oportunidade de assistir ao vivo às palestras e mentorias do hackathon.
Até quando posso criar uma equipe?
EDITADO: Damos as boas vindas a novas equipes até 23 de maio. O dia final para a entrega dos projetos é 31 de maio.
Como entro em uma equipe?
Leia a seção “Para criar uma equipe:” na página de desafios e o README no canal #encuentra-equipo do nosso servidor do Discord :)
Pode haver equipes de 1 pessoa?
Sim, aceitamos equipes de 1 a 5 pessoas.
Como vocês recomendam que a gente se organize?
- Usem o canal do projeto de vocês no Discord para se comunicar e se organizar.
- Como é um hackathon internacional, recomendamos comunicação assíncrona ou que dividam o trabalho e façam reuniões com menos pessoas.
- Marquem reuniões ou conversem espontaneamente usando os novos canais de voz da categoria “SALAS DE REUNIÓN” do Discord.
- Fixem no canal do projeto as mensagens importantes. Por exemplo: divisão de tarefas, dia da próxima reunião, etc. Para fixar uma mensagem, clique nos três pontinhos e selecione “Fixar mensagem”.
- Para maior clareza, vocês também podem criar um documento compartilhado entre os membros da equipe para anotar o objetivo do projeto, dividir tarefas e por aí vai (e fixem o link no chat).
Não entendo o Discord. Quais são os canais mais importantes?
- Confira o canal #anuncios. Recomendamos ativar as notificações do canal, publicamos 2 a 3 vezes por semana.
- Tire suas dúvidas no canal #pide-ayuda do Discord para que todo mundo possa se beneficiar da resposta.
- Anunciamos os eventos no canal #eventos e adicionamos ao Google Calendar.
Como posso ficar sabendo dos eventos?
- Anunciamos os eventos no canal #eventos
- Adicionamos ao Google Calendar
- Divulgamos nas redes sociais (LinkedIn, X (Twitter))
- Siga a gente no YouTube e salve a playlist do hackathon 2026
Como posso dar feedback sobre o evento?
- Vamos compartilhar um formulário de feedback geral no final do evento
Se a gente disse que tem alguma informação nesta página que você não está encontrando, apague os cookies e recarregue a página.
🤗 Vem com a gente!
Para ficar por dentro de todos os eventos e novidades:









