#HackathonSomosNLP 2025

Vamos impulsionar a criação de modelos de linguagem alinhados com a cultura dos países da América Latina e da Península Ibérica.


Existem 600M de falantes de espanhol e 265M de falantes de português no mundo. O espanhol e o português são os idiomas principais em 29 países, cada um com uma rica cultura. Embora os modelos de linguagem apresentem capacidades multilíngues cada vez melhores, eles são realmente multiculturais? Junte-se agora ao #HackathonSomosNLP, o maior hackathon open-source de Processamento de Linguagem Natural em espanhol e português! 🚀

Nas edições anteriores, contamos com mais de 1500 participantes de 30 países diferentes, superamos 20.000 visualizações de nossos eventos, aprendemos com 20 palestrantes e desenvolvemos 50 projetos relacionados aos Objetivos de Desenvolvimento Sustentável da ONU, demonstrando o potencial do PLN para abordar desafios sociais. Voltamos por isso e muito mais! 💪

Nesta quarta edição, vamos nos concentrar na criação de recursos que nos permitamavaliar e melhorar a adequação cultural dos grandes modelos de linguagem em relação a cada um dos países da América Latina e da Península Ibérica.

O melhor? TODO MUNDO pode colaborar! 🎉

Aqui estão todos os formulários, continue lendo para mais informações.

GIF Hackathon #Somos600M

🚀 Como você pode colaborar

Clique em cada uma das opções a seguir para saber mais:

💻 Crie um modelo de linguagem alinhado com sua cultura

Ao participar deste hackathon, você terá a oportunidade de desenvolver e aplicar seus conhecimentos em treinamento de LLMs para criar modelos de qualidade e inclusivos em seu idioma. Você terá acesso a APIs de modelos de última geração, a possibilidade de ganhar prêmios, participar de sorteios, assistir a palestras, workshops e sessões de mentoria, publicar um artigo… Inscreva-se já!

Cada equipe participante (1-5 pessoas) irá gerar um dataset, alinhar um LLM e criar uma demo para compartilhar seu ótimo trabalho com a comunidade.Também é possível contribuir apenas com o dataset.

Na SomosNLP, queremos incentivar você a participar independentemente de seus conhecimentos atuais. Organizaremos workshops práticos e sessões de mentoria para que tanto grupos de institutos de pesquisa quanto grupos de estudantes de graduação possam participar, todos os projetos somam!

💡 Assista às palestras dos especialistas

Na SomosNLP, acreditamos que a formação também é uma forma de colaborar com o futuro do PLN em espanhol. Durante as terças-feiras de abril, várias keynotes serão ministradas por profissionais do mundo do Processamento de Linguagem Natural. Estes eventos são gratuitos e abertos a todos.

E até abril chegar?As gravações das palestras anteriores estão disponíveis!

🧑‍🏫 Ofereça mentoria

Compartilhe sua experiência e conhecimento apoiando as equipes participantes na criação de bases de dados de qualidade e no treinamento de um bom LLM. Você pode fornecer mentoria pontual ou contínua. Pense em seus pontos fortes e ofereça mentoria!

🙌 Patrocine este evento maravilhoso

A SomosNLP é uma comunidade sem fins lucrativos, buscamos doações, prêmios e visibilidade para alcançar nossos objetivos ambiciosos e aproximar os modelos de linguagem do mundo hispânico. Toda ajuda é bem-vinda, descubra como você pode apoiar nossa missão oferecendovisibilidade, vouchers e doações. Contamos com você!

📣 Ajude-nos a divulgar

Ajude-nos a divulgar o evento em sua rede para que esta iniciativa alcance mais pessoas, todo apoio é bem-vindo! Além disso, após 4 publicações, adicionaremos seu logotipo ao site na seção “Patrocínios da Comunidade”.

🤗 Junte-se à equipe

Você pode colaborar criando conteúdo, recursos de apoio (por exemplo, tutoriais), escrevendo artigos ou pesquisando sobre PLN Cultural.

💡 Palestras e mentorias

Você terá a oportunidade de aprender com líderes da academia e da indústria, iremos anunciar novas palestras e mentorias!

👏 Agradecimentos

Muito obrigado pelo seu tempo e por nos apoiar para que nossa iniciativa possa ir mais longe. Vamos tornar os modelos de linguagem mais inclusivos!

🚀 Organizado por

SomosNLP

CENIA

Universidad Politécnica de Madrid

💎 Platina

Cohere For AI

🥇 Ouro

Hugging Face

🥈 Prata

UPM - Eunomia

MistralAI

🌟 Comunidade

Saturdays AI
DiverTLes
Grupo de Ingeniería Lingüística
Proyecto ILENIA
Sociedad Española de Procesamiento de Lenguaje Natural (SEPLN)
LatinX in AI
Mujeres Tech
Instituto de Ingeniería del Conocimiento
AI TINKERERS

🤗 Conecte-se!

Para ficar por dentro de todos os eventos e progressos: