Crie prompts que avaliem a adequação cultural com o seu país e escolha a melhor resposta numa LLM Arena. Os prompts e as respostas serão coletados e compartilhados com todas as equipes participantes como dataset de preferências v0 para a fase de alinhamento. Para este desafio você terá acesso a uma LLM Arena com 5 modelos de grande porte ou proprietários.
- Leia o guia abaixo para aprender a criar prompts de qualidade.
🌎 Gere apenas prompts relacionados com o país ou países com os quais você tenha um vínculo forte o suficiente para conhecer a cultura local.
🎯 Objetivo
O objetivo deste desafio é criar, entre todas as equipes, um dataset que permita alinhar LLMs com a cultura dos países da América Latina e da Península Ibérica. Para isso, cada equipe precisa:
- Criar prompts seguindo o guia a seguir
- Enviar seus prompts a uma LLM Arena e escolher a melhor resposta
- Em paralelo, ir validando os prompts e respostas de outras equipes
- Vamos publicar o conjunto de prompts e respostas
🚨 Leia com atenção os guias abaixo para mais detalhes de cada passo. Leva menos de 10 minutos e é imprescindível para garantir a qualidade e homogeneidade dos dados, muito importante para dar continuidade ao projeto de vocês. Não serão considerados prompts e respostas de equipes que não tenham seguido as instruções.
🤗 Como criar equipes
Como criar equipes
- Podem ser homogêneas (todas as pessoas são do mesmo país) ou heterogêneas (de países de origem diferentes)
- Equipes homogêneas
- É mais provável que os prompts sejam mais ou menos padrão, já que vão estar representando uma mesma cultura. Quanto às respostas, pode haver mais de uma que se considere culturalmente adequada, dependendo da região.
- Vocês podem reutilizar os prompts e responder levando em conta a perspectiva de diferentes regiões.
- Equipes heterogêneas
- É provável que haja variedade tanto nos prompts quanto nas respostas consideradas culturalmente adequadas.
- Vocês podem reutilizar os prompts e responder levando em conta a perspectiva de diferentes países.
- Equipes homogêneas
- Não é necessário que os prompts que vocês enviarem à LLM Arena estejam relacionados com o objetivo final com o qual querem alinhar o seu LLM.
💡 Recomendação
- Decidam se querem trabalhar em uma equipe homogênea ou heterogênea. Recomendamos um meio termo: equipes que incluam 2 ou 3 países.
- Comecem a criar prompts representando diferentes abordagens à cultura dos países representados.
- Decidam o tema do projeto (relacionado com a adequação cultural!) para levarem em conta, se quiserem, no design dos prompts. De qualquer forma, vão ter créditos para estender o dataset comum com mais prompts criados especificamente para o caso de uso de vocês.
👀 1. As definições
O principal objetivo do hackathon, e em particular deste desafio, é melhorar a “adequação cultural” dos LLMs. Vamos ver o que isso significa. Começamos com algumas definições:
Cultura
No seu sentido etnográfico amplo, a cultura é esse todo complexo que inclui o conhecimento, a crença, a arte, a moral, o direito, o costume e qualquer outra capacidade e hábito adquirido pelo homem como membro da sociedade. (ref)
Apenas podemos considerar elementos da cultura tradicional aqueles que a comunidade conserva e transmite. […] Esta aceitação, e portanto a literariedade tradicional, popular ou folclórica, dependerá de o texto se ajustar a uma linguagem determinada, a estruturas específicas, coincidir com determinados temas e ser criado a partir de uma estética coletiva. (ref)




Multiculturalidade
Existência de várias culturas que convivem em um mesmo espaço físico, geográfico ou social. Abrange todas as diferenças que se enquadram dentro da cultura, sejam religiosas, linguísticas, raciais, étnicas ou de gênero. (ref)
Perante a comunidade, reconhece se a diversidade em todos os âmbitos e o respeito por ela mesma, promovendo direitos para cada uma das culturas incluídas.





Adequação cultural
Algo é adequado em relação ao propósito do que se faz. No caso da linguagem, a adequação pode ser entendida como uma relação entre o propósito comunicativo (intenção ou motivação do remetente em relação ao destinatário ao se comunicar) e os meios linguísticos escolhidos.
O propósito comunicativo se relaciona com o que e como queremos comunicar uma mensagem. Os meios linguísticos são as palavras e formas gramaticais que usamos. Por exemplo, as duas frases a seguir cumprem o propósito de pedir uma explicação:
- Você poderia me explicar, por favor?
- Me explique.
A frase #1 transmite um pedido indireto e cortês usando o futuro do pretérito (“poderia”). A inclusão da expressão “por favor” reforça a cortesia. A frase #2 transmite um pedido direto pela forma do imperativo afirmativo do verbo “explicar”. É menos cortês que a frase #1.
Como a cultura influencia a escolha dos meios linguísticos?
- A cultura influencia as palavras (i.e. escolhas léxicas) e as formas gramaticais que usamos. Alguns exemplos:
Escolhas léxicas
| Português de Portugal | Português do Brasil |
|---|---|
| Casaco | Jaqueta |
| Computador | Computador |
| Hora(s) de ponta | Hora(s) do rush |
| Entrar em | Entrar em |
| Tenho vergonha | Tenho vergonha |
Formas gramaticais
| Português de Portugal | Português do Brasil |
|---|---|
| Pretérito perfeito composto (e.g. tem ido) | Pretérito perfeito simples (e.g. foi) |
Diferentes propósitos comunicativos
| Propósito comunicativo | Meio linguístico | Exemplo |
|---|---|---|
| Carinho | Forma gramatical: Diminutivo | Como você está, Edgarzinho? |
| Minimizar | Forma gramatical: Diminutivo | Naquela casinha. |
| Afirmação | Escolha léxica: Bom | Ah, bom, Bom… tá bem |
| Reorientação | Escolha léxica: Bom | Bom… como eu estava dizendo |
| Correção | Escolha léxica: Bom | Bom, a gente fala assim, né? |



Como a cultura afeta a capacidade de um LLM de entender uma língua?
- Na comunicação: os propósitos comunicativos são diretamente afetados pelas palavras e formas gramaticais usadas. Quanto mais palavras específicas de um país uma frase tiver (por exemplo, do Brasil), mais difícil pode ser entender para alguém (ou algo: um LLM) que não esteja familiarizado com essa cultura.
- Na percepção do mundo: códigos morais (i.e. o que é bom, o que é ruim), atividades comuns (e.g. ir a uma luta livre, ir ao samba), etc.






🎨 2. Como criar os prompts
2.1. Características gerais
Os prompts devem ser:
- Não triviais: evite perguntas factuais simples (e.g. “Qual é a capital do Brasil?”).
- Culturalmente situados: abordam temas comuns em uma região específica. Use papéis para contextualizar sua pergunta.
- Neutros: não devem induzir uma preferência política, religiosa ou ideológica forte. Esses temas podem ser tratados, mas sem incluir opiniões sobre qual é “melhor”.
💡 O que é um papel?
É uma função que uma pessoa desempenha em um lugar ou em uma situação. No PLN, este conceito começou a ser adotado na área de diálogo e sistemas interativos. De fato, é comum encontrar o termo “persona” em vez de “papel”, embora se refiram à mesma coisa.
Por que é um conceito importante nos LLMs?
A definição de papéis se tornou crucial para adaptar os LLMs a contextos específicos. De acordo com Tseng et al., 2024, há dois casos de uso:
- Interpretação de papéis: os LLMs têm a tarefa de desempenhar os papéis atribuídos e agir de acordo com o feedback do ambiente, adaptando se ao mesmo.
- Personalização: os LLMs têm a tarefa de gerenciar as personalidades dos usuários (e.g. antecedentes, como o país de origem) para satisfazer necessidades individualizadas e se adaptar a cada usuário.
Um exemplo do caso #1 é se quisermos simular a interação entre pessoas do Brasil. A pessoa que cria o prompt só precisa especificar as características do papel. Ela não toma parte na interação (i.e. não há interação humana).
No caso #2, pelo contrário, pode haver interação humana. Assim como em #1, existe um designer que define o papel que o LLM deve desempenhar. O LLM interage com um humano, respondendo a partir da perspectiva do papel atribuído.
Como definir um papel na LLM Arena?
Inclua no “System prompt”. Além do papel, recomendamos explicitar no System prompt que a resposta do LLM seja concisa e culturalmente adequada.
2.2. Exemplos de prompt (não exaustivos)
💡 Os prompts mostrados a seguir são apenas um guia
- Em relação aos papéis: cada equipe pode fazer sua própria definição! Pode ser algo simples (e.g. só especificar o país de origem) ou algo mais elaborado (i.e. incluir gênero, idade, etc.)
- Em relação às perguntas: tirar perguntas de um dataset ou de uma pesquisa é apenas uma opção. Vocês também podem redigir suas próprias perguntas!
1. Definir um papel, mostrar uma situação com múltiplas reações possíveis (como em MultiTP)
Por exemplo...
Papel: Pessoa do Brasil
Situação: Uso de espaços exclusivos
Imagine que você está no transporte público e observa que alguém
se senta e/ou coloca suas coisas em um dos assentos reservados
para gestantes, idosos e pessoas com deficiência.
Se entra uma pessoa que tem direito a usar esses
assentos e não consegue utilizá los, os demais
passageiros reagem...
Resposta 1 (seguindo o papel pré definido)
Com agressividade, exigindo que a pessoa que está fazendo mau uso
dos assentos se retire.
Resposta 2
Com indiferença. Ninguém diz nada.
2. Definir um papel e apresentar uma pergunta aberta/subjetiva (similar ao que fez Dolly)
Por exemplo...
Pergunta: gerada por alguém do Brasil
Papel: país de origem
System prompt: Você é um assistente de IA. Responda como se fosse
uma pessoa nativa de {pais_de_origem}.
Pergunta: É melhor ir de carro ou de metrô ao centro de São Paulo?
Resposta (exemplo):
O melhor é pegar o metrô. É mais rápido e mais seguro,
já que é difícil encontrar lugar para estacionar.
Tem vários estacionamentos públicos, mas não são muito
seguros.
ou
Pergunta: Quero sair com meus amigos no fim de semana em São Paulo.
O que a gente pode fazer para se divertir?
Me dê cinco ideias.
Resposta (exemplo):
Se você quer passar um fim de semana divertido com seus amigos, pode:
1. Andar de bicicleta no domingo na Avenida Paulista
2. Ir tomar um café em Pinheiros
3. Visitar o Parque Ibirapuera
4. Ir a um karaokê na Liberdade
5. Fazer um passeio de barco na Represa de Guarapiranga
3. Definir um papel, um comportamento e apresentar uma pergunta de múltipla escolha (como neste paper)
💡 Por exemplo...
- Papel (características): gênero, país de origem, educação, idade, classe social
- Pergunta: pergunta aberta
- Conjunto de respostas: tem duas possibilidades:
- Todas as opções são culturalmente adequadas, o modelo teria de escolher a mais adequada para o papel e explicar por quê
- Apenas 1 das opções é culturalmente adequada
- Comportamento (a resposta do LLM): deve ser congruente com o papel
Imagine que você é uma pessoa {gênero} do {país}.
Você tem {idade} anos e completou o nível educativo {educação}.
Se autodefine como parte de uma classe social {classe_social}.
Responda à seguinte pergunta a partir desta perspectiva.
Considere que outras pessoas vão ler o que você escolher. Seu objetivo é
as convencer de que a escolha foi feita a partir da perspectiva da
pessoa descrita acima.
Selecione apenas uma opção e explique sua escolha.
Pergunta: {pergunta}
Opções: {conjunto de respostas}
4. Diálogos (como fez OpenAssistant)
💡 Por exemplo...
Para gerar um diálogo, simplesmente continue a conversa na LLM Arena por mais algumas interações.
# Prompt
Me recomende lugares para sair com meus amigos no fim de semana em São Paulo
# Resposta (assistant)
Esta recomendação depende muito do tipo de atividades que você e
seus amigos gostam de fazer. Preciso de mais informações, como se
preferem espaços abertos ou espaços fechados.
# Resposta (prompter)
Bom ponto. Preferimos espaços abertos.
# Resposta (assistant)
Show! Nesse caso, vocês poderiam ir ao Parque Ibirapuera. Lá vocês
vão encontrar opções para comer e se divertir ao ar livre.
2.3. Crie o seu dataset de prompts
- Recomendamos guardar seus prompts em um arquivo CSV
- Colunas:
- obrigatórias:
promptepais - opcional: adicione as colunas que precisar, por exemplo se você criou um template com diferentes características sociais (e.g.
idade) ou regiões,origemse as perguntas vieram de um dataset existente, etc.
- obrigatórias:
- Você vai precisar criar um dataset de prompts na organização do Hugging Face do hackathon: https://huggingface.co/somosnlp-hackathon (se ainda não entrou, use este convite)
2.4. Recursos
Datasets relacionados (vocês podem usar as categorias para as perguntas)
- BLEnD: comida, esportes, família, educação, dias festivos/celebrações/lazer, vida profissional
- CoScript: 19 categorias derivadas do wikiHow (Fig 8)
- CVQA: 10 categorias (Table 1)
- FrameNet: base de dados extensa, vários frames (i.e. marcos semânticos)
- Exemplo: ver os “lexical units” (lá embaixo) no frame “personal relationships”
- HellaSwag: diversas atividades cotidianas tiradas do ActivityNet e wikiHow
- Ver
activity_labelno dataset
- Ver
- World Values Survey (WVS): 14 subseções
- Listadas na seção WVS wave 8 → Questionnaire and research topics
Ideias de categorias para perguntas abertas
- Normas culturais
- Como você responderia educadamente a um desconhecido que furou a fila num banco no Brasil?
- Como você se dirige a um professor universitário no Brasil?
- Provérbios e expressões
- O que significa o provérbio {provérbio} em {país}? Explique o significado e inclua um exemplo.
- Contos e canções
- Qual é a moral do conto {conto} em {país}?
Exemplos de prompts NÃO válidos
- Muito gerais ou universais: “Explique a fotossíntese.”
- Demasiado subjetivos ou sem enquadramento cultural: “Qual é o melhor valor humano?”
- Perguntas conflituosas sem propósito contextual: “Quem foi pior: Pinochet ou Vargas?”
✅ 3. Como escolher a melhor resposta na LLM Arena
- Depois de criar os prompts, use a LLM Arena para gerar respostas com LLMs. Não precisa salvar as respostas. Salvamos automaticamente e disponibilizamos para todas as equipes no dia 21 de abril.
- Leia com atenção as duas respostas geradas pelo LLM. Depois, escolha a opção que considerar mais adequada cultural e comunicativamente
- Para votar, leve em conta:
- ✅ Conhecimento cultural correto, a informação objetiva precisa estar correta
- ✅ Adequação cultural ao país e papel definidos
- ✅ Uso correto do português local (formas locais, regionalismos, expressões idiomáticas, etc.). A resposta gerada deveria usar a mesma variedade do português que a pergunta
- Nota: não avalie por gramática perfeita ou estilo “neutro”, mas sim pelo que soa natural e correto para a cultura do prompt.
- Selecione:
- Resposta A / B: se uma for claramente mais adequada que a outra.
- Ambas boas: se ambas forem corretas, naturais e culturalmente adequadas.
- Ambas ruins: se ambas tiverem erros graves de tom, conteúdo ou adequação cultural.
🔍 4. Validar perguntas e respostas de outras equipes
- Abra o espaço de validação e selecione o país para o qual você consiga avaliar a adequação cultural
- No espaço, você vai poder ver o seguinte:
- uma pergunta
- as duas respostas geradas pelos LLMs
- a resposta originalmente escolhida
- Você vai precisar anotar:
- Se a pergunta parece estar bem desenhada levando em conta o guia anterior
- Se você também escolheria essa resposta ou se mudaria
- Opcionalmente, você pode editar e melhorar a resposta gerada que foi escolhida
- Considerações para a validação:
- Evite vieses pessoais, avalie a partir da perspectiva do papel definido
- Se o prompt não tem ancoragem cultural ou se nenhuma das respostas pode ser avaliada de forma razoável, marque como inválido