Reto #HackathonSomosNLP 2025: Exámenes INCLUDE

Cómo participar en este reto y ayudar a mejorar el conocimiento cultural de los modelos de lenguaje


Busca exámenes de opción múltiple de tu país para evaluar el conocimiento de los LLMs. Prioriza exámenes en lenguas distintas al español y/o centrados en temas culturales (e.g. historia, literatura). Utilizaremos estas preguntas y respuestas para extender el benchmark abierto INCLUDE.

9 de abril - 31 de mayo (EXTENDIDA) | máx 1 pto

🌎 Puedes contribuir exámenes de todos los países independientemente de tu lugar de origen o residencia, revisa la hoja “Prioridad países”.

✨ Incentivos (los números se refieren a preguntas con sus correspondientes respuestas):

  • Por equipo:
    • 100 preguntas en total = 0.5 ptos
    • 200 preguntas en total = 1 pto
  • Por persona:
    • Cada 100 preguntas = 50 USD en créditos GPU o libros (a elección personal)
    • 300 por persona = invitación al Slack del proyecto global y co-autoría en el paper de INCLUDE v2 liderado por EPFL
  • OJO: ¡Los exámenes tienen que cumplir los requisitos!

Recursos:


Protocolo de recolección de exámenes multilingües

A continuación presentamos el protocolo para participar en el proyecto INCLUDE centrado en la recolección de exámenes multilingües.

1. Buscar exámenes

Verifica que el examen cumple con los siguientes requisitos:

  • No es propietario.Si la licencia restringe el uso comercial pero permite su redistribución con fines de investigación, entonces sí podemos usar este examen. Si la licencia es desconocida, incluye el examen.

  • Es un examen con formato de preguntas de opción múltipley tiene 4 opciones por pregunta.

  • Contiene las respuestasy hay solo una respuesta correcta por pregunta.

  • El tema del examen debe estar relacionado con laculturade un país (e.g., historia, literatura) o ser información regional (e.g. carnet de conducir). No son válidos los exámenes de ciencias exactas ni naturales (e.g. matemáticas, física).

  • Prioriza buscar exámenes enlenguasoriginarias de LATAM o cooficiales de España.

  • También son válidos los exámenes en español de los siguientes países:

    PRIORIDADNO*
    Puerto RicoEspaña
    República DominicanaChile
    Costa Rica
    Panamá
    Nicaragua
    Guatemala
    El Salvador
    Guinea Ecuatorial
    Honduras
    Cuba
    Bolivia
    Colombia
    Paraguay
    Uruguay
    Venezuela

*A menos que sea un examen con un componente cultural o regional muy importante. En tal caso, pregunta primero enDiscord. Igualmente, os recomendamos buscar exámenes de los países prioritarios.

Ideas para encontrar exámenes:

  • Exámenes de idiomas
  • Exámenes de nacionalización
  • Licencias de conducir
  • Exámenes de acceso a la universidad o de universidad
  • Exámenes del colegio o de instituto
  • Exámenes habilitantes de profesiones (derecho, medicina, psicología, etc.)
  • Preguntas de concursos estilo “¿Quién quiere ser millonario?”
  • Preguntas de juegos tipo Trivial Pursuit
  • Tests de autoevaluación en libros de texto

Recuerda: no tiene por qué ser un examen digitalizado, también puedes escanear libros o hacer fotos de documentos.

2. Añadir exámenes a la hoja de cálculo

Cuando encuentres un examen, guarda su URL/nombre/artículo/documentación de origen y agrégalo a lahoja de cálculo.

Incluye lo siguiente:

  • Tu nombre
  • Tu nombre en Discord
  • Nombre del examen (lo más detallado posible)
  • Lengua y país de origen del examen
  • Dominio del examen (e.g., Literatura, Derecho, Conducir, etc.)
  • Nivel del examen
  • Número de preguntas
  • Origen del examen (URL si está disponible en línea, nombre del libro o URL al documento PDF en tu Drive, etc.)
  • Formato original (e.g., PDF, página web, libro de texto, etc.)

3. Procesar los exámenes

Una vez que has encontrado un examen:

Ejemplo JSON en el formato esperado:

{
  "language": "es",
  "country": "España",
  "exam_name": "Examen final de Historia de España de Secundaria 2017",
  "source": "https://url-del-examen",
  "license": "CC-BY-SA",
  "level": "Acceso a la universidad",
  "category_en": "History",
  "category_original_lang": "Historia",
  "original_question_num": 1,
  "question": "¿En cuál de los siguientes años comenzó la Guerra Civil?",
  "options": [ "1936", "1937", "1938", "1939" ],
  "answer": 0
}

Equipo

Muchísimas gracias a:

  • EPFL: Premios y organización del equipo global
  • El equipo: María Grandury y Angelika Romanou