Nombre | Tareas | Dominio | Idiomas | Países | Página Web | GitHub | Paper | Hugging Face Hub | Gracias A |
---|---|---|---|---|---|---|---|---|---|
Catalonia Independence Corpus | clasificación de sentimientos | rrss | español, catalán | España | Lewis Tunstall @Hugging Face | ||||
eHealth-KD | NER (Named Entity Recognition) | clinico | español | España | María Grandury | ||||
HEAD-QA | preguntas de opción múltiple | clinico | español, inglés | España | María Grandury | ||||
Large Spanish Corpus | modelado del lenguaje | general | español | Varios | - | Lewis Tunstall @Hugging Face | |||
Mucho Cine | clasificación de sentimientos | cine | español | Varios | - | - | Nick Doiron | ||
Spanish Billion Words | modelado del lenguaje | general | español | Varios | - | - | María Grandury | ||
WikiCorpus | modelado del lenguajePOS (Part of Speech) | general | español, catalán, inglés | Varios | - | Albert Villanova @Hugging Face | |||
InfoLibros Corpus | modelado del lenguaje | literario | español | Varios | - | - | - | David Arias | |
Spanish CBOW Word Embeddings in Floret (BNE) | modelado del lenguajeCBOW (Continuous Bag Of Words) | general | español | España | - | - | - | David Arias | |
Biomedical Spanish CBOW Word Embeddings in Floret | modelado del lenguajeCBOW (Continuous Bag Of Words) | clinico | español | España | - | - | David Arias | ||
Spanish Biomedical Crawled Corpus | modelado del lenguaje | clinico | español | España | - | - | David Arias | ||
TDX Thesis Spanish Corpus | modelado del lenguaje | cientifico | español | España | - | - | - | David Arias | |
CSIC Spanish Corpus | modelado del lenguaje | academico | español | España | - | - | - | David Arias | |
BasCrawl | modelado del lenguaje | general | euskera | España | - | - | - | David Arias | |
Spanish Legal Domain Corpora | modelado del lenguaje | legal | español | España | - | David Arias | |||
Spanish Skip-Gram Word Embeddings in FastText (BNE) | modelado del lenguajeFastText | general | español | España | - | - | David Arias | ||
Spanish CBOW Word Embeddings in FastText (BNE) | modelado del lenguajeFastText | general | español | España | - | - | David Arias | ||
Spanish Legal Domain Word & Sub-Word Embeddings | modelado del lenguaje | legal | español | España | - | David Arias |
¡Ayúdanos a recolectar bases de datos de todas las variedades del español! Te animamos aabir una PRaquíy contribuir a la lista 🚀