Bases de Datos

Lista de bases de datos open-source en español.


NombreTareasDominioIdiomasPaísesPágina WebGitHubPaperHugging Face HubGracias A
Catalonia Independence Corpus
clasificación de sentimientos
rrss
español, catalán
España
Lewis Tunstall @Hugging Face
eHealth-KD
NER (Named Entity Recognition)
clinico
español
España
María Grandury
HEAD-QA
preguntas de opción múltiple
clinico
español, inglés
España
María Grandury
Large Spanish Corpus
modelado del lenguaje
general
español
Varios
-
Lewis Tunstall @Hugging Face
Mucho Cine
clasificación de sentimientos
cine
español
Varios
-
-
Nick Doiron
Spanish Billion Words
modelado del lenguaje
general
español
Varios
-
-
María Grandury
WikiCorpus
modelado del lenguajePOS (Part of Speech)
general
español, catalán, inglés
Varios
-
Albert Villanova @Hugging Face
InfoLibros Corpus
modelado del lenguaje
literario
español
Varios
-
-
-
David Arias
Spanish CBOW Word Embeddings in Floret (BNE)
modelado del lenguajeCBOW (Continuous Bag Of Words)
general
español
España
-
-
-
David Arias
Biomedical Spanish CBOW Word Embeddings in Floret
modelado del lenguajeCBOW (Continuous Bag Of Words)
clinico
español
España
-
-
David Arias
Spanish Biomedical Crawled Corpus
modelado del lenguaje
clinico
español
España
-
-
David Arias
TDX Thesis Spanish Corpus
modelado del lenguaje
cientifico
español
España
-
-
-
David Arias
CSIC Spanish Corpus
modelado del lenguaje
academico
español
España
-
-
-
David Arias
BasCrawl
modelado del lenguaje
general
euskera
España
-
-
-
David Arias
Spanish Legal Domain Corpora
modelado del lenguaje
legal
español
España
-
David Arias
Spanish Skip-Gram Word Embeddings in FastText (BNE)
modelado del lenguajeFastText
general
español
España
-
-
David Arias
Spanish CBOW Word Embeddings in FastText (BNE)
modelado del lenguajeFastText
general
español
España
-
-
David Arias
Spanish Legal Domain Word & Sub-Word Embeddings
modelado del lenguaje
legal
español
España
-
David Arias

¡Ayúdanos a recolectar bases de datos de todas las variedades del español! Te animamos aabir una PRaquíy contribuir a la lista 🚀