Logo der Bayerischen Akademie der Wissenschaften

Neue Potenziale für die digitale Lexikographie des Deutschen

Menu

Vektordatenbank & Embeddings

Aufgabenstellung

Statistisch-linguistische Analysen, die auf der Abbildung von Texten bzw. Korpora als hochdimensionale Vektoren basieren, müssen diese Vektor-Embeddings zunächst berechnen. Dieser Prozess ist komputationell sehr aufwändig/teuer, und kann daher von kleinen Forschungsgruppen nicht geleistet werden. Daher werden solche Embeddings für ausgewählte Texte/Korpora vorberechnet und zur Nutzung bereitgestellt.