Vektordatenbank & Embeddings: Neue Potenziale für die digitale Lexikographie des Deutschen

Vektordatenbank & Embeddings

Aufgabenstellung

Statistisch-linguistische Analysen, die auf der Abbildung von Texten bzw. Korpora als hochdimensionale Vektoren basieren, müssen diese Vektor-Embeddings zunächst berechnen. Dieser Prozess ist komputationell sehr aufwändig/teuer, und kann daher von kleinen Forschungsgruppen nicht geleistet werden. Daher werden solche Embeddings für ausgewählte Texte/Korpora vorberechnet und zur Nutzung bereitgestellt.

Vektor-Embedding am Beispiel Tensorflow Projector