Vektordatenbank & Embeddings
Aufgabenstellung
Statistisch-linguistische Analysen, die auf der Abbildung von Texten bzw. Korpora als hochdimensionale Vektoren basieren, müssen diese Vektor-Embeddings zunächst berechnen. Dieser Prozess ist komputationell sehr aufwändig/teuer, und kann daher von kleinen Forschungsgruppen nicht geleistet werden. Daher werden solche Embeddings für ausgewählte Texte/Korpora vorberechnet und zur Nutzung bereitgestellt.