Autor: Indrek Kald • 24. jaanuar 2024
Eesti keel kaardistati ligi nelja miljardi sõna mahus. Andmeid kogutakse digirobotitega
Eesti keele instituut koondas keelekorpuseks kokku ligi nelja miljardi sõna mahus eestikeelseid tekste, mis lubab saada enneolematult ulatusliku ülevaate keele arenguseisust.
2025. aasta seisu kajastav ühendkorpus on planeeritud hõlmama veel vähemalt poole miljardi sõna võrra suuremas mahus tekste.
Foto: Raul Mee
Uus korpus on 30% suurem kui eelmine.