Autor: Indrek Kald • 24. jaanuar 2024

Eesti keel kaardistati ligi nelja miljardi sõna mahus. Andmeid kogutakse digirobotitega

Eesti keele instituut koondas keelekorpuseks kokku ligi nelja miljardi sõna mahus eestikeelseid tekste, mis lubab saada enneolematult ulatusliku ülevaate keele arenguseisust.
2025. aasta seisu kajastav ühendkorpus on planeeritud hõlmama veel vähemalt poole miljardi sõna võrra suuremas mahus tekste.
Foto: Raul Mee

Uus korpus on 30% suurem kui eelmine.

Liitu ITuudiste uudiskirjaga!
Liitumisega nõustud, et Äripäev AS kasutab sinu e-posti aadressi sulle uudiskirja saatmiseks. Saad nõusoleku tagasi võtta uudiskirjas oleva lingi kaudu. Loe oma õiguste kohta lähemalt privaatsustingimustest
Indrek KaldITuudised.ee toimetajaTel: 511 1112
Anne WellsReklaami projektijuhtTel: 5880 7755