Projekti eesmärgiks on siduda omavahel kokku mitmed olemasolevad vahendid eesti keele töötlemiseks ning võimaldada neid kasutada Pythoni programmides:
- Teksti tükeldamine sõnadeks ja lauseteks
- Morfoloogiline analüüs ja süntees
- Sõnade lemmatiseerimine / stemmimine
- Osalausestamine
- Ajaväljendite tuvastamine
- Nimeüksuste tuvastamine
- Verbiahelate tuvastamine
- Eesti Wordnet'i liidestamine.
„Nimekirjast on küll veel puudu mitmed vahendid, mida meie keeletehnoloogid on välja töötanud, aga olemasolevate baasoperatsioonide hulk on piisavalt suur, et katta suurem osa rakendustele vajalikke kasutusjuhte,“ ütleb projekti meeskonna liigeTimo Petmanson. “Teek toimib nii Linuxi kui ka Windowsiga ja töötab Python2.7 ja Python3.4 versioonidega.“
Vaata lisa:
Installijuhendid ja dokumentatsioon: http://tpetmanson.github.io/estnltk/
Lähtekood: https://github.com/tpetmanson/estnltk
Windowsi installerid: https://github.com/tpetmanson/estnltk/tree/master/dist
Soovitusi, mõtteid, leitud vigu jt ettepanekuid võib esitada Githubi lehel: https://github.com/tpetmanson/estnltk/issues