Apache Tika 1.4

Apache Tikan on avoimen lähdekoodin työkalupakki suunniteltu havaitsemaan ja metatietoja, sekä rakenteeltaan tekstin sisältöä useista asiakirjoista, pelkällä nykyisten parseri kirjastot.Apache Tikan tukee seuraavia tiedostomuotoja: Hypertext Markup...