DSTK - Data Science Toolkit 3 on joukko tietoja ja tekstinlouhintaohjelmistoja CRISP DM -mallin mukaisesti. DSTK tarjoaa tietojen ymmärrystä tilastollisen ja tekstianalyysin, datan valmistelun avulla normalisoinnin ja tekstinkäsittelyn, mallinnuksen ja arvioinnin koneen oppimisen ja tilastollisten oppimisalgoritmien avulla.
DSTK 3 tarjoaa houkuttelevia ominaisuuksia, kuten Deep Neural Network (Deep-oppiminen), tekstilinkitutkimuksen visualisoinnit, KMeans-klusterointi. Jotkin näistä ominaisuuksista voidaan esittää vanhemmassa versiossa, mutta koska algoritmit on kirjoitettu uudelleen vähentämään ulkoisten kirjastojen, kuten Wekan, käyttöä pienentämään tiedostokokoa, tarvitsemme lisää aikaa niiden kehittämiseen. DSTK-moottori on edelleen beta-vaiheessa, joten voi olla virheitä ja epätarkkuuksia.
DSTK 3 koostuu DSTK Engine, DSTK ScriptWriter, DSTK Studio ja DSTK Text Explorer. DSTK Engine on yksinkertaistettu, keskittyen Data Miningiin. DSTK ScriptWriter tarjoaa graafisen käyttöliittymän käsikirjoituksen DSTK Engineille. DSTK Studio tarjoaa SPSS-tilastot, kuten graafisen käyttöliittymän tiedonsiirtoa varten, ja DSTK Text Explorer tarjoaa graafisen käyttöliittymän tekstinlouhinnalle.
Vaatimukset :
Java Runtime Environment, Microsoft. Net Framework
Rajoitukset :
10-kokeinen
Kommentteja ei löytynyt