MDP (Modular työkalupakki Data Processing) on kirjaston laajalti käytetty tietojenkäsittelyn algoritmeja, jotka voidaan yhdistää mukaan putki analogisesti rakentaa monimutkaisempia tietojenkäsittely ohjelmistot.
Käyttäjän näkökulmasta, MDP koostuu kokoelma valvottua ja valvomattoman oppimisen algoritmeja, ja muut tietojenkäsittely yksikköä (solmut), joka voidaan yhdistää tietojenkäsittelyn sekvenssit (virrat) ja monimutkaisempia myötäkytketyn verkon arkkitehtuurit. Annetaan joukko lähtötietoja, MDP huolehtii peräkkäin koulutusta tai suorittaa kaikki solmut verkossa. Tämä mahdollistaa sen, että käyttäjä voi määrittää monimutkaisia algoritmeja kuin sarjan yksinkertaisempi tietojenkäsittelyn vaiheet luonnollisella tavalla.
Pohjan käytettävissä algoritmien kasvaa jatkuvasti ja sisältää, nimi, mutta yleisin, Principal Component Analysis (PCA ja NIPALS), useita Independent Component Analysis algoritmeja (CuBICA, FastICA, TDSEP, JADE, ja XSFA), Hidas Feature Analysis, Gaussin luokittelijoista Rajoitettu Boltzmannin Machine, ja paikallisesti Linear upottaminen.
Erityistä huomiota on tehdä laskutoimituksia tehokasta nopeuden ja muistin. Voit vähentää muistin vaatimukset, on mahdollista suorittaa oppimista käyttämällä eriä tietoja, ja määritellä sisäiset parametrit solmujen olla sinkku tarkkuus, mikä tekee käytöstä erittäin suurten tietomäärien mahdollista. Lisäksi "rinnakkainen" alipaketin tarjoaa samanaikaisesti toteutettava perus solmujen ja virtaa.
Vuodesta kehittäjän näkökulmasta, MDP on kehys, joka tekee uusien ohjattua ja ohjaamaton oppiminen algoritmit helppoa ja suoraviivaista. Perus- luokka, "Node", hoitaa tylsiä tehtäviä, kuten numeerisia tyyppi ja dimensionality tarkkailun, jolloin kehittäjä voi keskittyä toteuttamiseen oppimisen ja toteutuksen vaiheissa. Koska yhteisen rajapinnan, solmu sitten automaattisesti integroituu muuhun kirjaston ja voidaan käyttää verkossa yhdessä muiden solmujen. Solmu voi olla useita koulutusta vaiheita ja jopa määrittelemätön määrä vaiheita. Tämä mahdollistaa täytäntöönpanon algoritmeja, jotka täytyy kerätä joitakin tilastoja koko panos ennen kuin jatkat varsinaista koulutusta, ja muut, jotka tarvitsevat kerrata yli opetusvaiheessa kunnes lähentymistä kriteeri täyttyy. Kyky kouluttaa jokaisen vaiheen käyttäen paloina lähtötietojen säilyy, jos paloina generoidaan iterators. Lisäksi Crash Recovery on saatavana lisävarusteena: pettäessä, nykytilasta virtaus tallennetaan myöhempää tarkastusta.
MDP on kirjoitettu yhteydessä teoreettista tutkimusta neurotieteen, mutta se on tarkoitus olla avuksi missään yhteyksissä, joissa koulutettavia tietojenkäsittely algoritmeja käytetään. Sen yksinkertaisuus käyttäjän puolella yhdessä uudelleenkäytön toteutettujen solmut tekevät myös pätevä kasvatuksellinen väline.
Mikä on uusi tässä julkaisussa:
- Python 3. tukea.
- Uusi laajennukset: välimuistin ja kaltevuus.
- parannetaan ja laajennetaan opetusohjelma.
- useita parannuksia ja korjauksia.
- Tämä tiedote on alla BSD-lisenssi.
Mikä on uusi versiossa 2.5:
- 2009-06-30: Lisätty verkossa havaitseminen numeerisen backend , rinnakkainen python tukea, symeig backend ja numeerisia backend lähtöön yksikkö testit. Pitäisi auttaa debugging.
- 2009-06-12: integrointi cutoff ja histogrammin solmuja.
- 2009-06-12: Kiinteä vika rinnakkain virtauksen (poikkeusten käsittely).
- 2009-06-09: Kiinteä bugi LLENode kun output_dim on float. Kiitos Konrad Hinsen.
- 2009-06-05: Fixed bugeja rinnakkain virtauksen useita mat.
- 2009-06-05: Korjattu bugi kerrokseen käänteinen, kiitos Alberto Escalante.
- 2009-04-29: Lisätty LinearRegressionNode.
- 2009-03-31: PCANode ei valita enää, kun kovarianssimatriisi on kielteisiä ominaisarvot joss shp == Totta vai vähentää == True. Jos output_dim on määritetty on haluttu varianssi, negatiiviset ominaisarvot ohitetaan. Parannettu virheilmoitus SFANode tapauksessa kielteisiä ominaisarvot, nyt ehdottaa liittää alkuun solmuun PCANode (SVD = True) tai PCANode (pienentää = True).
- 2009-03-26: siirtynyt vanhasta lanka paketti uuteen ketjuttaminen yksi. Lisätty lippu poistaa välimuistin prosessin ajastimella. On joitakin rikkomatta muutoksia mukautetun mat (rinnakkainen virtaus koulutus tai toteuttamiseen ei vaikuta).
- 2009-03-25: Lisätty svn tarkistaminen seuranta tukea.
- 2009-03-25: Poistettu copy_callable lippu aikataulu, tämä on nyt täysin korvattu forkkaamisessa TaskCallable. Tällä ei ole vaikutusta kätevää ParallelFlow käyttöliittymä, mutta custom mat saada rikki.
- 2009-03-22: Toteutetaan välimuistin ProcessScheduler.
- 2009-02-22: make_parallel nyt toimii täysin paikallaan muistin säästämiseksi.
- 2009-02-12: Lisätty kontti menetelmiä FlowNode.
- 2009-03-03: Lisätty CrossCovarianceMatrix testeillä.
- 2009-02-03: Lisätty IdentityNode.
- 2009-01-30: Lisätty auttaja toiminnon HiNet suoraan näyttää virtauksen HTML edustus.
- 2009-01-22: Salli output_dim Layer asetettava laiskasti.
- 2008-12-23: Lisätty total_variance jotta NIPALS solmuun.
- 2008-12-23: Aseta aina explained_variance ja total_variance treenin jälkeen PCANode.
- 2008-12-12: Muokattu symrand todella palata symmetriset matriisit (eikä vain positiividefiniitti). Mukautettu GaussianClassifierNode tilille siitä. Mukautettu symrand palata myös monimutkaisia hermiittinen matriiseja.
- 2008-12-11: Kiinteä yksi ongelma PCANode (jolloin output_dim asetettiin input_dim koko varianssi on käsitelty tuntematon). Kiinteä var_part parametri ParallelPCANode.
- 2008-12-11: Lisätty var_part ominaisuus PCANode (suodatin mukaan varianssi suhteessa absoute varianssi).
- 2008-12-04: Kiinteä puuttuu akseli arg sisään amax puheluun opetusohjelmassa. Kiitos Samuel John!
- 2008-12-04: Kiinteä tyhjä data iteraattori käsittelyä ParallelFlow. Lisäsi myös tyhjät iteraattori tarkastuksia normaalissa Flow (korottaa poikkeus, jos iteraattori on tyhjä).
- 2008-11-19: Muutettu PCA ja SFA solmut tarkistaa negaive eigenvalues vuonna cov matriisien
- 2008-11-19: symeig integroitu scipy, MDP voi käyttää sitä sieltä nyt.
- 2008-11-18: Lisätty ParallelFDANode.
- 2008-11-18: Päivitetty juna vaadittaessa maksettavan varten ParallelFlow tukemaan uusia argumentteja.
- 2008-11-05: uudelleenkirjoitus on tehdä rinnakkaisia koodia, tukee nyt HiNet rakenteita.
- 2008-11-03: uudelleenkirjoitus of HiNet HTML repesentation luoja. Valitettavasti tämä myös taukoja julkisen liittymän, mutta muutokset ovat melko yksinkertaisia.
- 2008-10-29: Sammuta varoitukset tulevat kauko prosesseista ProcessScheduler
- 2008-10-27: Kiinteä ongelma korvaamalla kwargs in init menetelmää ParallelFlow.
- 2008-10-24: Kiinteä pretrained solmuja bugi hinet.FlowNode.
- 2008-10-20: Kiinteä kriittinen tuonti bugi rinnakkain ohjelmistoa kun pp (rinnakkainen python-kirjasto) on asennettu.
vaatimukset
- Python
- NumPy
- SciPy
Kommentteja ei löytynyt