Optiset (OCR) on käännös optisesti skannattuja bittikarttojen painetun tai kirjallisen tekstin merkkejä merkkikoodit, kuten ASCII. Tämä on tehokas tapa kääntää paperikuvien materiaaleja tiedostoja, joita voidaan muokata ja muuten käsitelty tietokoneessa. Tämä on tekniikka pitkä käyttämät kirjastot ja valtion virastojen tehdä pitkiä asiakirjoja nopeasti saatavilla sähköisesti. Ennakot OCR-tekniikalla ovat kannustaneet sen lisääntyvä käyttö yrityksissä. Monille asiakirja-input tehtäviä, OCR on kaikkein kustannustehokkain ja nopea menetelmä käytettävissä. Ja joka vuosi, teknologia vapauttaa hehtaarin säilytystilaa kerran annetaan yli arkistokaappi ja laatikot täynnä paperia asiakirjoja. Ennen OCR voidaan käyttää, lähdemateriaali on skannata optinen lukija (ja joskus erikoistunut piirilevy PC) lukea sivun bittikartta (piste-). Ohjelmisto tunnistaa kuvia on myös tarpeen.
Meidän ohjelmisto ehdottaa ratkaista luokittelua eristetty käsinkirjoitettuja merkkejä ja numeroa Uji Pen Characters Data Set käyttämällä neuroverkot. Aineisto koostuu näytteistä 26 merkkiä ja 10 numeroa kirjoittanut 11 kirjailijoiden taulutietokoneen. Merkkiä (vakio UNIPEN muodossa) on kirjoitettu sekä isoja ja pieniä, ja siellä on koko kahden joukon merkkiä per kirjailija. Joten tuotos pitäisi olla yksi 35 luokissa. Lopullisena tavoitteena on rakentaa kirjailija riippumaton malli kunkin merkin.
Valinta arvokkaita ominaisuuksia on ratkaisevaa merkintunnistukseen, siis uusi ja mielekäs joukko ominaisuuksia, Uniform Differential normalisoitu koordinaatit (UDNC), käyttöön C. Agell, hyväksytään. Nämä ominaisuudet näkyvät parantaa tunnistustarkkuutta yksinkertaisilla luokitus algoritmeja niin niitä käytetään kouluttaa Neural Network ja testata sen suorituskykyä Uji Pen Characters Data Set.
Asiasanat: Matlab, lähde, koodi, OCR, optinen, skannattu teksti, kirjoitettu teksti, ascii, eristynyt.
Vaatimukset :
Matlab
Kommentteja ei löytynyt