cpdetector hanke on pieni mutta nokkela puitteet Koodisivun havaitsemista.
cpdetector on pieni mutta nokkela puitteet -koodisivua havaitsemista, joka yhdistää erilaisia strategioita. Sitä voidaan käyttää kirjaston kolmannen osapuolen ohjelmisto, joka käyttää sanallista tietoa verkon yli.
Se sisältää myös parhaiden käytäntöjen toteuttamista muodossa komentorivi työkalu, joka mahdollistaa lajittelun ja muuttamassa suuria kokoelmia asiakirjojen perusteella niiden Koodisivun.
Saatavilla strategioihin kuuluu: jchardet (syrjäytyminen, taajuus analyysi, ja arvailla), havaitseminen HTML charset omaisuutta, ja havaitseminen XML koodaus ilmoituksen.
Mikä on koodi sivun?
Aluksi tekstuaalinen asiakirja ei ole mitään muuta kuin sekvenssit bittejä. Tietokone on päätettävä, miten hän voi näyttää tämän datan muodossa merkkejä (jotka on merkitty tietokoneen numeroita).
Koodi sivu - joka tunnetaan myös charset koodaus - kartat raakatietoja tekstisisältöä asiakirjan merkkiä. Alkuperäinen ASCII-koodi sivulta esimerkiksi käyttää vain 7 bittiä oktetti (tavu) päättääkseen merkki, joka edustaa jolloin vain kartta 128 eri merkkiä. Aiemmin muistin oli kallista ja tietokoneet useimmiten oli vain rekistereihin ja bussit 8 bit.
Kun mainframe sikisi se oli ratkaistava, mitkä merkit sen pitäisi tukea. Lääkärit ja matemaatikot esimerkiksi tarvitaan erikoismerkkejä yhtälöt. Tämän seurauksena tietokone usein mukana toimitetaan erityinen Koodisivun.
Mitä uutta strong> tässä julkaisussa:
- Tämä merkittävä vikakorjaus versio korjaa kaksi kysymyksiä komentorivin eräajona.
- kytkin ohittaa siirtämällä havaitsematta asiakirjoja toimii nyt taas.
- Ei yritetä transkoodaamaan huomaamatta asiakirjoja (jälkimmäinen aiheutti poikkeuksellinen ohjelma virtaus).
Mitä uutta strong> versiossa 1.0.8:
- Tämä julkaisu on vakaus julkaisu ja korjaa tavu tilata merkki havaitseminen ja yhteensopimattomuus OpenJDK. Se edellyttää myös Java 1.5 nyt.
Kommentteja ei löytynyt