uni2ascii ja ascii2uni muuntaa UTF-8 Unicode ja kaikki erilaisia 7-bittisen ASCII vastineet, mukaan lukien: heksadesimaali ja desimaalin HTML numeromerkit viittaukset, u-pakenee, vakio heksadesimaali, ja raaka heksadesimaali.
Tällaiset ASCII vastineet ovat hyödyllisiä kuten Unicode tekstiä ohjelmalähteestä, kun tekstin syöttäminen web-ohjelmia, jotka voivat käsitellä Unicode-merkistöä, mutta eivät ole 8-bittinen turvallinen, ja kun virheenkorjaus.
Unicode pakenee käytettävissä ovat:
- HTML heksadesimaali numeerinen merkki viittauksia (esim)
- HTML desimaalin numeerinen merkki viittauksia (esim ȳ)
- U-pakenee, kuten käytetty Python (esim u00E9)
- U-pakenee sisällä BMP ja U-pakenee kuin BMP, esimerkiksi u00E9 mutta U00010024.
- U -merkillä merkittyjä (esim U 00E9)
- U-pakenee (esim U00E9)
- U-pakenee (esim u00E9)
- U-pakenee sisällä kulmasulkeet (esim)
- X-pakenee (esim x00E9)
- X-pakenee henkselit (esim x {00E9})
- Standard heksadesimaali (esim 0x00E9)
- Raw heksadesimaali (esim 00E9)
uni2ascii hyväksyy komentoriviltä lippu onko tuottaa isoja AF tai pienten kirjainten af heksadesimaali numeroa, koska jotkin jotkin ohjelmat hyväksyvät vain jompaakumpaa. ascii2uni hyväksyy joko.
Kun kyseessä on uni2ascii oletuksena vain merkkejä ulkopuolella ASCII alueen muunnetaan. Vaikka ASCII-merkkejä myös muunnetaan, rivinvaihdot säilyvät, ellei niiden vaihtaminen on erityisesti pyytänyt. Välilyöntejä myös säilynyt, ellei muuntamista nimenomaisesti pyytänyt. Jos kyseessä on kolme ei-ASCII-merkkien (Ethiopic sana tilaa, Ogam tilaa, ja ideografisia avaruus), jos tilaa merkkejä ei muunneta, nämä korvataan ASCII-tilaan (0x20) niin pitää lähdön sisällä 7- ASCII-alue.
Tämä paketti sisältää neljä ohjelmaa. Pääohjelma on uni2ascii. Se on kirjoitettu C ja se on koottu. uni2html.py on edeltäjä uni2ascii. Kuten on kirjoitettu Pythonilla, sitä ei tarvitse koottava ja pitäisi toimia juuri mitään nykyisestä tietokoneesta. uni2ascii on muuten ylivoimainen, että:
- Se luo laajemman Tulostusmuodot.
- Se on noin 20 kertaa nopeammin.
- Se käsittelee panos koko 32 bittinen Unicode-alue. Sen sijaan, uni2html pelkästään käsittelee
Basic Multilingual Plane (Plane 0), koska tällä hetkellä Python edustaa Unicode koodattu teksti sisäisesti käyttämällä 16-bittisiä kokonaislukuja. Jos sinulla tekstiä, vaikkapa Linear B tai ugaritilainen, tarvitset uni2ascii.
Se tekee parempaa työtä raportoinnin virheitä. Jos se kohtaa virheen sen panos, kuten mal-muodostunut UTF-8, se raportoi sijainnin virheen olipa kyse merkkimäärä alusta tiedoston (alkaen 0) ja suhteen tavujen alusta tiedoston (myös alkaen 0). (Character laskee ja tavumäärät eivät yleensä ole samoja, koska UTF-8 merkin vie yhdestä neljään tavua.) Python versio raportit ainoastaan merkkimäärä. uni2ascii myös tietoja virheestä.
Kolmas ohjelma, ascii2uni, on käänteinen uni2ascii. Se hyväksyy tekstin, joka sisältää erilaisia ASCII esityksiä Unicode-merkkejä ja tuottaa UTF-8 Unicode.
Neljäs ohjelma, ascii2uni.py, lukee 7-bittinen ASCII sisältävä U-pakeni Unicode, sellaisena kuin sitä käytetään Python ja Tcl, ja muuntaa sen UTF-8 Unicode. Se on alkuperäinen ohjelma, joka ascii2uni on yleistys.
Mikä on uusi tässä julkaisussa:
- Kiinteä bugi uni2ascii jossa tietyissä tapauksissa toisilla määrä oli liian suuri, vahvistetaan Debianin bug # 626268.
- paikattava käsitellä tilannetta, NetBSD jossa ei ole getline.
- Kirkastetut semantiikka puhdasta vaihtoehdon muuntaa merkkejä ascii alueella muita kuin tilaa ja rivinvaihtoa. Kiinteä vika, jossa tätä ei ole toteutettu oikein ja UTF8 tyyppejä.
Mikä on uusi versiossa 4.17:
- Lisätty uni2ascii seuraavia muunnoksia lähimpään ascii vastaavat: U +2022 luoti "o", U + 00B7 keskellä piste ajan, U + 0085 vieressä rivi rivinvaihto, U + 2028 oikosulkuerotin on rivinvaihtoa.
Mikä on uusi versiossa 4.16:
- Q muoto toimii jälleen ascii2uni.
- Lisätty U + 2033 kaksi pilkkua sen hahmot muutetaan lähimmille ascii vastaavia alla käyttämällä e muodossa uni2ascii.
Mikä on uusi versiossa 4.15:
- Uusi nimi endian.h jotta u2a_endian.h poistamaan ristiriidassa ulkoinen endian.h.
- Poistettu kopio GNU getline peräisin ascii2uni.c koska se on vakiona vuodesta POSIX2008.
Mikä on uusi versiossa 4.14:
- Kiinteä vika, joka haittasi käytöstä Q-muodossa in uni2ascii.
- Kiinteä vika, jossa ascification U + 2502 ja U + 2503 lisätty kaksinkertainen quote lähtöön.
- Kiinteä vika, jossa -a S vaihtoehto syntyy & quot; muunnettu niin monta merkkiä & quot; rivillä kunkin merkin takia poistun debugging code.
Mikä on uusi versiossa 4.13:
- Kiinteä vika, joka aiheutti liian monta merkkiä muutettu ASCII ilmoitettava.
Mikä on uusi versiossa 4.12:
- Molemmat ohjelmat mahdollistavat nyt input tiedostonimi tarkennettava komentoriviltä ilman uudelleenohjaus.
Mikä on uusi versiossa 4.11:
- Tämä julkaisu lisää tuen & lt; XX & gt; & lt; XX & gt; ja% uXXXX muodoissa.
Mikä on uusi versiossa 4.10:
- Tämä julkaisu korjaa vian, joka teki Y argumentti -a lipun ascii2uni no-op, ja korjaa man-sivut ja apua Y ja Q argumentteja -a lipun molemmissa ohjelmissa.
- Y argumentti on nyt virhe uni2ascii.
- versiotiedot ja toiminnan yhteenvedot ovat informatiivisia.
Kommentteja ei löytynyt