uni2ascii

Software kuvakaappaus:
uni2ascii
Ohjelmiston tiedot:
Versio: 4.18
Lähetyksen päivämäärä: 11 May 15
Kehittäjä: Bill Poser
Lupa: Vapaa
Suosio: 12

Rating: 3.5/5 (Total Votes: 2)

uni2ascii ja ascii2uni muuntaa UTF-8 Unicode ja kaikki erilaisia ​​7-bittisen ASCII vastineet, mukaan lukien: heksadesimaali ja desimaalin HTML numeromerkit viittaukset, u-pakenee, vakio heksadesimaali, ja raaka heksadesimaali.
Tällaiset ASCII vastineet ovat hyödyllisiä kuten Unicode tekstiä ohjelmalähteestä, kun tekstin syöttäminen web-ohjelmia, jotka voivat käsitellä Unicode-merkistöä, mutta eivät ole 8-bittinen turvallinen, ja kun virheenkorjaus.
Unicode pakenee käytettävissä ovat:
 
- HTML heksadesimaali numeerinen merkki viittauksia (esim)
- HTML desimaalin numeerinen merkki viittauksia (esim ȳ)
- U-pakenee, kuten käytetty Python (esim u00E9)
- U-pakenee sisällä BMP ja U-pakenee kuin BMP, esimerkiksi u00E9 mutta U00010024.
- U -merkillä merkittyjä (esim U 00E9)
- U-pakenee (esim U00E9)
- U-pakenee (esim u00E9)
- U-pakenee sisällä kulmasulkeet (esim)
- X-pakenee (esim x00E9)
- X-pakenee henkselit (esim x {00E9})
- Standard heksadesimaali (esim 0x00E9)
- Raw heksadesimaali (esim 00E9)
uni2ascii hyväksyy komentoriviltä lippu onko tuottaa isoja AF tai pienten kirjainten af ​​heksadesimaali numeroa, koska jotkin jotkin ohjelmat hyväksyvät vain jompaakumpaa. ascii2uni hyväksyy joko.
Kun kyseessä on uni2ascii oletuksena vain merkkejä ulkopuolella ASCII alueen muunnetaan. Vaikka ASCII-merkkejä myös muunnetaan, rivinvaihdot säilyvät, ellei niiden vaihtaminen on erityisesti pyytänyt. Välilyöntejä myös säilynyt, ellei muuntamista nimenomaisesti pyytänyt. Jos kyseessä on kolme ei-ASCII-merkkien (Ethiopic sana tilaa, Ogam tilaa, ja ideografisia avaruus), jos tilaa merkkejä ei muunneta, nämä korvataan ASCII-tilaan (0x20) niin pitää lähdön sisällä 7- ASCII-alue.
Tämä paketti sisältää neljä ohjelmaa. Pääohjelma on uni2ascii. Se on kirjoitettu C ja se on koottu. uni2html.py on edeltäjä uni2ascii. Kuten on kirjoitettu Pythonilla, sitä ei tarvitse koottava ja pitäisi toimia juuri mitään nykyisestä tietokoneesta. uni2ascii on muuten ylivoimainen, että:
- Se luo laajemman Tulostusmuodot.
- Se on noin 20 kertaa nopeammin.
- Se käsittelee panos koko 32 bittinen Unicode-alue. Sen sijaan, uni2html pelkästään käsittelee
Basic Multilingual Plane (Plane 0), koska tällä hetkellä Python edustaa Unicode koodattu teksti sisäisesti käyttämällä 16-bittisiä kokonaislukuja. Jos sinulla tekstiä, vaikkapa Linear B tai ugaritilainen, tarvitset uni2ascii.
Se tekee parempaa työtä raportoinnin virheitä. Jos se kohtaa virheen sen panos, kuten mal-muodostunut UTF-8, se raportoi sijainnin virheen olipa kyse merkkimäärä alusta tiedoston (alkaen 0) ja suhteen tavujen alusta tiedoston (myös alkaen 0). (Character laskee ja tavumäärät eivät yleensä ole samoja, koska UTF-8 merkin vie yhdestä neljään tavua.) Python versio raportit ainoastaan ​​merkkimäärä. uni2ascii myös tietoja virheestä.
Kolmas ohjelma, ascii2uni, on käänteinen uni2ascii. Se hyväksyy tekstin, joka sisältää erilaisia ​​ASCII esityksiä Unicode-merkkejä ja tuottaa UTF-8 Unicode.
Neljäs ohjelma, ascii2uni.py, lukee 7-bittinen ASCII sisältävä U-pakeni Unicode, sellaisena kuin sitä käytetään Python ja Tcl, ja muuntaa sen UTF-8 Unicode. Se on alkuperäinen ohjelma, joka ascii2uni on yleistys.

Mikä on uusi tässä julkaisussa:

  • Kiinteä bugi uni2ascii jossa tietyissä tapauksissa toisilla määrä oli liian suuri, vahvistetaan Debianin bug # 626268.
  • paikattava käsitellä tilannetta, NetBSD jossa ei ole getline.
  • Kirkastetut semantiikka puhdasta vaihtoehdon muuntaa merkkejä ascii alueella muita kuin tilaa ja rivinvaihtoa. Kiinteä vika, jossa tätä ei ole toteutettu oikein ja UTF8 tyyppejä.

Mikä on uusi versiossa 4.17:

  • Lisätty uni2ascii seuraavia muunnoksia lähimpään ascii vastaavat: U +2022 luoti "o", U + 00B7 keskellä piste ajan, U + 0085 vieressä rivi rivinvaihto, U + 2028 oikosulkuerotin on rivinvaihtoa.

Mikä on uusi versiossa 4.16:

  • Q muoto toimii jälleen ascii2uni.
  • Lisätty U + 2033 kaksi pilkkua sen hahmot muutetaan lähimmille ascii vastaavia alla käyttämällä e muodossa uni2ascii.

Mikä on uusi versiossa 4.15:

  • Uusi nimi endian.h jotta u2a_endian.h poistamaan ristiriidassa ulkoinen endian.h.
  • Poistettu kopio GNU getline peräisin ascii2uni.c koska se on vakiona vuodesta POSIX2008.

Mikä on uusi versiossa 4.14:

  • Kiinteä vika, joka haittasi käytöstä Q-muodossa in uni2ascii.
  • Kiinteä vika, jossa ascification U + 2502 ja U + 2503 lisätty kaksinkertainen quote lähtöön.
  • Kiinteä vika, jossa -a S vaihtoehto syntyy & quot; muunnettu niin monta merkkiä & quot; rivillä kunkin merkin takia poistun debugging code.

Mikä on uusi versiossa 4.13:

  • Kiinteä vika, joka aiheutti liian monta merkkiä muutettu ASCII ilmoitettava.

Mikä on uusi versiossa 4.12:

  • Molemmat ohjelmat mahdollistavat nyt input tiedostonimi tarkennettava komentoriviltä ilman uudelleenohjaus.

Mikä on uusi versiossa 4.11:

  • Tämä julkaisu lisää tuen & lt; XX & gt; & lt; XX & gt; ja% uXXXX muodoissa.

Mikä on uusi versiossa 4.10:

  • Tämä julkaisu korjaa vian, joka teki Y argumentti -a lipun ascii2uni no-op, ja korjaa man-sivut ja apua Y ja Q argumentteja -a lipun molemmissa ohjelmissa.
  • Y argumentti on nyt virhe uni2ascii.
  • versiotiedot ja toiminnan yhteenvedot ovat informatiivisia.

Vastaavia ohjelmistoja

namedentities
namedentities

14 Apr 15

GeSHi
GeSHi

20 Feb 15

DAPS
DAPS

20 Feb 15

Muu ohjelmistojen kehittäjä Bill Poser

Redet
Redet

3 Jun 15

SndBite
SndBite

2 Jun 15

ColorExplorer
ColorExplorer

2 Jun 15

UnicodeDataBrowser
UnicodeDataBrowser

14 Jul 15

Kommentit uni2ascii

Kommentteja ei löytynyt
Lisää kommentti
Ota kuvia!