LanguageTool

Software kuvakaappaus:
LanguageTool
Ohjelmiston tiedot:
Versio: 2.9 Päivitetty
Lähetyksen päivämäärä: 14 Apr 15
Kehittäjä: Daniel Naber
Lupa: Vapaa
Suosio: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool on avoimen lähdekoodin oikoluku ohjelma on suunniteltu löytää virheitä, että säännöllinen oikoluku työkaluja ei voi havaita. Se on sääntöihin perustuva tyyli ja kieliopin tarkistus, joka löytää virheitä, jolle sääntö on määritelty sen XML asetustiedostot, kuten sekoittamista up & ldquo; heidän & rdquo; kanssa & ldquo; siellä. & rdquo;


Tunnistaa erilaiset kielioppi ongelmia

Ohjelma voi myös havaita erilaisia ​​kieliopin ongelmia ja mukana tukee yli 20 kielellä, kuten Englanti, Saksa, Puola, Ranska, Espanja, Ruotsi, Kreikka, Kiina, Tanska, Japani, Islanti, Portugali ja Brasilian portugalin.
Lisäksi se tarjoaa helposti käyttää, yksinkertainen ja suoraviivainen graafinen käyttöliittymä, jonka avulla kuka tahansa voi liittää tekstiä, joka on oikeinkirjoituksen tarkistaa. Se voi tarkistaa tekstin leikepöydälle, tag tekstiä, leikkaus / copy / paste tekstiä, ja oleskella system tray alueella.


Tunnistaa erilaisia ​​ongelmia

Valitse valintaikkunan, voit ottaa minkä tyyppinen ongelmia sovellus voi tunnistaa, kuten huono tyyli, kielioppivirheitä, slangi, välimerkkejä virheitä, mahdolliset kirjoitusvirheet, tarpeeton lauseita, usein sekaisin sanoja, collocations, arvo, semantiikka, samoin kuten ei-standardi lausekkeet.


LanguageTool varten LibreOffice ja OpenOffice

Sen lisäksi, että sovelluksesta, LanguageTool on saatavana myös pidentää kahdella suosituimmista ja tehokas avoimen lähdekoodin toimisto-, LibreOffice ja Apache OpenOffice.org, jonka avulla käyttäjät voivat oikolukea tekstejään oikealla klikkaamalla valitun lauseita tai kappaleissa.


LanguageTool Mozilla Firefox

Lisäksi sovellus on myös ladattavissa add-on maailman & todellisten tuloste; s suosituin avoimen lähdekoodin web-selain maailmassa, Mozilla Firefox. Se ei vaadi uudelleenkäynnistystä ja asettaa pieni painike päätyökalurivin, jolloin voit proofread korostetun tekstin verkkosivuilta tai muodoissa.


Konepellin alla ja saatavuus

Sovellus on kirjoitettu kokonaan Java-ohjelmointikielellä, mikä tarkoittaa, että se & todellisten tuloste; sa cross-platform-ohjelmisto, suunniteltu toimimaan minkä tahansa GNU / Linux-jakelun sekä BSD, Solaris, Microsoft Windows ja Mac OS X -käyttöjärjestelmän järjestelmissä, joissa Java Runtime Environment on asennettu.

Mitä uutta tässä julkaisussa:

  • katalaani:
  • päivitetty POS tag sanakirja
  • lisätä uudet säännöt
  • kiinteitä vääriä hälytyksiä
  • Englanti:
  • Lisätty muutamia sääntöjä ja kiinteät muutamia vääriä hälytyksiä
  • Lisätty paljon uusia tyyli sääntöjen myötävaikuttanut Heikki Lehvaslaiho. Koska nämä voivat aiheuttaa vääriä hälytyksiä, ne eivät ole oletusarvoisesti aktivoitu. Voit aktivoida ne käynnistämällä kaikki säännöt uudessa "Pelkkä Englanti" luokka.
  • Esperanto:
  • lisätty muutamia uusia sääntöjä
  • Ranskan
  • päivitetty POS tag sanakirja ja Hunspell sanakirjaan Dicollecte-5.3
  • saksa:
  • lisätty muutamia uusia sääntöjä ja kiinteät vääriä hälytyksiä
  • Lisätty uusi sääntö, joka tarkistaa kohteena verbi sopimusta. Nyt, vain tapauksissa "ist", "sind", "sota" ja "Waren" tuetaan. Esimerkki virheet, jotka havaitaan: "Der Hund sind SCHA & para; n.", "Die Autot ist Schnell." Jotta tämä sääntö työn lauseet ovat nyt yhtenäistetään disambiguation.xml: esimerkiksi "Mann" lauseeseen "ein Mann" vain säilyttää nominative lukema (SUB: NOM: SIN: MAS), kun se oli aiemmin myös accusative ja datiivi lukemat (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • Italialainen:
  • parantunut muutamia sääntöjä
  • puola:
  • lisännyt useita uusia säännöksiä
  • portugali:
  • lisätä / parannettu useita sääntöjä
  • 3695 yhdyssanan (ennen uudistusta) - suurin vapaa tietokanta
  • Russian:
  • lisätä ja parannettujen
  • Ukrainian:
  • iso sanakirja update
  • uudet kieliopin sääntöjen
  • uusi yksinkertainen korvaa sääntö pehmeä ehdotuksia
  • disambiguator parannuksia
  • yhdistettä koodaus ja oikeinkirjoitus parannuksia
  • nimikirjaimet koodaus parannuksia
  • lauseen ja sana tokenizing parannuksia
  • paremmalla käsittelyllä stres symbolin ja pehmeä tavuviiva
  • Bitext sääntöjä:
  • lisätä yksinkertainen sääntö tarkistaa, onko käännösten päättyy samaan välimerkki kuin alkuperäinen (tämä sisältää vain.?! Merkkiä).
  • on nyt mahdollista lisätä ulkoisia bitext sääntö tiedostot komentoriviltä käyttämällä
  • -bitextrule vaihtoehto. Tiedoston polku on oltava ehdoton. Huom: Tämä sallii käytössä bitext sääntöjä myös kieliä, joilla ei ole bitext sääntöjä mukana oletuksena.
  • Spelling:
  • Uusi tiedostoja /hunspell/spelling.txt voidaan lisätä hyväksyttyjä sanoja oikeinkirjoituksen tarkistuksen, joka pidetään myös luotaessa väärin kirjoitettujen sanojen. Tämä on samanlainen /hunspell/ignore.txt tiedostoja, joita luettelossa hyväksyneet sanat, joita * ei * käytetään luotaessa väärin kirjoitettujen sanojen.
  • API:
  • JLanguageTool.activateDefaultPatternRules () ja JLanguageTool.activateDefaultFalseFriendRules () on poistettu - kaikki pattern sääntöjä ja väärän ystävä sääntöjen (jos toinen kieli on määritelty) on nyt aktivoitu automaattisesti, kun rakentaja JLanguageTool kutsutaan. Jos tarvitset nappula ilman XML-pohjainen malli sääntöihin, pidentää kieli luokka (esimerkiksi "Englanti) kanssa, joka korvaa getPatternRules () menetelmä ja palauttaa tyhjän listan sinne.
  • ManualTagger.lookup () on korvattu ManualTagger.tag () jälkeen vanhentunut, sillä uusimman
  • Kaikki staattisia menetelmiä ja kentät luokan "Language" on siirretty uuteen luokkaan "Languages". Nyt, menetelmät / kentät luokassa Kieli on edelleen, mutta on hylätty.
  • LanguageIdentifierTools on poistettu. Käytä LanguageIdentifier sijaan.
  • Poistettu (oletus) ResourceDataBroker.setResourceDir () ja setRulesDir (), sillä nämä voidaan asettaa rakentaja
  • siivottu up luokka tekijät, esim. poistaminen getRemark ()
  • Category.setDefaultOff () on poistettu, tämä voidaan asettaa rakentaja nyt
  • Uusi nimi luokat: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Muut pienet API puhdistuksia, että ei pitäisi vaikuttaa yhteiseen käyttöön tapauksissa, esimerkiksi IncorrectExample.getCorrections () palauttaa ja unmodifiable lista nyt, poistamalla vanhentuneet menetelmiä.
  • Sulautettu palvelin:
  • XML pakotietä on korjattu, tämä saattaa aiheuttaa virheellisiä XML palautettava
  • uusi Asetustiedoston "maxWorkQueueSize", jonka avulla voit määrittää maksimikoko jonoon - jos se saa tätä suurempi, pyynnöt hylätään (503 Palvelu ei)
  • Palvelin on nyt vastaa tarkempia HTTP-tilakoodit nämä virhetilanteet: 413 Request Entity Too Large - Jos teksti on pidempi kuin suurin tekstin kokoa 503 Palvelu ei ole käytettävissä - Jos tarkistus ylittää suurimman check aika
  • GUI:
  • stand-alone GUI voi nyt tehdä tekstitiedosto argumenttina, tämä tiedosto on sitten ladataan käynnistyksen yhteydessä (Github kysymys # 232).
  • Command-line:
  • Nyt on mahdollista lisätä ulkoisen sääntö tiedosto soitettaessa LanguageTool komentoriviltä. Käytä --rulefile lisätä tiedostoon. Jos tiedoston nimi on muodossa, joka sisältää kielen nimi, sitä käytetään yhdessä muiden sääntöjä; muuten, se korvaa sääntöjä. Voit myös ladata ulkoisen tiedoston kanssa vääriä ystäviä käyttäen vaihtoehtoa --falsefriends. Tiedoston nimen pitäisi olla ehdoton tiedoston polku ja vääriä ystäväni tiedostot ovat aina lisätään ne, jotka lastataan kielen. (Github kysymys # 192)
  • Rule tapaan:
  • sääntö voi nyt yksittäinen esimerkki lause niin kauan kuin se on "korjaus" määritettä - tämä voi säästää irtisanomisen, jos ainoa oikea lause on sama kuin väärän lauseen korjausta. Ennen säännön tarvitaan vähintään kaksi esim lauseita.
  • example elementtiä: type = "virheellinen" on nyt pakollista, jos siellä "korjausta" määritettä. "Korjaus" määrite tarkoittaa, että lause on virheellinen.
  • example elementtiä: type = "oikea" on nyt pakollista. Ei "tyyppi" määrite ja ei "korjausta" määrite tarkoittaa, että lause on oikea.
  • Internal:
  • Olemme siirtyneet Apache Tikan kieleen-ilmaisimen (https://github.com/optimaize/language-detector) automaattisesti tunnistaa kielen. Sen pitäisi olla nopeampi ja tulosten pitäisi olla luotettavampia. Havaitseminen Asturian ja Galician oli poistettu käytöstä, koska havaitseminen laatu oli liian alhainen, ja vaikuttaa myös havaitsemista Espanjan.
  • Kiinteät regressio, joka teki mahdottomaksi ladata ulkoiseen sääntö tiedostot GUI.

Mikä on uusi versiossa 2.8:

  • Asturian:
  • poistettiin riippuvuutta Hunspell, nyt käyttää Morfologik oikolukua
  • Breton:
  • lisätty ja parannettu muutamia sääntöjä
  • katalaani:
  • päivitti sanakirja
  • lisätä ja parannettujen
  • kiinteitä vääriä hälytyksiä
  • hollanti:
  • lisätään ja parannetaan monia sääntöjä
  • Englanti:
  • joitakin uusia sääntöjä (kiitos Nick Hough)
  • päivitti Tagger ja syntetisaattori sanakirjoja, vahvistamisesta ongelma # 202
  • uusi suodatin käytettävä vastaavia partofspeech osien sanoja, esimerkiksi: in. * Tämä vain pitää tulosta sanoja, jotka alkavat "in" ja jos osan jälkeen "in" on adjektiivi (POS tag "JJ"). "No: 1 'on symbolinen asema, eli tässä ensimmäinen (ja ainoa) matching viitataan.
  • ranska:
  • lisätty ja parannettu muutamia sääntöjä
  • saksa:
  • lisätty ja parannettu muutamia sääntöjä
  • puola:
  • lisätty ja parannettu useita sääntöjä
  • lisätään ja parannetaan vääriä ystäviä, jossa Englanti
  • portugali:
  • lisätä / parannettu useita sääntöjä
  • espanjaksi:
  • poistettiin riippuvuutta Hunspell, nyt käyttää Morfologik oikolukua
  • alustanut sääntöjen file
  • Lisäsin sääntöihin
  • Tagalog:
  • poistettiin riippuvuutta Hunspell, nyt käyttää Morfologik oikolukua
  • viiva merkin ("") on rajana nyt kun tokenizing tekstiä
  • Russian:
  • lisätä ja parannettujen
  • lisätään muutama väärä ystävä sääntöjä (Venäjä / Englanti)
  • Ukrainian:
  • monien uusien sääntöjen (mukaan lukien sopimus substantiiveja, aika ilmaisuja jne)
  • sääntö kattavuuden parantaminen
  • sanakirja päivitys (iso parannuksia erisnimiä ja vokatiivi)
  • uusi tagi ja sääntö varoittaa vaihtoehtoinen kirjoitusasu
  • lisätä sana taajuus tietoja parantamaan oikeinkirjoitusehdotuksia
  • joidenkin uusien disambiguator säännöt
  • Rule Syntaksi:
  • ... voidaan nyt lisätä rulegroup vaikuttaa kaikkiin sääntöihin tämän ryhmän
  • Jos olet kehittää omia sääntöjä, jotka eivät ole osa LT voit lisätä ulkoisia = "yes" teidän luokkia estää säännön linkkiä community.languagetool.org näkyminen itsenäistä GUI (linkki ei toimi säännöt, jotka eivät ole osa tärkeimmistä jakelun LT). (Github kysymys # 223)
  • Jos sääntö ryhmittymä määrää default = "off", säännöt sisällä sääntö ryhmää ei myös määritellä oletus = "on" / "off".
  • API:
  • Poistettu luokkia ja menetelmiä, jotka oli hylätty vuodesta 2,7 tai kauemmin
  • Sulautettu palvelin:
  • config file vaihtoehdot "requestLimit" ja "requestLimitPeriodInSeconds" voi nyt käyttää myös HTTP-palvelimen (ei vain HTTPS palvelin)
  • Uusi Asetustiedoston 'trustXForwardForHeader ": aseta tämä on" true ", jos suoritat palvelimen takana käänteinen proxy ja haluavat pyytää raja työskennellä alkuperäisen IP-osoitteita" Xforwardedfor "HTTP-otsikon, yleensä asettamat proxy. Jos suoritat proxyn, mutta älä aseta tämän ominaisuuden arvoksi true, yksi käyttäjä voi käyttää kaikkia pyyntöjä, jotta muut käyttäjät saavat myös virhettä, koska pyynnön rajan.
  • Korjaa vastauksen määräajan jälkeen tila: ... oli joskus tyhjä, sekava teksti check in WordPress
  • Bitext sääntöjä ei poistettu käytöstä oikein, vaikka ne täsmennettiin asianmukaisesti parametrin palvelimelle; Nyt se on kiinteä
  • Korjattu ongelma sopimatonta kannat joidenkin bitext sääntöjä (asia # 218)
  • GUI:
  • Uusi "errorColors" -asetus on lisätty languagetool.cfg asetustiedostoa. Sitä voidaan käyttää asettamaan taustavärin virheitä. Esimerkiksi errorColors = kirjoitusvirheitä: # b8b8ff, tyyli: # ffb8b8 näyttää "kirjoitusvirheitä" virheistä sinisellä taustalla ja "tyyli" virheet punaisella taustalla yläosassa LT ikkunan. "Kirjoitusvirheitä" ja "tyyli" ovat tyyppejä, jotka on asetettu grammar.xml nimellä "type = ...". Ei ole käyttöliittymää vielä määrittää näitä värejä. Huomaa, että sinun pitäisi vain muokata languagetool.cfg tiedoston, kun LT ei ole käynnissä.
  • Internal:
  • Bugikorjaus: säännöt sisällä sääntöryhmää ei ollut aktivoitu, jos aiemman säännön samasta rulegroup käytetty oletus = "off"
  • Sanat eivät sivuuttaa enää joita oikoluvun vain koska he esiintyvät sääntö ehdotusta. Jos haluat oikolukutoiminto sivuuttaa sanoja globaalisti, lisää ne hunspell / ignore.txt. Jättää ne yhteydestä riippuen, lisää "ignore_spelling" sääntöä disambiguation.xml.
  • file 'hunspell / prohibit.txt "voidaan nyt käyttää merkitä sanaa kuin kirjoitusvirheitä vaikka oikoluvun normaalisti hyväksyvät ne. Tämä on hyödyllistä parantaa LanguageTool oikoluku odottamatta ylävirtaan checker päivitetään. "Prohibit.txt" tiedosto on vastakohta "ignore.txt", joka aiheuttaa oikolukutoiminto sivuuttaa sanoja.
  • partofspeech tagger useimmille kielille voidaan nyt laajentaa lisäämällä merkinnät tiedostoon org / languagetool / resurssi / XX / added.txt (XX on kielikoodi). Formaatti on "fullform baseform postag", kolmessa sarakkeessa erotettu välilehdet. Tämä helpottaa käyttäjien (ja kehittäjät) jatkaa POS Tagger, koska niiden ei tarvitse viedä, muokata ja luoda binary sanakirjassa jokaista muutosta.

Mikä on uusi versiossa 2.7:

  • Breton:
  • lisätä ja parannettujen
  • Uusi sääntö, joka tarkistaa, jos arkipäivä vastaa päivämäärää, esimerkiksi havaitsee "Gwener 28 eli Eost 2014", kyseinen päivä ei ole perjantaina.
  • katalaani:
  • lisätä ja parannettujen
  • kiinteitä vääriä hälytyksiä
  • hollanti:
  • lisätään ja parannetaan monia sääntöjä
  • vaihtoi Morfologik perustuva oikoluku
  • -Englanti:
  • Haluatko olla osa tiimiä, joka kehittää maailman tehokkain Open Source oikoluku työkalu? Etsimme ylläpitäjä Englanti sääntöjen LanguageTool. Katso http://wiki.languagetool.org/tasks-for-language-maintainers lisätietoja.
  • All Englanti sanakirjoja on laajennettu sisältämään sana taajuus luokat parantaa oikeinkirjoitusehdotuksia (taajuus tiedot ovat peräisin https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / IME / latin / sanakirjoja, kuten muita kieliä, jotka jo käyttävät tätä toimintoa).
  • Parempi ehdotuksia Englanti oppijoille: epäsäännöllisiä verbejä, substantiiveja ja adjektiiveja nyt yleensä parempi ehdotus. Esimerkiksi "thinked 'viittaa" ajattelin "," naisen "viittaa" naiset ".
  • Lisää kirjoitusvirheet antaa ehdotuksia nyt, esimerkiksi "Garentee" (takuu), "kiitollinen" (kiitollinen). Tämä saattaa aiheuttaa suorituskyvyn laskua ~ 10% (enemmän tekstien paljon tuntemattomia sanoja).
  • Uusi sääntö, joka tarkistaa, jos arkipäivä vastaa päivämäärää, esimerkiksi havaitsee "maanantai 07 lokakuu 2014", kyseinen päivä ei ole maanantaina. Tämä sääntö toimii vain, jos se havaitsee päivämäärän muodon käytössä. Toistaiseksi nämä formaatteja tuetaan: * "maanantai 07 lokakuu 2014" * "maanantai 07 lokakuu 2014" * "maanantai 07 lokakuu 2014" * "maanantai 07 lokakuu 2014" * (tämä toimii myös lyhennetty viikko päivinä kuten Mo tai ma maanantai)
  • Esperanto:
  • Uusi sääntö, joka tarkistaa, jos arkipäivä vastaa päivämäärää, esimerkiksi havaitsee "Vendredon la 28.-de AAgusto 2014", kyseinen päivä ei ole perjantaina.
  • ranska:
  • päivitetty POS tag sanakirja ja Hunspell sanakirjaan Dicollecte-5.2
  • lisätä syntetisaattorin - sopimukseen sääntö voi nyt tehdä ehdotuksia joitakin virheitä
  • lisätä / parannettu useita sääntöjä
  • Uusi sääntö, joka tarkistaa, jos arkipäivä vastaa päivämäärää, esimerkiksi havaitsee "Vendredi 28/08/2014", kyseinen päivä ei ole perjantaina.
  • saksa:
  • Korjattu harvinainen NullPointerException ja ArrayIndexOutOfBoundsException
  • Kiinteät useita vääriä hälytyksiä
  • Lisätty ja parannettu säännöt
  • Uusi sääntö, joka tarkistaa lauseet ilman verbi (oletuksena pois päältä, koska riski väärien hälytysten)
  • Uusi sääntö, joka tarkistaa, jos arkipäivä vastaa päivämäärää, esimerkiksi havaitsee "Dienstag, 29.9.2014", kuten päivämäärä ei ole tiistaina.
  • Suorituskyky parannukset oikeinkirjoituksen tarkistus ehdotuksia
  • Persian:
  • lisätä alkuvaiheen tukea Persian (Farsi)
  • puola:
  • lisätään ja parannetaan joitakin sääntöjä
  • Uusi sääntö, joka tarkistaa, jos arkipäivä vastaa päivämäärä
  • portugali:
  • lisätä / parannettu useita sääntöjä
  • lisänneet monia kymmeniä yhdyssanan
  • Russian:
  • lisätä uudet säännöt
  • Korjaa SourceForge ominaisuudesta # 38 (tarkista eri lainausmerkkejä)
  • lisätään muutama väärä ystävä sääntöjä (Venäjä / Englanti)
  • Uusi sääntö, joka tarkistaa, jos arkipäivä vastaa päivämäärää, esimerkiksi havaitsee "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro; & ETH; & frac12; -kertainen N & sbquo; N ?? & ETH; & plusmn, N & euro; N ?? 2014 & ETH; & sup3 ;. ", kyseinen päivä ei ole maanantaisin.
  • laajentunut Venäjän yhdiste sääntö uusia sanoja postag sanakirjasta
  • espanjaksi:
  • Lisätty uusi POS luokka Z (varten kirjoitettu numeroita, esimerkiksi "uno", "dos", ...)
  • Spelled numerot voidaan nyt havaita ja hallita sekä täsmennyssivulta ja sääntöihin.
  • Kiinteät joitakin virheellisiä lemmas sisään POS sanakirjassa.
  • lisätyt Hybrid Chunker-disambiguator.
  • tamili:
  • Lisätty alkuvaiheen tuki Tamil. Jos fonttia varten Tamil ei oikein näy tietokoneella ja käytät Windows, voit joutua soveltamaan kiertää tässä kuvattujen: https://bugs.openjdk.java.net/browse/JDK-8008572
  • Ukrainian:
  • iso päivitys POS sanakirja (korjaukset ja uusia sanoja)
  • joidenkin POS tag nimeksi johdonmukaisuus; uusia tunnisteita lyhenteet ja harvinaisia ​​sanoja
  • monia uusia sääntöjä ja korjauksia nykyiset säännöt
  • Uusi sääntö, joka tarkistaa, jos arkipäivä vastaa päivämäärää, esimerkiksi havaitsee "& ETH; & ETH; & frac34; & ETH; & frac12; -kertainen & ETH; & micro; & ETH;" N & ETH; "& ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", kyseinen päivä ei ole maanantaisin
  • symbolinen normalisointi suorituskyvyn parantaminen
  • LibreOffice integraatio:
  • Älä hämmentävät alaviitteet LibreOffice 4.3 ja myöhemmin (nyt antaa meille alaviite kannat metatiedot, jotta voimme jättää ne).
  • API:
  • Major suorituskyvyn parannuksia multi-thread use case, jossa JLanguageTool saa luotu kohti kierre, mutta kielen esine (esim "saksalainen") saa luoda vain kerran. Overhead luoda JLanguageTool pitäisi nyt olla paljon pienempi.
  • Poistettu useita luokkia ja menetelmiä, jotka oli hylätty sitten version 2.6
  • Poistettu DutchSpellerRule - käytä MorfologikDutchSpellerRule sijaan
  • allekirjoitus Language.getRelevantRules () on muuttunut
  • JLanguageTool ja MultiThreadedJLanguageTool rakentajien eivät ilmoita heittää IOException enää
  • WhitespaceRule on nimetty uudelleen MultipleWhitespaceRule (WhitespaceRule edelleen olemassa, mutta se on hylätty)
  • Poistettu joitakin menetelmiä, joiden näkyvyys vähenee (esim julkisesta suojattu)
  • MorfologikSpellerRule.getRuleMatch (String, int) on nimetty uudelleen MorfologikSpellerRule.getRuleMatches (String, int)
  • RuleMatch rakentajan on nyt heittää poikkeus, jos toPosition ei ole suurempi kuin fromPosition
  • Käyttöön uusi abstrakti luokka TextLevelRule joka ulottuu Rule ja jotka voidaan käyttää sääntöjä, jotka kattavat yli yhden lauseita.
  • Komentorivin:
  • käyttöönotto ja käytöstä erityisiä sääntöjä samaan aikaan on nyt sallittua. Jotta voidaan testata vain muutamia sääntöjä (poistamalla kaikki loput), joka aiemmin oli tehnyt "enable LIST_OF_RULES", käyttävät nyt "--enabledonly enable LIST_OF_RULES" (tai "-eo -e LIST_OF_RULES").
  • Sulautettu palvelin:
  • kaksi uutta vaihtoehtoa voidaan asettaa ominaisuuksia tiedosto tehdä LanguageTool palata samaa XML-muodossa kuin määräajan jälkeen (ATD). Näin voidaan käyttää drop-in korvaaja ATD: * mode - "LanguageTool" tai "AfterTheDeadline" * afterTheDeadlineLanguage - code of default kielellä, jos tilaksi on asetettu "AfterTheDeadline" HUOMAUTUS: "AfterTheDeadline" -tilassa olisi harkittava kokeellinen nyt.
  • Uusi optio "maxCheckThreads" sallii asettamalla enimmäismäärä viestiketjut työskentelee pyyntöjä rinnakkain. Oletuksena on 10, koska se käytti olla.
  • Sisäosat:
  • Uusi abstraktin säännön AbstractDateCheckFilter, jonka avulla voit tarkistaa, onko viikonpäivä ja päivämäärä ottelussa. Esimerkiksi "tiistai 29 syyskuu 2014", voitiin havaita, koska 29 syyskuu 2014 ei ole oikeastaan ​​tiistaina. Tämä käyttää uusia kokeellisia RuleFilter käyttöliittymä, joka voidaan kutsua XML uuden "suodattimen" elementtiä. "Suodatin" vie näitä ominaisuuksia: "luokka": täysin pätevä nimi Java-luokka, joka toteuttaa RuleFilter, esimerkiksi "Org.languagetool.rules.de.DateCheckFilter '' args ': merkkijono, kuten" vuosi: 1 kuukausi: 2 päivä: 3 Weekday: 4 "eli avaruus eroteltu lista avain / arvo-pareja, jossa x saa päätti pattern n tunnuksen arvo (kuten "viestin" elementti)
  • Yhdiste sääntö ohittaa nyt Evästeet on immunisoitu disambiguation.xml
  • "suodatin" toimintaa disambiguator sovelletaan nyt vain POS-tunnisteita, jotka vastaavat POS tag annettu. Jos ne eivät täsmää, sääntöä ei sovelleta.
  • Jos olet laajentamalla XML sääntöjä kuvattu http://wiki.languagetool.org/tips-and-tricks#toc2, ulkoinen sääntö ja disambiguation tiedostot voidaan nyt isännöi salasanalla suojatun palvelimen määrittelemällä URL tältä: http: // käyttäjä: password@example.org/path/user-rules.xml
  • em viiva ("& euro;" ") on nyt tokenizing hahmo kaikille kielille
  • Uusi ominaisuus:
  • Käytä kielimallien
  • LanguageTool voivat nyt hyödyntää ngram tietoja. ngram data on tietoa siitä, kuinka usein lauseita esiintyvät kielellä. Tällä hetkellä tämä käyttää ilmauksia, joiden pituus on 3.
  • dataa käytetään Englanti sääntö löytää homophone virheitä, kuten sotketaan karkea / kurssin tai hohto / leimahtaa. LanguageTool oli joitakin tämänkaltaisia ​​sääntöjä ennen, mutta uusi sääntö tukee nyt noin 900 tällaisen sanaparien / sarjoiksi.
  • tarvittavat tiedot tähän on valtava (7FI ja Englanti), ja näin ollen ei kuulu eikä LanguageTool.
  • data (Englanti vain nyt) ja asiakirjat on saatavilla osoitteessa http://wiki.languagetool.org/finding-errors-using-big-data
  • käyttäminen ngrams tekee LanguageTool hieman hitaammin, kun tiedot tallennetaan SSD.
  • Jos ei ole tallennettu SSD, suorituskyky saattaa vähentää rajusti.
  • Käytä uutta --languagemodel vaihtoehto komentoriviä aktivoida sääntöä, joka käyttää dataa. Tämä vaihtoehto ei ole vielä saatavilla stand-alone GUI.

Mikä on uusi versiossa 2.4.1:

  • Päivitetty Morfologik kirjastot 1.8.3 korjata hidas ehdotuksia oikeinkirjoituksen tarkistus, joka vaikutti ainakin en-US

Mikä on uusi versiossa 2.4:

  • Breton:
  • SRX lause tokenization
  • lisätä / parantunut muutamia sääntöjä
  • Kiinteät joitakin vääriä hälytyksiä
  • kiinteä virheellisiä ehdotuksia ansiosta lisätty testit korjaukset
  • katalaani:
  • lisätä / parannettu useita sääntöjä
  • kiinteitä vääriä hälytyksiä
  • tehty lisäyksiä ja korjauksia Tagger sanakirjaan
  • poistetaan joitakin sanoja synteesin sanakirjan (ks filterarchaic.txt)
  • lisätä taajuus datan Tagger sanakirjaan; taajuus sanalista tulee Gaia projektin, Apache License, versio 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Englanti:
  • lisätä / parantunut muutamia sääntöjä
  • Kiinteät joitakin vääriä hälytyksiä
  • ranska:
  • lisätä / parannettu useita sääntöjä
  • Kiinteät joitakin vääriä hälytyksiä
  • saksa:
  • lisätä / parannettu useita sääntöjä
  • lisäsi syntetisaattorin sopimukseen sääntö voi nyt tehdä ehdotuksia joitakin virheitä (ei kaikki ehdotukset ovat oikein, vaikka)
  • puola:
  • lisätä / parannettu useita sääntöjä, erityisesti tavuviiva ja viiva käyttö
  • lisätä taajuustiedot Oikeinkirjoitukseen sanakirja; taajuus sanalista tulee Gaia projektin, Apache License, versio 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Kiinteät joitakin vääriä hälytyksiä
  • portugali:
  • lisätä / parannettu useita sääntöjä (se sisältää nyt sukupuoli sääntöjä "" / "o")
  • nyt on 3400+ yhdyssanan
  • JAR tiedosto on nimetty uudelleen languagetool.jar, mistä aiemmin languagetoolstandalone.jar välttää epäselvyyttä siitä, mitä 'itsenäinen' tarkoitetaan tässä yhteydessä (github kysymys # 29)
  • kieliä monia sääntöjä (kuten ranska tai saksa) suorituskyvyn pitkään teksteistä on kasvanut noin 2030%
  • fix for threadsafety (saattaa aiheuttaa roikkua MultiWordChunker)
  • Kiinteä vika, jossa pala huomautuksia ei testattu ryhmissä
  • fix: 1 ja ei ole arvioitu ...
  • kiinnitetty bugi yhdistymisen mekanismi, hävittää joitakin vastaavia tulkintojen ennenaikaisesti
  • lisätty tuki murikka Huomautusten disambiguator, ja kiinteät yksi bugi suodatus rahakkeita kimpale merkintöjä
  • päivitetty Morfologik kirjastot 1.8.2 (korjaukset, tiukemmat input järki tarkistaa, lisää taajuus tietoja sanakirjat)
  • lisätä mahdollisuutta sisällyttää taajuuden datan taggging tai oikeinkirjoitus sanakirjoja. Odotettu muoto taajuuden sanalistat on yksi Gaia hankkeessa, Apache License, versio 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • uusi komentorivin työkaluja viedä ja luoda binary sanakirjat:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • LibreOffice / OpenOffice yhdentyminen:
  • lisätä kiertää virheellisen lauseen havaitsemiseen myös tapauksia, alaviite ilmestyi jälkeen lauseen piste (Sourceforge bug # 191)
  • Itsenäinen GUI:
  • valintaikkuna avasi "Lisää ..." kohteen pikavalikosta virhe nyt myös näyttää oikean ja väärän esimerkin lauseita
  • API:
  • SentenceTokenizer on nyt rajapinta, täytäntöönpano on siirretty RegexSentenceTokenizer, mutta tämä on vanhentunut, ja SRXSentenceTokenizer sijaan tulisi käyttää
  • Joitakin menetelmiä org.languagetool.tools.StringTools on siirretty org.languagetool.gui.Tools luokan languagetoolguicommons hankkeeseen
  • LanguageToolListener.languageToolEventOccured () on nimetty uudelleen LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator ei ole julkista enää (ei vaikuta kenenkään)
  • poistettu DanishSentenceTokenizer joka oli vanhentunut kolme vuotta
  • Rule.getCorrectExamples () ja Rule.getIncorrectExamples () ei palauta null enää, mutta tyhjän listan, jos ei ole esimerkkejä. Niinpä setCorrectExamples () ja setIncorrectExamples () eivät hyväksy null enää.
  • Rule.getId () palauttaa minkä tahansa merkkijonoa nyt, ei vain ASCIIonly jouset (Oikeastaan ​​tämä on tapahtunut ennen kuin ASCIIonly rajoitus ei koskaan panna täytäntöön, ja mainitaan ainoastaan ​​javadoc)
  • languagetoolwikipedia: komentorivivalinnat tarkistamiseksi Wikipedia kaatopaikka on yksinkertaistettu. Komento voidaan nyt kutsua näin: java jar languagetoolwikipedia.jar checkdata l fi f enwiki20130621pagesarticles.xml Call vain "java jar languagetoolwikipedia.jar checkdata" saada käyttöön viestin. Useampi kuin yksi tiedosto voidaan määritellä f vaihtoehto. Lisäksi Wikipedian XML kaatopaikalle, CSV tiedostoja Tatoeba (http://tatoeba.org) ovat nyt myös tuetaan, ne täytyy suodattaa ensin sisältämään vain kyseistä kieltä.

Mikä on uusi versiossa 2.3:

  • Breton:
  • lisätä / parantunut muutamia sääntöjä
  • kiinteitä vääriä hälytyksiä
  • päivitetty POS sanasto apertium (svn r47282)
  • katalaani:
  • lisätty tuki kielikoodille ca-ES-Valencia (katalaani Valencian), käytettäväksi LibreOffice 4.2.0
  • lisätä yksinkertainen korvaa sääntö satoja korvaavan ehdotuksia
  • lisätä / parannettu useita sääntöjä
  • kiinteitä vääriä hälytyksiä
  • Kiinalainen:
  • lisätä kiertää StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • Englanti:
  • lisätä korvaava kaavoja oikeinkirjoituksen tarkistus tehdä ehdotuksia paremmin (tarjoaa nyt "opetetaan" for "opettanut")
  • lisätä / parantunut muutamia sääntöjä
  • ranska:
  • lisätä / parantunut muutamia sääntöjä
  • kiinteitä vääriä hälytyksiä
  • päivitetty POS tag sanakirja ja Hunspell sanakirjaan Dicollecte-4.12
  • saksa:
  • lisätä / parannettu useita sääntöjä
  • portugali:
  • lisätä / parantunut muutamia sääntöjä
  • nyt on 3300+ yhdyssanan
  • Ukrainian:
  • lisätä / parannettu useita sääntöjä
  • lähdekoodi on siirretty github: https://github.com/languagetool-org/languagetool
  • LanguageTool vaatii Java 7 nyt
  • LanguageTool käyttää useita säikeitä nyt tekstin tarkastamista nykyaikaisen laitteiston, parantaa suorituskykyä (tämä vaikuttaa stand-alone versio, komentoriviltä ja LibreOffice / OpenOffice laajennus)
  • Rule tapaan:
  • alustavaa tukea uusien min / max ominaisuuksia, joiden avulla vastaamaan elementti, joka näkyy tietyn määrän kertoja. Esimerkiksi: foo täsmää mitään tai "foo", eli "foo" on vapaaehtoista foo täsmää "foo" tai "foo foo" foo täsmää mitään, "foo", tai "foo foo" Käytä max = "- 1" sallia rajoittamattoman esiintymät. Saat min, vain 0 tai 1 on tuettu (1 on oletus).
  • tuki OR-lausuntoja. Esimerkiksi: Sisäisesti ja run-time, lainsäädäntö, OR-lausunnot muunnetaan useita sääntöjä ilman OR-lausuntoja.
  • Englanti on nyt Chunker havaita muun muassa, yksikkö ja monikko substantiivi paloina. Tämä on dokumentoitu http://wiki.languagetool.org/using-chunks
  • itsenäinen versio:
  • Itsenäinen versio on nyt alleviivaa virheet punaisella (kirjoitusvirheet) tai sininen (muut virheet) linjan (Panagiotis Minos)
  • Muista kielen valinta seuraavan käynnistyksen
  • Parannettu ikkuna ja dialogi sijoitus usean näytön setup
  • upotettu palvelin: käyttää default portti (8081) uudelleen, jos aloittaa ilman argumentteja
  • päivitti morfologik joukkokäsittelyyn kirjasto versioon 1.7.1, jotta paremmin ehdotuksia, mukaan lukien asianmukainen käsittely tarkkeiden ja korvaavan malleja (vastineet MAP ja REP ominaisuudet hunspell sanakirjat)
  • OpenOffice / LibreOffice yhdentyminen:
  • fix: "Tietoja" dialogi ei toiminut Apache OpenOffice 4.0
  • fix: maakohtaiset säännöt (kuten British Englanti) ei toimi
  • API:
  • Luokassa Kieli, getCountryVariants () on nimetty uudelleen getCountries (), ja uusi menetelmä getVariant on lisätty.
  • Joitakin menetelmiä on hylätty
  • Jotkin menetelmät on siirretty Tools luokka (languagetool-core) uuteen CommandLineTools luokka (languagetool-komennossa)










Mikä on uusi versiossa 2.2:



Mikä on uusi versiossa 2.1:





Mikä on uusi versiossa 2.0:







Vaatimukset :

  • Java 2 Standard Edition Runtime Environment

Muu ohjelmistojen kehittäjä Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Kommentit LanguageTool

Kommentteja ei löytynyt
Lisää kommentti
Ota kuvia!