ByteScout PDF Extractor SDK

Software kuvakaappaus:
ByteScout PDF Extractor SDK
Ohjelmiston tiedot:
Versio: 9.0.0.3079 Päivitetty
Lähetyksen päivämäärä: 15 Aug 18
Kehittäjä: ByteScout
Lupa: Shareware
Hinta: 10.00 $
Suosio: 130
Koko: 596 Kb

Rating: 3.0/5 (Total Votes: 3)


        PDF Extractor SDK Windows-ohjelmistokehittäjille: PDF-teksti, PDF XML, PDF-tiedostot, PDF-tiedoston lukeminen, PDF CSV Excel.

Bytescout PDF Extractor SDK mahdollistaa muuntaa PDF jotta kirjoitus, PDF XML, PDF CSV, poimia kuvia PDF, tietoonsa PDF-tiedostot .NET ja ActiveX rajapintoja ilman erillistä ohjelmistoa.


Edut:
 muuntaa PDF-tekstin tavalliseksi tekstiksi (ja se voi seurata sarakkeita, jos muunat sanomalehteä PDF-muodossa) - mukaan lukien näkymätön tekstin poisto;
 muuntaa taulukot PDF: ksi Exceliksi (CSV) lukemalla soluja tietystä suorakulmasta;
 muuntaa taulukot PDF-muotoon XML-tiedostoihin;
 otat PDF-tiedoston metatiedot (otsikko, tekijä, kuvaus) ja saavat muita tietoja tiedostosta (sivumäärä, salattu tai ei);
 otat upotetut kuvat PDF-dokumentilta (ASP.NET, VB.NET, C #, VB6 ja VBScript);
 DocumentMerger- ja DocumentSplitter-rajapinnat ja -luokat yhdistää ja jakaa PDF-dokumentteja;
ei edellytä Adobe Readerin tai muun PDF-lukijaohjelmiston asentamista;
 tarjoaa .NET- ja ActiveX-rajapinnat;
 tehty 100% onnistuneella C # -koodilla.
    

Uutta tässä julkaisussa:

Versio 9.0.0.3079: Lisäsisällön suodattaminen fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.

Uutta versiossa 8.7.0.2980:

Lisätyn sisällön suodatus fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.

Uutta versiossa 8.6.0.2911:

Lisätyn sisällön suodatus fontin nimen, kirjasimen koon ja värin mukaan.
Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot tessdata-kansiosta.
Parannettu tekstinpoisto, rivien ryhmittely taulukkotietoihin, suorituskyky, XFA-lomakkeiden poisto, TableDetector, kiinteät PDF-jäsentämisongelmat.

Uutta versiossa 8.2.0.2699:

Versio 8.2.0.2699 voi sisältää määrittelemättömiä päivityksiä, parannuksia tai virheenkorjauksia.

Uutta versio 8.0.0.2528:

  • Lisäsisällön suodattaminen fontin nimen, kirjasimen koon ja värin mukaan.
  • Päivitetty OCR-moottori uusimpaan versioon. Päivitä kielitiedostot "tessdata" -kansiosta.
  • Parannettu tekstin poisto.
  • Parannetut rivit ryhmitellään taulukkotietoihin.
  • Parannettu suorituskyky.
  • Parannettu XFA-lomakkeiden poisto.
  • Parannettu taulukkotunnistin.
  • Kiinteät PDF-jäsentämisongelmat.
  • Kiinteät JBIG-kuvien dekoodaus.
  • ImageExtractor: kiinteä sivua kohti otettu kuva.
  • MultimediaExtractor: kiinteä kopio upotetulle MPEG-äänelle.
  • TextExtractor: Kiinteä ei-aktiivinen RemoveHyphenation-ominaisuus.
  • Uutta versiossa 7.0.0.2474:

    Versio 7.0.0.2474:

    • lisäsi uuden DocumentPrinter-apuohjelman luokka, joka mahdollistaa PDF-dokumenttien tulostamisen hiljaisesti (ilman käyttäjän valintaikkunoita)
    • lisäsi uuden JSONExtractor-luokan
    • lisäsi ohittaa DocumentSplitter.Split () -menetelmän, jonka avulla voidaan määrittää generoidut tiedostot
    • kiinteä monisäikeinen virhe DocumentSplitter-ohjelmassa
    • tableDetector kunnioittaa nyt SetExtractionArea () -menetelmällä määritettyä uuttoaluetta
    • uudet ominaisuudet uuttamoluokissa: ExtractionColumns - sisältää havaittujen sarakkeiden koordinaatit; CustomExtractionColumns - voit ohittaa sarakkeen tunnistuksen
    • GetPageRect * -menetelmät eivät ottanut sivunkierron huomioon.
      Kiinteä bugi asentimessa, joka aiheutti joitain aiempaan asennukseen liittyviä tiedostoja, häiritsi päivityksiä
    • uudistanut rekisteröinnin tarkistuksen. Nyt kirjasto ei heitä poikkeusta, mutta työskentelee demo-tilassa, jos menetät väärän RegistrationNey- ja RegistrationKey-koodin
    • PDF Multitool: Lisätty viimeisimmän asiakirjaluettelon "Avaa PDF-dokumentti" -painiketta
    • PDF Multitool: Valintaa voidaan muuttaa nyt
    • PDF Multitool: Lisätty JSON-ominaisuuden lisäys
    • PDF Multitool: parannettu taulukkoilmaisimen käyttöliittymä
    • PDF Multitool: huomattavasti parannettu fonttien esittämisen laatu
    • PDF Multitool: Lisätty virheenkorjausvaihtoehto "Näytä havaitut ekstraktio-sarakkeet" kontekstivalikkoon näyttääksesi havaitut sarakkeet nykyisellä sivulla. Näkyy näkyviksi vasta sen jälkeen, kun olet suorittanut uutiskirjeen nykyistä näytettyä sivua vastaan
    • PDF Multitool: Kiinteä fonttien esittämisen ongelma 32-bittisissä Windows-käyttöjärjestelmissä
    • muut vähäiset parannukset ja virheenkorjaukset

    Uutta version 6.30.0.2421:

    Version 6.30.0.2421:

    • Lisätty TextComparer-apuohjelma-luokka (saatavilla vain .NET 4.0-kokoonpanoissa), jonka avulla voidaan verrata tekstiä kahteen PDF-dokumenttiin ja luoda raportti.
    • Parannettu ICC-väriprofiilien tuki.
    • Sulautettujen kirjasimien liittäminen.
    • Parannettu liiteExtractor.
    • Kiinteä XMLExtractor.SaveXMLToStream () -menetelmä.
    • Kiinteä kopioitu tekstinkopiointi käytettäessä OCRCacheMode.WholePage-vaihtoehtoa.
    • Muut virheenkorjaukset ja parannukset.

    Uutta versiossa 6.20.2354:

    Versio 6.20.2354:

    • PDF Tekstiin, PDF-tiedostoon CSV, PDF XML-toimintoihin parannettu
    • Uutta uutistoimintoa, Audio-esimerkkien poisto
    • CSV- ja XML-poistoimijat paranivat taulukot, joissa on tyhjiä sarakkeita
    • uusi MultimediaExtractor video- ja äänitiedostojen poistamiseen PDF-tiedostoista
    • uusi ominaisuus PageDataCaching
    • uusi "MemoryCareProcessingOfHugeFiles" esimerkki
    • kiinteä nolla poikkeus yrittäessäsi luovuttaa jo luovutettuja sivuja
    • XLSExtractor: parantaa fonttien tukea
    • SkipInvisibleText ohittaa leikattua tekstiä (joka ei ole näkyvissä)
    • tekstin tulosteiden esitys paranee
    • XFDF Extractor: lisätään tukea valintaruuduille
    • Kuvatuotos parani tukemaan useampia alimuotoja
    • Unicode-tekstinkäsittely parani

    Uutta versio 6.11.2149:

    Versio 6.11.2149:

    • Eräajankäsittelynäytteet päivittyvät osoittamaan Reset () -menetelmän käyttöä
    • C ++-lähdekoodin näyte lisätään Pages Extraction -ohjelmaan
    • DocumentMerger lisää Merge2 (inputfile1, inputfile2, outputfile) -menetelmän yhdistämään 2 tiedostoa
    • XLS Extractor pienet bugikorjaukset
    • PDF Multitool mahdollistaa nyt tekstin, kuvan, vektorin kerrosten ottamisen / poistamisen käytöstä, lisää tekstiasetusten lisäasetuksia
    • XML, CSV, taulukon poistaminen parantaa taulukkojen tukemista emtpry-solujen sisällä sarakkeissa
    • .ExtractShadowLikeText-ominaisuus parantunut: paremman suodatuksen varjotyyppiseen tekstiin

    Uutta versio 6.10.2136:

    Versio 6.10.2136:

    • PDF XML: ään, PDF: hen CSV: lle, PDF: lle Tekstitoiminto parani
    • PDF-tiedoston XLS-komentorivin lisäys (vbscriptin perusteella)
    • PDF HTML SDK: ssa lisää uuden .DetectHyperLinks-ominaisuuden (TRUE oletusarvoisesti) automaattisten linkkien havaitsemiseen tekstissä
    • uusi SearchablePDFMaker (saatavilla PRO-lisensseille) PDF muuntamiseen PDF-tiedostoiksi
    • uusia ominaisuuksia liesituulettimissa: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders CFG-tiedostoissa
    • otsikon sarakkeiden havaitseminen (kun AutoAlighHeaderToColumns = true) parannettu
    • .DetectLinesInsteadOfParagraphs korvataan uudella .LineGroupingMode-menetelmällä, jolla hallitaan, miten rivit sulautuvat kappaleisiin
    • TÄRKEÄÄ! PDF-tiedostoon XML korjaa pitkäaikaisen virhekoodin tekstikohteiden Y-koordinaatilla (osoitti vasemmalle vasemmalle vasemmalta ylhäällä)
    • .TableXMinIntersectionRequiredInPercents ja .TableYMinIntersectionRequiredInPercents ominaisuudet lisätty
    • Lisättiin C + + lähdekoodin näyte
    • XML Extractor korjaa puuttuvat tyhjät sarakkeet PreserveFormatting = true-tilassa
    • pienet korjaukset väreissä joissakin PDF-tiedostoissa
    • tuki useille tekstintunnistuskoodille lisättyjä kieliä
    • PDF Multitool GUI: Lisää Kopioi Leikepöydälle -painikkeeksi TXT-, CSV-, XML- ja rasterisoitinvalintaikkunat
    • XLSExtractor: lisää PageToWorksheet -ominaisuuden ottamaan käyttöön / poistamaan käytöstä erilliset laskentataulukot sivua kohti
    • uusi .TextEncodingCodePage-ominaisuus
    • PDFViewerControl: lisää ValidateContextMenu-ohjelman, jonka avulla käyttäjä voi lisätä mukautettuja kohteita kontekstivalikkoon
    • PDF Viewer -ohjaus: lisää ominaisuuksia ShowTextObjects, ShowImageObjects, ShowVectorObjects
    • XMLExtractor lisää nyt tunnistetun tekstin "OCRConfidence" -määritteen
    • PDF / A-tarkastustoiminto (beta)
    • Parannetaan valvontaa ja tekstin tarkistamista ja yhdenmukaistamista alkuperäisen asettelun mukaisesti. Kysymys johtui Y-koordinaattien siirtämisestä hallintalaitteissa jäsentämisen aikana: se oli väärä. Oikea tapa on shif ...
    • XML Extractor päivitetty: nyt tuottaa CONTROL-tunnistetta valintaruuduille ja tekstikentille
    • muutettiin nykyisen hakemiston avulla temp-hakemistoon
    • valintaruutuja, radiolaatikoita, muokkauslaatikoita, yhdistelmäobotteja tuetaan paremmin
    • antaa nyt osittaisia ​​luottamussoittoja

    Uutta versiossa 5.80.1781:

    Versio 5.80.1781:

    • PDF XML: ään, PDF: stä CSV: ään, PDF: stä tekstitoimintoihin päivitetty
    • OCRMode tarjoaa nyt 9 tilaa
    • .DetectLineInsteadOfParagraph nyt toimii paljon paremmin. Aseta se vääriksi kaapata monilinjaiset tekstit taulukon soluihin!
    • PDF-hallintatuki parani
    • FDF- ja XFDF-tietojen poisto

    Uutta versiossa 5.10.1747:

    Versio 5.10.1747:

    • PDF XML: ään, PDF: stä CSV: ään, PDF: n tekstitoimintoihin parannettu
    • tukee tekstinpoistoa tekstinhallinnasta
    • XML-erotin lisää fonttityyliä, kokoa, nimeä ja tekstikoordinaatteja tunnisteiksi
    • Lisätty ASP.NET näyte OCR-käytölle
    • uusi ominaisuus OCRLanguageDataFolder määrittää "tessdata" -kansion sijainnin
    • parannettu PDF-tiedostojen tuki
    • parantaa käännetyn tekstin tukea
    • päivitetyt lähdekoodinäytteet
    • päivitetty dokumentaatio
    • pienet parannukset ja korjaukset

    Uutta versiossa 5.00.1626:

    Versio 5.00.1626:

    • OCR (tekstistä kuvista) -toiminto lisätty: nyt voit poimia tekstiä upotetuista kuvista ja korjata vioittuneen tekstin
    • Kiinteä CSV- ja XML-poistoilmoitus puuttuu viimeisistä sarakkeista joidenkin asetusten kanssa
    • Parannettu tuki vahingoittuneille PDF-tiedostoille
    • Useita tekstinsyöttöhakemistoja on nyt tuettu
    • voi nyt etsiä tekstiä yhdysmerkeillä ja eri riveillä: katso uusi lähdekoodin näyte Etsi teksti kahtena
    • uusi ominaisuus .RTLTextAutoDetectionEnabled (oletuksena vääriä) autojen havaitsemiseen RTL-kielillä
    • PDF-katseluohjelman käyttöliittymä on parantunut
    • pienet parannukset ja korjaukset

      Vaatimukset :

      Vähimmäisvaatimukset strong>:

      Nag-näyttö, vesileima lähtöön

    Tuetut käyttöjärjestelmät

    Vastaavia ohjelmistoja

    Muu ohjelmistojen kehittäjä ByteScout

    My RSS Toolbar
    My RSS Toolbar

    25 Oct 15

    Post2Blog
    Post2Blog

    28 Apr 18

    Kommentit ByteScout PDF Extractor SDK

    Kommentteja ei löytynyt
    Lisää kommentti
    Ota kuvia!