ASPseek

Software kuvakaappaus:
ASPseek
Ohjelmiston tiedot:
Versio: 1.2.10
Lähetyksen päivämäärä: 3 Jun 15
Kehittäjä: SWsoft
Lupa: Vapaa
Suosio: 4

Rating: nan/5 (Total Votes: 0)

ASPseek on Internet-hakukonetta kehittämän ohjelmiston SWsoft ja lisensoitu vapaana ohjelmistona GNU GPL.
ASPseek koostuu indeksointi robotti, hakudemoni, ja CGI haku käyttöliittymää. Se voi indeksoida jopa muutama miljoona URL-osoitteita ja etsiä sanoja ja lauseita, käyttöä yleismerkkejä ja tehdä Boolen haun. Hakutulokset voidaan rajoittaa annettu määräaika, sivuston tai web-tilaa (sarja sivustot) ja lajiteltu soveltuvuuden (PageRank on käytössä) tai päivämäärä.
ASPseek on optimoitu useita sivustoja (kierteitettyjä index, async DNS-hakuja, ryhmittely tulokset sivuston, Web tiloja), mutta voi käyttää etsimiseen yhdessä paikassa samoin. ASPseek voi työskennellä useita kieliä / encodings kerralla (mukaan lukien multibyte koodauksia kuten kiina) johtuen Unicode tallennustilassa. Muita ominaisuuksia ovat ohitettujen sanojen ja ispell tukea, charset ja kielen arvailija, HTML-malleja hakutuloksissa, otteita, ja kysely sanoja korostamalla.
ASPseek on kirjoitettu C ++ käyttää STL kirjasto ja käyttää sekoitus SQL-tietokannan ja binaaritiedostoja varastointiin.
Tässä muutamia keskeisiä piirteitä "ASPseek":
Kyky indeksiin ja haku useiden miljoonien asiakirjojen
 
· Käyttämällä ASPseek, voit rakentaa tietokanta ja etsiä monia sivustoja, ja tulokset Kunkin kyselyn palautetaan nopeasti, vaikka sinulla on muutama miljoonia asiakirjoja indeksoitu. Tietenkin tämä riippuu laitteiston, joten älä odota "vanha kunnon" i486 kone käsittelemään jokaisen sivuston Com domain. Kaikki riippuu CPU (s), muistin, levyn nopeus jne Joten älä oma testit ennen kuin ostat erityisen laitteiston.
 
· Se, että ASPseek on optimoitu korkeita määriä ei pitäisi estää sinua käyttämästä sitä etsiä oman sivuston, joka sisältää muutamia satoja asiakirjoja - se toimii myös siellä.
 
Erittäin hyvä osuvuutta tuloksia
 
· Tavoitteena hakukone on löytää mitä käyttäjä haluaa. Ei voi olla tuhansia löytyneiden URL seurauksena hakuun, mutta se voi kaiken olla merkityksetön, joten käyttäjä on tyytymätön.
 
· Tuotanto tulokset ASPseek on lajiteltu osuvuutta (tai sijoitus), mutta sijoitus laskelma ei ole helppo tehtävä. Kehittäjät yrittivät parhaansa sisällyttää suurimmat ja uusimmat tekniikat otetaan ASPseek moottoriin säilyttäen hyvä hakunopeus.
 
Ispell tuki
 
· Kun ASPseek käytetään ispell tuella, searchd (1) voi mahdollisesti löytää kaikenlaista kaikille määritellyt sanat (esimerkki: luoda -> create tai laadittu tai luo). Joten, sen avulla voit löytää sanan kaikissa eri muodoissa.
 
Unicode tallennustila
 
· ASPseek voi tallentaa tietoja asiakirjoista Unicode, jolloin voidaan toteuttaa monikielinen hakukone. Joten, voit indeksoida ja etsiä tiedostoja Englanti, Venäjä ja myös kiinaksi, kaikki yhdessä tietokannassa.
 
HTTP, HTTPS, HTTP välityspalvelin, FTP (via proxy) protokollien
 
· Koska ASPseek on hakukoneen, se käyttää HTTP-protokollaa index sivustoja. ASPseek myös tukee suojattua https: // protokollan. FTP-protokollaa ei tueta suoraan, mutta voit käyttää välityspalvelinta (kuten kalmari) ja index FTP sivustojen kautta välityspalvelimen.
 
· ASPseek tukee "perus lupa" ominaisuus HTTP joten voit indeksoida salasanalla suojattuja alueita (esim yksityisiä tietoja intranetissä).
 
Text / html ja text / plain asiakirjatyypit tuki
 
· ASPseek voi ymmärtää asiakirjoja kirjoitettu HTML, ja teksti asiakirjoja. Nämä ovat suosituimpia tiedostomuotoja Internetissä.
 
· Muut formaatit, kuten PDF, RTF, jne, voidaan tukea apua mitään ulkoista ohjelmaa / skripti, joka pystyy muuntamaan että formaatteja HTML-tai tekstimuodossa.
 
Monisäikeinen suunnittelu, async DNS resolveri jne
 
· ASPseek käyttää POSIX viestiketjut, se tarkoittaa, että yksi prosessi on paljon säikeitä käynnissä rinnakkain. Joten indeksi ladattavia asiakirjoja monia sivustoja, ja etsintä daemon prosesseja monet hakukyselyt samanaikaisesti. Tämä ei ole ainoastaan ​​auttaa ASPseek mittakaavassa hyvin SMP (monisuoritinjärjestelmässä) järjestelmiä, mutta myös parantaa indeksoinnin nopeus, koska kyseessä on yksi kierre eniten aikaa tullaan käyttämään odottaa tietoja verkosta.
 
· Yksi asia, että hidas indeksointi alas paljon on DNS-haku (prosessi, jossa määritellään IP-osoitteen avulla palvelimen nimi). Viiveiden välttämiseksi, asynkroninen haut (haku tapahtuu erillisellä omistettu prosessit) ja IP-osoite välimuisti on toteutettu.
 
Ohitettujen sanojen
 
· Ohitettujen sanojen ovat sanoja, joilla ei ole merkitystä itse. Esimerkkejä: on, ovat, kello, tämä. Etsiminen at on hyödytön, joten tällaiset sanat jätetään hakulauseke. Ohitettujen sanojen eivät myöskään kuulu tietokannasta indeksoinnin aikana, joten tietokanta pienenee ja nopeammin.
 
· Ei ole mitään "sisäänrakennettu" ohitettujen sanojen in ASPseek, ne ladataan käynnistyksen aikana tiedostoista. Monet stopword tiedostoja eri kielille tulee ASPseek.
 
Charset guesse
 
· Jotkin rikki tai virheellisesti palvelimet eivät kerro asiakkailleen charset, jossa ne tarjoavat sisältöä. Jos olet indeksointi tällaisia ​​palvelimia, tai käyttämällä ASPseek indeksoida ftp-palvelimia (FTP-protokolla ei tiedä mitään merkistöjä), charset arvailija voidaan käsitellä sitä. Charset arvailija käyttää sanaa taajuus taulukot (kutsutaan langmaps) määrittää oikean charset.
 
Robot syrjäytymisen standardi (robots.txt) tuki
 
· ASPseek tukee täysin tätä standardia. Se on tarkoitettu web-sivuston kirjoittajat kertoa robotin (esimerkiksi ASPseek indeksi (1)) ohittaa indeksointi joitakin hakemistoja sivustoissa.
 
· Lisätietoja http://www.robotstxt.org/wc/robots.html
 
Asetukset hallita verkon kaistanleveyttä ja web-palvelimet kuorman
 
· Voit tarkasti valvoa verkon kaistanleveyttä, että indeksi (1) käyttää. Täsmälleen, voit rajoittaa kaistanleveyden (ilmaistaan ​​tavua sekunnissa), jota indeksi (1) ja annettava aikaa-of-day. Esimerkiksi, voit rajata kaistanleveyden työaikana niin ihmiset omaan toimistoon ei hidasta Internet.
 
· Voit myös asettaa minimiaika kahden kyselyitä samaan Web-palvelin, joten se ei saa kuormittaa, ja sai alas polvilleen, kun suoritat indeksi (1).
 
Reaaliaikainen asynkroninen indeksointi
 
· Jotkut hakukoneet edellyttää etsintä tulisi lopettaa ajaksi tietokannan päivityksen. ASPseek ei tarvitse sitä, niin voit etsiä non-stop.
 
· Lisää sanoa, on erityinen tila indeksointi kutsutaan "reaaliaikaisia" indeksointi. Voit käyttää sitä pieni määrä asiakirjoja, ja jos tällainen asiakirja on ladattu ja jalostetaan, muutokset näkyvät heti etsimään käyttöliittymän. Tämä ominaisuus on suuri apu, jos olet rakennuksen hakukoneen sivuja nopeasti muuttuvaan sisältöön, kuten online-uutisten jne
 
· Huomaa, että asiakirjojen määrä on "reaaliajassa" tietokanta on rajallinen. Se on noin 1000 meidän laitteiston (mittarilukema voi vaihdella), ja enemmän asiakirjoja sinulla on "reaaliajassa" tietokanta, hitaampi on nopeus indeksoinnin tuohon (ja ainoastaan ​​se) tietokantaan. Tämä ei vaikuta hakunopeus kuitenkin.
 
· Asiakirjat "reaaliaikaista" tietokanta siirretään normaaliin tietokantaan jälkeen käynnissä indeksi (1) normaalilla tavalla.
 
Lajittelu tulokset osuvuuden tai päivämäärän
 
· Hakukoneet yleensä palauttaa osuvimmat tulokset ensin. Mutta jos etsit uusimpia sivuja, voit kertoa ASPseek lajitella tulokset viimeisen muutospäivämäärän, joten äskettäin muutettu (tai luotu) sivuja näytetään ensin.
 
Otteita, kyselysanat korostus
· Ote on pala löytyi asiakirjan sanoin etsitään korostettu, vain antaa käsityksen siitä, mitä asiakirjan on noin. Voit muokata useita otteita näyttämällä ja niiden pituus. Jos poistaa käytöstä otteita, alussa asiakirjan tulee näkyviin.
 
· Jokainen löydetty asiakirja on liitettävä "Välimuistissa" -linkkiä. ASPseek pitää paikallinen pakattu kopio jokaisesta asiakirjaa käyttäen, jotta käyttäjä voi nähdä koko asiakirjan (lisävaruste) korostettu sanoja, jotka haettiin, vaikka se on poistettu alkuperäisestä sivustosta (näin tapahtuu joskus).
 
Ryhmittely tuloksia sivuston
 
· Tulokset paikasta voidaan ryhmitellä. Jos ryhmittely sivustoja on vain kaksi tulosta näytetään samasta sivustosta oletuksena, ja käyttäjä voi nähdä muita sivuja samalla paikalla noudattamalla "Lisää tuloksia ..." -linkkiä.
 
Klooneja
 
· Kloonit ovat samoja asiakirjoja eri paikoissa. Ne havaitaan ja ryhmitelty, joten käyttäjä ei esitetty sivun täynnä URL identtisiä velkakirjoja.
 
· Clone havaitseminen on yleensä rajoitettu mm (niin samanlaisia ​​asiakirjoja eri sivustoja ei lasketa klooneja), mutta voit muuttaa tätä recompiling ASPseek kanssa --disable-klooneja-by-site vaihtoehto.
 
Spaces ja osajoukot
 
· Avaruus on joukko sivustoja. Joten, jos haluat antaa haun kaventunut jossain alueella voit luoda tilaa ja etsiä kyseisessä tilassa. Vain koko sivustoja (esim http://www.mysite.com/) saavat olla mukana avaruudessa.
 
· Subsets voidaan myös rajoittaa haun. Voit luoda osajoukko ja laittaa URL naamio (kuten http://www.mysite.com/mydir/%) tuohon, ja sitten rajata haun soveltamisala vain tietyn alijoukon.
 
· Voit rajoittaa haun koskemaan ole vain yksi, vaan useita osajoukoista tai tiloja.
 
HTML-malleja helposti muokata hakutuloksia
 
· Voit muokata hakua sivuja, joten ne näyttävät ja on integroitu saumattomasti sivustosi muusta. Tämä tapahtuu yksinkertaisesti editoida haun mallitiedosto.
Asennus
gzip -DC aspseek-1.2.10.tar.gz | tar xf -
cd aspseek-1.2.10. / määrittäminen
tehdä
su
make install

Muu ohjelmistojen kehittäjä SWsoft

OpenVZ kernel
OpenVZ kernel

2 Jun 15

OpenVZ Live CD
OpenVZ Live CD

2 Jun 15

Plesk for Windows
Plesk for Windows

22 Sep 15

Kommentit ASPseek

Kommentteja ei löytynyt
Lisää kommentti
Ota kuvia!