Apache Solr on Apache Lucene -hankkeeseen perustuva avoin lähdekoodi, ilmainen, foorumiltaan riippumaton ja tehokas hakupalvelin XML / HTTP- ja JSON-sovellusliittymien avulla. Hanke on tällä hetkellä hautossa Apache Software Foundationissa.
Ominaisuudet yhdellä silmäyksellä
Tärkeimpiin ominaisuuksiin kuuluvat hit-korostus, monipuolinen haku, välimuisti, replikointi, web-pohjainen hallintarajapinta, edistyksellinen täysi-tekstin hakuominaisuus, se on optimoitu suuren volyymin verkkoliikenteelle sekä standardeihin perustuvat avoimet rajapinnat kuten HTTP , XML ja JSON.
Lisäksi se sisältää kattavat HTML-hallintarajat, palvelintilastot, automaattisen indeksin replikoinnin, automaattisen palautuksen ja vikaantumisen, lähellä reaaliaikaista indeksointia, joustavaa ja joustavaa XML-kokoonpanolla sekä laajennettava pluginarkkitehtuuri.
Hanke on schemaless, jonka avulla käyttäjä voi nopeasti aloittaa Apache Solr. Sekä skeema- että schemaless-tiloja tuetaan tällä hetkellä, mutta jälkimmäiset johtavat vahvaan tuotantoympäristöön.
Solr tukee erilaisia tyyppejä, kuten kenttätapauksia, joiden avulla voit sekoittaa ja sovittaa Lucene-analysaattorit kirjoittamatta mitään koodia. Lisäksi projekti tukee dynaamisia kenttiä, jotka voidaan ottaa käyttöön lennossa.
Muista mielenkiintoisista ominaisuuksista voidaan mainita kopiointitoiminnot, joiden avulla käyttäjät voivat helposti analysoida samaa sisältöä eri menetelmillä, tukea nimenomaisiin tyyppeihin, jotta voidaan poistaa arkkityyppien arkkitehtävien tarve, ulkoisiin tiedostoihin perustuvat mukautetut kokoonpanot. samoin kuin lukuisia lisätekstin analyysiosia.
Kannen alla ja saatavuus
Kun tarkastelemme Apache Solrin huuvan alla, voimme huomata, että sovellus on kirjoitettu kokonaan Java-ohjelmointikielellä ja tukee Linuxin 32- ja 64-bittisiä jakeluja sekä Microsoft Windows- ja Mac OS X-käyttöjärjestelmissä.
Sovelluksesi on jaettu sekä binääri- että lähdetiedostoiksi, joten voit helposti aloittaa Apache Solr -ohjelman mahdollisimman vähän aikaa ja ilman liikaa vaivaa.
Mikä on uusi tässä versiossa
- Valvoja ei voi koskaan käsitellä joitain viestejä.
- Nimeä ydin solr-itsenäiseen tilaan ei ole.
- QueryComponentin rq-parametrien jäsentäminen ei enää käsitä defType-parametria.
- Korjaa NPE SolrQueryParserissa, kun suodatuslausekkeen sisältämät kyselylausekkeet vähenevät.
Uutta strong> versiona:
- Turvallisuuskehyksen monet muut parannukset sisältävät Solr-järjestelmään myös AuthenticationPlugin, joka toteuttaa HTTP Basic Auth -todennuksen, joka tallentaa oikeudet ZooKeeperissä. Tämä on yksinkertainen tapa vaatia käyttäjätunnusta ja salasanaa kenelle tahansa, joka käyttää Solrin hallintaruutua tai sovellusliittymiä.
- Rakennettu AuthorizationPlugin, joka tarjoaa hienorakeista valvontaa ACL: ien käyttämisestä eri resursseille, joiden permissiosäännöt on tallennettu ZooKeeperiin.
- JSON Facet -sovellusliittymä voi nyt muuttaa osa-alueiden komentoja, lähinnä lohkon liittymistä ja siirtymistä vanhemmilta lapsille tai lapsille vanhemmille ennen kuin laskee sivutiedot.
- Uuden Facet-moduulin / JSON Facet API: n tärkeimmät parannukset.
- Query- ja Range Facets -vaihtoehtoja pivot-puolien alla. Aivan kuten JSON Facet API, pivot-puolet voivat kiinnittää muita sivutyyppejä, kuten alue- ja kyselysivuja.
- Tykkää tätä kyselyn jäsentimen asetuksia. MoreLikeTämä QParser tukee kaikkia MLT Handlerin tarjoamia vaihtoehtoja. Kyselyn jäsennin on paljon monipuolisempi kuin käsittelijä, koska se toimii pilvi-tilassa ja missä tahansa normaalin kyselyn voi määrittää.
- Lisätty Schem API-tuki SolrJ: ssä
- Lisätty pisteytysmoodi kysely-ajan liittymiseen ja estämiseen.
- Lisätty hymyn vastausmuoto
Uutta strong> versio 4.10.3:
- Solr 4.10.2 sisältää 10 virheenkorjausta sekä Lucene 4.10.2 ja sen 2 korjausta.
Uutta strong> versio 4.6.1:
- Apache Tika 1.4
- Carrot2 3.8.0
- Velocity 1.7 ja Velocity Tools 2.0
- Apache UIMA 2.3.1
- Apache ZooKeeper 3.4.5
- Virheiden korjaukset:
- SOLR-5408: CollapsingQParserPlugin tulokset väärin, kun käytetään useampaa lajittelukriteeriä
- (Brandon Chapman, Joel Bernstein)
- SOLR-5416: CollapsingQParserPlugin breaks Tag / Exclude Faceting
- (David Boychuck, Joel Bernstein)
- SOLR-5442: Python asiakas ei voi jäsentää proxied-vastausta, kun Tomcat palvelee.
- (Patrick Hunt, Gregory Chanan, Vamsee Yarlagadda, Romain Rigaux, Mark Miller)
- SOLR-5445: Proxied-vastausten pitäisi levittää kaikkia otsakkeita sen sijaan, että ne olisivat ensimmäiset kullekin avaimelle.
- (Patrick Hunt, Mark Miller)
- SOLR-5479: SolrCmdDistributor yrittää uudelleen logiikkaa, jos pyynnön johtajaa ei löydy 1 sekunnissa.
- (Mark Miller)
- SOLR-5532: SolrJ Content-Type -validointi on liian tiukka joillekin verkkosisäkkäille / proxeille.
- (Jakob Furrer, hossman, Shawn Heisey, Uwe Schindler ja Mark Miller)
- SOLR-5547: Kokoelman aliaksen luominen käyttäen SolrJ: n CollectionAdminRequest asettaa aliaksen nimen ja kokoelmat aliasiksi samaan arvoon.
- (Aaron Schram, Mark Miller)
- SOLR-5577: Todennäköisesti ZooKeeper-ohjelman voimassaolon päättyminen ei saisi hidastaa päivityksiä tietyn summan sijaan vaan katkaisee päivitykset tietyn ajan kuluttua.
- (Mark Miller, Christine Poerschke, Ramkumar Aiyengar)
- SOLR-5580: NPE, kun luodaan ydin sekä eksplisiittisesti että ydinNodeName.
- (YouPeng Yang, Mark Miller)
- SOLR-5552: Leader-palautusprosessi voi valita väärän johtajan, jos kaikki kopiot kopioidaan alas ja yrittävät toipua sekä menettää päivityksiä, jotka olisi pitänyt palauttaa.
- (Timothy Potter, Mark Miller)
- SOLR-5569 Kopion ei pitäisi yrittää palauttaa johtajalta, ennen kuin se on ilmoittanut, että se on ACTIVE.
- (Mark Miller)
- SOLR-5568 SolrCore ei voi päättää olla johtava vain koska klusterin tila sanoo, että muut SolrCoren aktiviteetit eivät ole aktiivisia.
- (Mark Miller)
- SOLR-5496: Meidän pitäisi jakaa HTTP-yhteyshenkilön haun HttpClienttien kautta ja varmistaa, että kaikki http-yhteyshenkilöt saavat sammutuksen.
- (Mark Miller)
- SOLR-5583: ConcurrentUpdateSolrServer # blockUntilFinished voi odottaa ikuisesti, jos executor-palvelu on sammutettu.
- (Mark Miller)
- SOLR-5586: Kaikki ZkCmdExecutorin pitäisi alustaa zk-asiakkaan aikakatkaisulla.
- (Mark Miller)
- SOLR-5587: ElectionContext-toteutusten tulisi käyttää ZkCmdExecutor # ensureExists -palveluja varmistaakseen, että heidän vaalipolut ovat oikein luotuja.
- (Mark Miller)
- SOLR-5540: HdfsLockFactory-toiminnon pitäisi luoda nimenomaan lukko-vanhemman hakemisto.
- (Mark Miller)
- SOLR-4709: Replikoinnin ydin uudelleenlataus, jos config-tiedostot ovat muuttuneet, voi epäonnistua kilpailutilan vuoksi. (Mark Miller, Hossman))
- SOLR-5503: Yritä eteenpäin johtajalle pyyntöjä vähemmän aggressiivisesti - eikä IOException ja status 500, ConnectException.
- (Mark Miller)
- SOLR-5588: PeerSync ei laske kaikkia yhteysvirheitä menestyksekkäästi.
- (Mark Miller)
- SOLR-5564: hl.maxAlternateFieldLength olisi sovellettava alkuperäiseen kenttään, kun takaisinkutsua yritetään
- (janhoy)
- SOLR-5608: Älä anna Suljettu SolrCore julkaista tilaa ZooKeeperille.
- (Mark Miller, Shawn Heisey)
- SOLR-5615: Pysäytysluku yritettäessä palauttaa ZK-istunnon päättymisen jälkeen.
- (Ramkumar Aiyengar, Mark Miller)
- SOLR-5543: Core swapit toivat solr.xml: n kaksoiskappaleet, kun käytettiin solr.xml pysyvyyttä.
- (Bill Bell, Alan Woodward)
- SOLR-5618: Korjaa väärien välimuistien osumia queryResultCachessa, kun hash-koodit ovat yhtä suuria ja kaksoiskappaleita on olemassa yhdessä pyynnöstä
- (hossman)
- SOLR-4260: ConcurrentUpdateSolrServer # blockUntilFinished voi palata ennen kuin kaikki aiemmin lisätyt päivitykset ovat päättyneet. Tämä voi aiheuttaa kopioille tarkoitetun hajautetun päivityksen kadonneen.
- (Markus Jelsma, Timothy Potter, Joel Bernstein ja Mark Miller)
- SOLR-5645: CoreContainerilla uudelleen käynnistettävä SolrCore yrittää rekisteröidä zk uudella SolrCorella.
- (Mark Miller)
- SOLR-5636: SolrRequestParsers tekee joitain xpath-hakuja jokaisesta pyynnöstä, mikä voi aiheuttaa samanaikaisia ongelmia.
- (Mark Miller)
- SOLR-5658: commitWithin ja päällekirjoitusta ei lähetetä jäljennöksiin nyt, kun SolrCloud käyttää javabinia päivitysten jakamiseen.
- (Mark Miller, Varun Thacker, Elodie Sannier, shalin)
- Optimoinnit:
- SOLR-5576: Paranna rohkeutta rekisteröityessäsi ja odottaessasi kaikkia SolrCoren rekisteröityä DOWN-tilaan.
- (Christine Poerschke Mark Millerin kautta)
Uutta strong> versio 4.6.0:
- Monet parannukset ja parannukset shard-jakamisasetuksiin
- New AnalyzingInfixLookupFactory hyödyntää AnalyzingInfixSuggester
- New CollapsingQParserPlugin korkean suorituskyvyn kentän romahtamiseen korkeilla kardinaliteettialueilla
- Uudet SolrJ-sovellusliittymät keräilyn hallintaan
- Uusi DocBasedVersionConstraintsProcessorFactory, joka tukee käyttäjän määrittämiä asiakaskeskeisiä versionisointisääntöjä
- Uusi oletusindeksimuoto: Lucene46Codec
- Uusi EnumField-tyyppi
Uutta strong> versio 4.5.1:
- Solr 4.5.1 sisältää kourallisen virheenkorjauksia, joista kaksi on melko vaikeita.
Uutta strong> versio 4.5.0:
- Mukautettu varjostustuki, parannettu reititys ja monisäikeinen sivuprojekti.
Uutta strong> versio 4.2.0:
- Skeeman lukema REST API. Aina halusi tarkastella kaavaa http: n kautta? Nyt voit. Näyttää siltä, että kirjoituspuoli tulee seuraavaksi.
- DocValues on integroitu Solr. DocValues voidaan ladata paljon nopeammin kuin kentän välimuisti, ja se voi myös käyttää erilaisia puristusalgoritmeja sekä RAM-muistissa tai levyn esitysmuodoissa. Haun, lajittelu- ja funktiokyselyiden kaikki hyötyvät. Entä OS-käsittely käsittelevät ja lajittelevat välimuistit pois kasasta? Ei enää virittämistä 60 gigatavua kasoista? Entäsokas uusi segmentti DocValues-sivutekniikka? Parempi numeerinen kasvottaminen? Makea.
- Kokoelman aliasoittaminen. Onko aikapohjaisia tietoja? Haluatko uudelleenindeksoida väliaikaisen kokoelman ja vaihtaa sen sitten tuotantoon? Tehty. Pysy kuulolla Shard Aliasingille.
- Kerää sovellusliittymän vastaukset. Kokoelmat API oli edelleen hyvin uusi 4,0, ja vaikka se parani melko vähän 4.1, vastaukset oli varmasti tarpeen, mutta jäi leikkaus pois. Alun perin teimme päätöksen tehdä Collection API -verkosta erittäin vikasietoinen, mikä teki vastaukset kovempaan. Kukaan ei halua metsästää lokitiedostoja nähdäkseen, miten asiat ovat tulleet. Tehty 4.2 kohdassa.
- Yhteistyö minkä tahansa kokoelman minkä tahansa solmun kanssa. Tähän saakka 4.2 asti voit olla vuorovaikutuksessa klusterin solmun kanssa, jos se isännöi vähintään yhden kopion, jonka kokoelma halusi kysyä / päivittää. Enää enää - kysy mitä tahansa solmua, onko se palan aiotusta kokoelmastasi vai ei ja saa proxied-vastauksen.
- Salli mukautetut shardsnimet niin, että uudet isäntäosoitteet voivat ottaa haltuunsa leikkaukset. Amazonin työskentely ilman elastisia ips? Tämä on sinua varten.
- Lucene 4.2 -optimoinnit, kuten pakatut aikavälit vektorit.
Uutta strong> versiossa 3.3.0:
- Ryhmittely / kentän romahtaminen
- Uusi, automatiikkaan perustuva ehdotus- / automaattinen täydennysversio, joka tarjoaa suuruusluokkaa pienempää RAM-kulutusta.
- KStemFilterFactory, optimaalinen toteutus vähemmän aggressiiviselle stemmerille englanniksi.
- Solr oletusarvoisesti uusi, tehokkaampi yhdistämispolitiikka (TieredMergePolicy). Katso lisätietoja osoitteesta http://s.apache.org/merging.
- Tärkeät korjaukset, mukaan lukien äärimmäisen korkea RAM-käyttö oikeinkirjoituksen tarkistamisessa.
- Bugikorjaukset ja parannukset Apache Lucene 3.3: sta li>
Uutta strong> versio 3.2.0:
- Mahdollisuus määrittää ylivaraus ja commitWithin pyyntöparametreiksi käytettäessä JSON-päivitysmuotoa
- TermQParserPlugin, hyödyllinen tuotettaessa suodatuskyselyitä kenttäsovelluksesta tai termejä edustavista komponenteista.
- DebugComponent tukee nyt NamedListin käyttöä Explanation.toStringin sijasta mallin Explanation-objekteissa sen vastauksissa.
- Parannukset UIMA- ja Carrot2-integrointiin
- Bugikorjaukset ja parannukset Apache Lucene 3.2: sta li>
Uutta strong> versio 3.2.0:
- JSON-päivitysparannukset tehtiin.
- Hakutulosten ryhmittely ja UIMA-integraatio parantuivat.
- Vikojen korjaus.
Kommentteja ei löytynyt