Apache Parketti on "columnar" tallennus muodossa, joka on perustettu nimenomaan Apache Hadoop perheen projekteja.
Parketti suositellaan käytettäväksi suuria tietomääriä, lähinnä koska se käyttää monimutkaista pakkaa nojautuen sarja optimoitu kirjaa murskaamiseen ja kokoamista algoritmeja.
Tämä mahdollistaa tietojen eriteltyinä, järjestetään sisäkkäisiä muodossa, ja kootaan aina kysellä.
Parketti muotoa voidaan myös käyttää ulkopuolella Hadoop ekosysteemin, on nimenomaan suunniteltu niin agnostikko kuin mahdollista, kanssa tahansa tietojenkäsittelyn puitteissa ja tietojen varastointiin malli.
< strong> uutta strong> tässä julkaisussa:
- Nimeä paketteja ja maven koordinaatit org.apache
- Lisää koodaus tilastotiedoista ColumnMetaData li>
- Streaming säästäväisyys API
- Uusi looginen tyyppejä
Mikä on uusi versiossa 2.3.0:
- Nimeä paketteja ja maven koordinaatit org.apache
- Lisää koodaus tilastotiedoista ColumnMetaData li>
- Streaming säästäväisyys API
- Uusi looginen tyyppejä
rajoitukset
- hanke on vielä kehitteillä Apache Incubator arkistoon ja voi muuttua rajusti versiosta versioon.
Kommentteja ei löytynyt