Avantajele și dezavantajele bazelor de date pe coloană
Publicat: 2022-11-19Bazele de date NoSQL sunt o alegere excelentă pentru multe aplicații moderne, dar există câteva lucruri cheie de luat în considerare înainte de a face schimbarea. Un factor important este dacă aveți nevoie sau nu de o bază de date relațională. Dacă o faceți, este posibil ca o bază de date în coloană să nu fie alegerea potrivită. Bazele de date pe coloană sunt potrivite pentru aplicațiile care trebuie să analizeze rapid cantități mari de date. De asemenea, sunt o alegere bună pentru aplicațiile care nu au nevoie de modelul relațional complet și se pot descurca cu un model de date mai simplu. Cu toate acestea, bazele de date cu coloane au câteva dezavantaje. Pot fi mai dificil de utilizat decât bazele de date relaționale și este posibil să nu accepte toate caracteristicile de care aveți nevoie. Înainte de a decide dacă o bază de date în coloană este potrivită pentru aplicația dvs., asigurați-vă că înțelegeți avantajele și dezavantajele.
O bază de date cu coloane organizează și stochează datele pe coloane, mai degrabă decât pe rânduri. Ei folosesc funcții și operațiuni agregate pentru a optimiza coloanele de date. Coloanele bazei de date sunt scalabile și se comprimă bine în comparație cu alte tipuri de baze de date. Într-o bază de date cu coloane, fiecare rând de date este separat în mai multe coloane printr-un număr de coloane. Bazele de date pe coloană sunt potrivite pentru procesarea datelor mari, business intelligence (BI) și analiză. Operațiile pe rânduri au un timp mult mai lent decât operațiunile pe coloană. Înregistrările IoT pot conține doar un număr mic de elemente de date, deoarece înregistrările noi ajung într-un flux consistent. Big Data are potențialul de a transforma modul în care funcționează sistemele operaționale de baze de date.
Cele două tipuri de baze de date de baze de date, rând și coloane, pot încărca date și pot efectua interogări folosind limbaje tradiționale de interogare a bazelor de date, cum ar fi SQL. În multe cazuri, coloana vertebrală a bazelor de date, cum ar fi bazele de date pe rând și coloane, pot servi drept motor pentru extragerea, transformarea, încărcarea și crearea de instrumente comune a datelor.
O bază de date în coloană, un tip de sistem de gestionare a bazelor de date (DBMS), este una care stochează date în coloane, mai degrabă decât în rânduri. Pentru a accelera returnarea unei interogări, coloanele dintr-o bază de date în coloană pot fi scrise și citite eficient de pe și pe hard disk.
Astăzi, ne vom uita la modul în care funcționează coloanele într-o bază de date în coloană și le vom compara cu o bază de date mai tradițională orientată pe rând (de exemplu, MySQL). Vom trece peste ce este o bază de date în coloană în acest articol, precum și avantajele și dezavantajele acesteia.
Care sunt câteva exemple de bază de date NoSQL? Microsoft SQL Server este un sistem de gestionare a bazelor de date relaționale creat de Microsoft.
Mongodb este o bază de date pe coloană?
Mongodb nu este o bază de date coloană.
Devine din ce în ce mai popular, deoarece oferă performanțe îmbunătățite ale interogărilor în interogările analitice. Datele din bazele de date coloane sunt stocate într-un mod mai eficient decât în depozitele de date bazate pe baze de date, deoarece datele sunt stocate în coloane. Interogările analitice efectuate pe baze de date columnare au un avantaj de performanță mai mare. În comparație cu stocarea orientată pe rând, stocarea în coloană este mult mai eficientă în ceea ce privește spațiul de stocare și performanța interogărilor. Deoarece datele sunt stocate în coloană, datele pot fi citite și scrise mai ușor.
Care sunt bazele de date Nosql?
Bazele de date NoSQL sunt baze de date care nu folosesc modelul tradițional de baze de date relaționale. În schimb, folosesc o varietate de modele diferite, inclusiv document, grafic, cheie-valoare și coloane. Bazele de date NoSQL sunt adesea mai potrivite pentru a gestiona cantități mari de date care nu sunt potrivite pentru modelul relațional.
Un sistem NoSQL este un tip de bază de date care nu se bazează pe SQL. Modelul de date utilizat de echipa de modelare a datelor diferă de modelul tradițional de tabel cu rânduri și coloane utilizat în sistemele de management al bazelor de date relaționale. Bazele de date NoSQL, pe lângă faptul că sunt destul de diferite unele de altele, sunt, de asemenea, destul de diferite unele de altele. Bazele de date de documente sunt de obicei implementate cu o arhitectură de scalare pentru cele mai comune tipuri de documente. Platformele de comerț electronic, platformele de tranzacționare și dezvoltarea de aplicații mobile sunt toate exemple ale modului în care aceste platforme pot beneficia o companie. Scopul principal al comparării MongoDB și Postgres este de a oferi o comparație detaliată a principalelor baze de date NoSQL. Capacitatea unei baze de date în coloană de a agrega valoarea unei singure coloane este ideală pentru analiza rapidă a unei anumite coloane.
Deoarece modul în care sunt scrise datele face dificilă consecvența, acestea trebuie să se bazeze pe o varietate de surse. Bazele de date grafice sunt optimizate pentru captarea și căutarea conexiunilor dintre elementele de date pentru a le captura și a căuta. Overheadul asociat cu ALĂTURAREA mai multor tabele în SQL este eliminat cu utilizarea acestor metode.
MongoDB stochează de obicei documente într-o colecție cunoscută sub numele de colecție. Este o colecție de documente care sunt legate între ele printr-un anumit aspect. Datele din colecții sunt utilizate de obicei de mai multe aplicații pentru a stoca date.
Datele MongoDB sunt stocate într-un arbore B, ceea ce înseamnă că sunt organizate ca găleată sau nivel. O găleată este o colecție de date care este accesată frecvent de un browser. Nivelul este mai mare pentru că există mai multe găleți în el. Datele din aB-tree pot fi sortate în ordine crescătoare după cheie.
Deoarece MongoDB este atât de simplu de scalat, este o platformă fantastică pentru scalare. Dacă clusterul dumneavoastră înregistrează o creștere a încărcării, poate fi necesar să adăugați mai multe servere. În plus, MongoDB poate fi grupat pentru a furniza date HA (disponibilitate ridicată).
De ce bazele de date Nosql câștigă popularitate
În ciuda faptului că bazele de date NoSQL devin din ce în ce mai populare în multe cazuri, acestea sunt încă o alternativă la bazele de date relaționale. Datele care nu pot fi stocate într-o bază de date relațională, cum ar fi graficele mari sau datele care se modifică în mod regulat, sunt deosebit de atrăgătoare pentru ei.
Exemplu de bază de date pe coloană Nosql
O bază de date coloană este un sistem de gestionare a bazelor de date (DBMS) care stochează date în coloane în loc de rânduri. Sistemele orientate pe coloane sunt adesea mai rapide pentru sarcinile de lucru de analiză decât sistemele tradiționale orientate pe rând.
De exemplu, o bază de date în coloană ar putea stoca date despre angajați, fiecare coloană care conține date precum ID-ul angajatului, numele, titlul postului, salariul și așa mai departe. O bază de date orientată pe rând ar stoca aceleași date, fiecare rând conținând ID-ul unui angajat, numele, titlul postului, salariul și așa mai departe.
NoSQL este un progres important în domeniul datelor relaționale, deoarece elimină nevoia de sisteme foarte specializate sau consumatoare de timp. Bazele de date NoSQL pentru documente, grafice, coloane și valori de rând sunt cele patru tipuri majore. Depozitele de documente conțin atât scheme complexe de date, cât și perechi de chei asociative. Coloanele bazei de date organizează datele în coloane și funcționează în același mod în care o fac bazele de date relaționale. Există o scalabilitate a grilei de la orizontală la infinit disponibilă în bazele de date pe coloane . Compresia este o metodă de stocare care este bine făcută, iar depozitele-coloană oferă mult spațiu de stocare. Viteza cu care sunt executate interogările de agregare este de obicei mai rapidă decât cea a unei baze de date relaționale.
Din cauza naturii orizontale a designului de date, aplicațiile OLTP nu pot fi utilizate împreună cu magazinele cu coloane. Magazinele de coloane , ca soluție, au potențialul de a fi extrem de puternice, dar au și potențialul de a fi extrem de limitate. Deși coloanele oferă mai puține garanții de consistență și izolare decât rândurile, fiecare rând trebuie rescris de mai multe ori. Bazele de date NoSQL sunt mai vulnerabile la atacurile online din cauza lipsei caracteristicilor native de securitate. Dacă securitatea cibernetică este o prioritate ridicată pentru dvs., ar trebui să utilizați un model relațional sau să vă definiți schema.
Baza de date Nosql
O bază de date NoSQL este o bază de date non-relațională care nu utilizează modelul tradițional bazat pe tabel de bază de date relaționale. Bazele de date NoSQL sunt adesea folosite pentru date mari și aplicații web în timp real.
Baza de date Bazele de date NoSQL nu stochează date în baze de date relaționale tradiționale . Tipurile de documente, tipurile cheie-valoare, tipurile de coloane late și tipurile de grafice sunt cele mai comune. Costul stocării datelor a scăzut dramatic în ultimii ani, ducând la dezvoltarea bazelor de date NoSQL. Ele pot stoca o cantitate mare de date nestructurate, permițând dezvoltatorilor să selecteze aspectele datelor pe care doresc să le salveze. Bazele de date de documente, bazele de date cheie-valoare, depozitele cu coloane largi și bazele de date grafice sunt exemple de baze de date NoSQL. Deoarece nu sunt necesare conexiuni, interogările sunt efectuate mai rapid. Pot fi utilizate cazuri de utilizare intensivă a datelor, cum ar fi analiza financiară și citirile IoT de la cutiile inteligente de gunoi pentru pisici, în timp ce pot fi utilizate aplicații mai puțin serioase, cum ar fi cazurile de utilizare distractive și distractive, cum ar fi ambalajele inteligente pentru alimente.
În acest tutorial, vom analiza când și de ce ar trebui să luați în considerare bazele de date NoSQL. În plus, ne vom uita la unele dintre cele mai comune concepții greșite despre bazele de date NoSQL. Potrivit DB-Engines, MongoDB este cea mai populară bază de date NoSQL din lume. În acest tutorial, veți învăța cum să interogați o bază de date MongoDB fără a instala nimic pe computer. Clusterele de baze de date sunt un exemplu de bază de date MongoDB. De îndată ce aveți un cluster, Atlas va începe să stocheze date. Aveți trei opțiuni pentru a crea o bază de date în Atlas Data Explorer, MongoDB Shell sau MongoDB Compass: manual sau automat.
În acest caz, setul de date eșantion al Atlas va fi importat. Există numeroase beneficii pentru bazele de date NoSQL, pe lângă modelele lor flexibile de date, scalarea orizontală, interogările rapide și ușurința de utilizare. Data Explorer poate fi folosit pentru a insera documente noi, pentru a edita documente existente și pentru a le șterge. Utilizarea cadrului de agregare este un instrument extrem de puternic pentru analiza datelor dvs. Utilizarea diagramelor pentru a vizualiza datele stocate în Atlas și Atlas Data Lake este cel mai simplu mod de a face acest lucru.
O bază de date cheie-valoare este cel mai simplu tip de NoSQL, cu mai multe tabele care conțin chei și valori. Cheia este necesară doar pentru accesul la date, făcând citirea și scrierea simplă. Cu toate acestea, acest tip de bază de date nu este potrivit pentru seturi mari de date deoarece fiecare cheie din baza de date trebuie să fie unică.
Datele sunt stocate în tabele care conțin coloane, care stochează cheile și valorile bazelor de date bazate pe coloane. Datorită versatilității sale, o bază de date bazată pe coloane poate stoca date pentru o perioadă mai lungă de timp decât o bază de date fără coloane.
Bazele de date de documente, spre deosebire de bazele de date pe coloane, stochează date în tabele cu coloane care stochează chei și valori. Bazele de date bazate pe documente, pe de altă parte, stochează date în fișiere, similar cu e-mailurile. Deoarece documentele sunt ușor de citit și de înțeles, datele pot fi căutate și vizualizate într-un mod simplu.
O bază de date bazată pe grafice este similară cu o bază de date bazată pe documente prin faptul că datele sunt stocate în tabele care conțin coloane cu chei și valori. În schimb, graficele, care sunt similare rețelelor în ceea ce privește stocarea datelor, sunt stocate în baze de date bazate pe grafice. Nodurile de date pot fi conectate și modelele pot fi identificate cu ușurință.
Tipuri de baze de date Nosql pentru fiecare nevoie
Bazele de date de documente precum MongoDB sunt potrivite pentru aplicațiile care trebuie să stocheze informații într-un format flexibil și modular. În MongoDB, JSON, text și BSON sunt toate acceptate. Acest lucru îl face o alegere excelentă pentru aplicații precum bloguri și wiki-uri, care stochează cantități mari de date nestructurate.
Cassandra și alte baze de date bazate pe coloane sunt opțiuni excelente pentru aplicațiile care trebuie să stocheze cantități mari de date într-un format de coloană. Formatele de date, cum ar fi formatul binar al lui Avro și Cassandra, pot fi utilizate în plus față de stocarea bazată pe text în HBase. Deoarece are capacitatea de a stoca date care nu pot încadra într-o bază de date relațională, este foarte potrivit pentru aplicațiile care necesită o cantitate mare de date.
DynamoDB și alte baze de date cheie-valoare sunt potrivite pentru aplicațiile care stochează de obicei cantități mici sau medii de date. DynamoDB, de exemplu, acceptă JSON și formatele de date binare. Acest lucru îl face o alegere excelentă pentru aplicațiile care stochează date prea mici pentru un tabel relațional și accesate frecvent, dar care nu necesită un anumit format, precum și pentru aplicațiile care trebuie să stocheze date care sunt accesate frecvent, dar care nu necesită un anumit format. format.
Este foarte potrivit pentru aplicațiile care necesită integrarea elementelor de date care sunt stocate în baze de date grafice, cum ar fi Neo4j. De exemplu, formatele de date precum JSON, Atom și Graph pot fi utilizate în bazele de date grafice. Este ideal pentru aplicațiile care au nevoie să stocheze date prea complexe pentru a fi stocate într-o bază de date relațională sau care stochează date care sunt accesate frecvent, dar care nu trebuie să fie stocate într-un format specific.
Baza de date pe coloană cu sursă deschisă
O bază de date coloană este un tip de bază de date care stochează date în coloane în loc de rânduri. Acest tip de bază de date este adesea folosit pentru aplicații de depozitare și analiză a datelor, deoarece poate oferi performanțe și scalabilitate mai bune decât o bază de date tradițională bazată pe rânduri.
Există o serie de baze de date în coloane open source disponibile, cum ar fi Apache Cassandra, Apache HBase și Apache Drill. Fiecare dintre aceste baze de date are propriile puncte forte și puncte slabe, așa că este important să o alegeți pe cea potrivită pentru nevoile dumneavoastră specifice.
Aceste baze de date sunt ideale pentru un flux de lucru eficient de analiză, deoarece sunt rapide și scalabile în același timp. În loc să stocheze datele în rânduri, coloanele sunt folosite în baza de date pe coloană. Utilizarea stocării pe coloană îmbunătățește performanța interogării bazei de date prin reducerea semnificativă a numărului de încercări de I/O. A fost folosit pentru a alimenta Amazon Redshift și Snowflake, precum și alte depozite relaționale. Pentru a îmbunătăți debitul bazelor de date în coloană, clustere hardware cu costuri reduse sunt folosite pentru a le scala. În bazele de date tradiționale , rândurile sunt împărțite în diferite secțiuni de date. Cele mai relevante elemente dintr-o bază de date pe coloană sunt accesibile în câteva secunde.
Chiar dacă baza de date este mare, aceasta crește viteza de interogare. Costul procesării și stocării cantității crescute de date este, de asemenea, în creștere. Parquet și ORC sunt două dintre cele mai utilizate formate pentru coloanele din bazele de date. Parchetul este folosit pentru a prezenta coloane plate de date într-un mod mai eficient. ORC este un format de fișier care a fost conceput special pentru sarcinile de lucru Hadoop și a fost optimizat pentru citiri mari în flux. Hevo Data, o conductă de date fără cod, vă permite să integrați date din diferite baze de date cu peste 100 de alte surse și să le încărcați în instrumentul dvs. BI preferat. Apache Druid este o bază de date de analiză în timp real, construită pe software open-source, care poate rula interogări OLAP pe seturi mari de date la un ritm mult mai rapid.
Motorul de stocare a datelor distribuite cu sursă deschisă Apache Kudu este folosit pentru a rula procese analitice rapide pe cantități masive de informații. Modelul de stocare al MonetDB se bazează pe fragmentarea verticală, iar arhitectura sa de execuție a interogărilor se bazează pe computere moderne. Motorul de raportare analitică ClickHouse permite generarea de rapoarte în timp real. BigQuery este un rezultat al motorului de interogări distribuite de la Google, cunoscut sub numele de Dremel. Arhitectura Serverless de la Dremel poate procesa terabytes de date în câteva secunde utilizând calcularea distribuită. Compresia, proiecția just-in-time și partiționarea orizontală și verticală sunt câteva dintre beneficiile stocării pe coloană. Datele pot fi stocate pe rânduri într-o bază de date în coloană, care este o bază de date orientată pe rând.
Ei se scalează utilizând clustere cu tehnologie low-cost pentru a crește debitul. Bazele de date pe coloană pot fi utilizate pentru o varietate de scopuri în procesarea datelor mari, business intelligence (BI) și analiză. Dispozitivele Internet of Things (IoT) stochează o cantitate mare de date în centrele lor de date.
Cele mai populare trei baze de date de stocare a datelor orientate pe coloane
Apache Cassandra este un binecunoscut sistem de stocare a datelor într-o varietate de baze de date orientate pe coloane. Cassandra este un proiect open source pe partea de server care poate gestiona cantități masive de date pe multe servere de mărfuri. DynamoDB, pe de altă parte, folosește un model de bază de date NoSQL și poate stoca orice tip de date. MariaDB păstrează modelul relațional și SQL, permițând, de asemenea, generarea de interogări analitice mai rapidă și mai ușoară, făcându-l o alegere populară pentru multe baze de date columnare.
Cea mai bună bază de date pe coloană
Nu există un răspuns definitiv la această întrebare, deoarece depinde de preferințele și nevoile individuale. Cu toate acestea, unele dintre cele mai populare baze de date cu coloane includ Amazon Redshift, Google BigQuery și Microsoft SQL Server. Toate aceste baze de date sunt foarte scalabile și oferă performanțe excelente pentru încărcăturile de lucru de depozitare și analiză de date.
Datele dintr-o bază de date în coloană sunt stocate mai degrabă în coloane decât în rânduri. În comparație cu bazele de date tradiționale pe rând, bazele de date în coloană oferă o varietate de avantaje, inclusiv viteza și eficiența. Sadas Engine este cel mai puternic și flexibil sistem de gestionare a bazelor de date în coloană disponibil atât on-premise, cât și în cloud. ClickHouse este un sistem de gestionare a bazelor de date open-source care este ușor de utilizat. Amazon Redshift, cel mai rapid depozit de date cloud din lume, continuă să crească în viteză. ClickHouse utilizează întregul hardware disponibil la întregul său potențial pentru a procesa fiecare interogare cât mai repede posibil. Motorul de căutare și analiză Rockset alimentează afișajele de bord live și aplicațiile în timp real.
Vertica este cea mai rapidă și mai scalabilă bază de date analitică avansată de pe piață. Limbajul ANSI SQL este ideal pentru analiza petabyte, deoarece poate gestiona datele la viteze fulgerătoare, eliminând în același timp suprasolicitarea operațională. Analiză la cerere la scară, cu un cost de proprietate pe trei ani cu 26%-34% mai mic decât alternativele de depozit de date în cloud. Vă puteți cripta datele la cerere și acasă cu chei de criptare care sunt gestionate de companie sau le puteți seta la criptare după bunul plac. Greenplum Database este o platformă de date masiv paralelă, open-source, care oferă capabilități de analiză, învățare automată și inteligență artificială. Instrumentul oferă analize de date în timp real pe volume de date la scară petabyte la viteza fulgerului. Cu designul său de bază, Druid combină ideile din depozitele de date, bazele de date în serie de timp și sistemele de căutare pentru a crea o bază de date de analiză de înaltă performanță în timp real.
Apache 2 este codul sursă pentru acest proiect. Platforma MariaDB, o bază de date open source pentru întreprinderi, este baza acestei soluții. Această platformă poate suporta o gamă largă de sarcini de lucru tranzacționale, analitice și hibride. MariaDB poate fi implementat pe hardware de bază sau într-un cloud public, în funcție de tipul de hardware utilizat. Studenții, profesorii, cercetătorii, antreprenorii, întreprinderile mici și corporațiile multinaționale din întreaga lume se pot alătura comunității MonetDB. Oferim baza de date ca serviciu pentru CrateDB, care este complet gestionată. Stocarea pe tabel facilitează extinderea datelor, eliminând nevoia de fragmentare manuală.
De trei ori datele stocate ale unei regiuni sunt replicate folosind stocare geo-redundantă. Este simplu să portați aplicații vechi sau să creați altele noi cu modelul de date simplu al lui Kudu. Parchetul permite specificarea schemelor de compresie pe coloană și este protejată pentru viitor, astfel încât să poată fi adăugate noi scheme de compresie atunci când este necesar. Hypertable, așa cum sugerează și numele, este conceput pentru a rezolva problema scalabilității în propriile sale condiții. Este conceput pentru a suporta încărcături de lucru OLAP bazate pe DBMS în coloană InfiniDB . Performanța QikkDB în operațiunile de date mari și poligoane complexe este de neegalat. Baza de date qikkDB este construită cu următoarele caracteristici: Este o bază de date de înaltă performanță multiplatformă cu serii de timp istorice, cu un motor de calcul în memorie.
Q, un procesor de streaming și un limbaj de programare, este menit să vă permită să vă exprimați în timp real. Sorted Index, Bitmap Index și Inverted Index sunt cele trei tehnologii de indexare la care pot fi conectate. Apache Versiunea 2.0 a fost licențiată pentru acest proiect.
Bazele de date orientate pe coloane sunt viitorul
Un număr mare de baze de date au fost concepute în jurul coloanelor în ultimii ani. Deoarece aceste baze de date stochează date în rânduri și coloane, sunt ușor de utilizat și gestionat. Există mai multe baze de date orientate pe coloane disponibile, inclusiv MariaDB, CrateDB, ClickHouse, Greenplum Database, Apache Hbase, Apache Kudu, Apache Parquet, Hypertable și MonetDB. Datele de documente, grafice și coloane pot fi generate în DynamoDB folosind un model de bază de date NoSQL. MongoDB, compania din spatele bazei de date a magazinului de documente, a anunțat lansarea indexării columnstore, care permite dezvoltatorilor să creeze interogări analitice în aplicațiile lor.
Exemplu de bază de date pe coloană
O bază de date coloană este un tip de bază de date care stochează date în coloane în loc de rânduri. Acest tip de bază de date este adesea folosit pentru aplicații de depozitare și analiză a datelor, deoarece poate oferi performanțe și scalabilitate mai bune decât o bază de date tradițională bazată pe rânduri. Un exemplu de bază de date coloană este Apache HBase.
Operațiunile cu baze de date diferă de cele ale altor baze de date prin aceea că, de obicei, coloanele distribuie informații în rânduri. Capacitatea de a analiza seturi mari de date este deosebit de atrăgătoare pentru bazele de date cu coloane. Magazinele de documente care folosesc baze de date NoSQL au crescut în popularitate în ultimii ani. Bazele de date cu grafice devin, de asemenea, din ce în ce mai populare, pe măsură ce mai mulți oameni le folosesc, deoarece pot mapa datele foarte precise în rețea. Multă vreme s-au folosit sisteme de gestionare a bazelor de date columnare. În ciuda faptului că există încă câteva implementări disponibile, există mai multe sisteme care au fost dezvoltate. Accesul la aplicațiile tranzacționale este de obicei diferit de accesul la alte aplicații. Această sarcină ar fi efectuată mult mai lent într-o bază de date în coloană decât ar fi într-o bază de date convențională .
De ce bazele de date orientate pe coloane devin din ce în ce mai populate
Bazele de date orientate pe coloane, cum ar fi Cassandra, MariaDB și CrateDB, câștigă popularitate ca soluții de stocare a datelor pentru aplicațiile care gestionează cantități mari de date. Deoarece datele pot fi stocate într-o bază de date cu mai multe rânduri ale aceluiași tabel (familie de coloane), este mai ușor să stocați datele și să îmbunătățiți performanța.
Sunt disponibile mai multe baze de date orientate pe coloane, cum ar fi MariaDB, CrateDB, ClickHouse, Greenplum Database, Apache Hbase, Apache Kudu și Apache Parquet. Toate aceste baze de date sunt open source și au fost utilizate cu succes într-o varietate de aplicații.