Kas yra duomenų ežeras Hadoop?
Kas yra duomenų ežeras Hadoop?

Video: Kas yra duomenų ežeras Hadoop?

Video: Kas yra duomenų ežeras Hadoop?
Video: What is Data Lake | Understand the Data Lake Architecture | Data Lake using Apache Spark 2024, Lapkritis
Anonim

A Hadoop duomenų ežeras yra duomenis valdymo platforma, kurią sudaro viena ar daugiau Hadoop klasteriai. Jis daugiausia naudojamas nesusijusių duomenų apdorojimui ir saugojimui duomenis , pvz., žurnalo failai, interneto paspaudimų srauto įrašai, jutiklis duomenis , JSON objektai, vaizdai ir socialinės žiniasklaidos įrašai.

Šiuo atžvilgiu kuo skiriasi duomenų saugykla ir duomenų ežeras?

Duomenų ežerai ir duomenis sandėliai yra plačiai naudojami dideliems sandėliams duomenis , tačiau jie nėra keičiami terminai. A duomenų ežeras yra didžiulis žaliavų telkinys duomenis , kurio tikslas dar nėra apibrėžtas. A duomenų saugyklos yra struktūrizuoto, filtruoto saugykla duomenis kuris jau buvo apdorotas konkrečiam tikslui.

Be to, kas yra duomenų ežero architektūra? A Duomenų ežeras yra saugykla, kurioje galima saugoti daug struktūrizuotų, pusiau struktūrizuotų ir nestruktūrizuotų duomenis . Skirtingai nuo hierarchinio Dataware namų, kur duomenis yra saugomas failuose ir aplankuose, Duomenų ežeras turi butą architektūra.

Kalbant apie tai, ką reiškia duomenų ežeras?

A duomenų ežeras yra saugykla, kurioje yra daug neapdorotų duomenų duomenis gimtuoju formatu, kol to prireiks. Nors hierarchinė duomenis sandėlių parduotuvės duomenis failuose ar aplankuose, a duomenų ežeras saugojimui naudoja plokščią architektūrą duomenis . Terminas duomenų ežeras dažnai siejamas su Hadoop orientuota objektų saugykla.

Ar Elasticsearch yra duomenų ežeras?

A duomenų ežeras yra tiesiog vieta pasistatyti automobilį duomenis kol jums to prireiks, ir tai gali apimti HDFS (dažniausiai paplitusią), objektų saugyklą, NAS dėžutes ar bet ką kitą. Iš esmės, Elasticsarch yra indeksavimo įrankis duomenis , ne saugojimui duomenis pats.

Rekomenduojamas: