Ar AWS palaiko Hadoop?
Ar AWS palaiko Hadoop?

Video: Ar AWS palaiko Hadoop?

Video: Ar AWS palaiko Hadoop?
Video: Introduction to Amazon Web Services by Leo Zhadanovsky 2024, Gegužė
Anonim

Apache™ Hadoop ® yra atvirojo kodo programinės įrangos projektas, kuris gali būti naudojamas efektyviai apdoroti didelius duomenų rinkinius. Amazon EMR leidžia lengvai kurti ir valdyti visiškai sukonfigūruotas, elastingas grupes Amazon EC2 veikia egzemplioriai Hadoop ir kitos programos Hadoop ekosistema.

Taigi, ar AWS naudoja „Hadoop“?

Amazon Žiniatinklio paslaugos naudoja atvirojo kodo Apache Hadoop paskirstytos skaičiavimo technologijos, kad būtų lengviau pasiekti didelius skaičiavimo galios kiekius, kad būtų galima atlikti daug duomenų reikalaujančias užduotis. Hadoop , atvirojo kodo Google MapReduce versiją, jau naudoja tokios kompanijos kaip Yahoo ir Facebook.

Antra, ką daro AWS EMR? Amazon Elastic MapReduce ( EMR ) yra an Amazon žiniatinklio paslaugos ( AWS ) didelių duomenų apdorojimo ir analizės įrankis. Amazon EMR apdoroja didelius duomenis Hadoop virtualių serverių klasteryje Amazon Elastic Compute Cloud ( EC2 ) ir Amazon Paprasta saugojimo paslauga (S3).

Kuo skiriasi Hadoop ir AWS?

Hadoop yra sistema, padedanti apdoroti didelius duomenų rinkinius keliuose kompiuteriuose. Tai apima Map / Reduce (lygiagretus apdorojimas) ir HDFS (paskirstyta failų sistema). AWS yra duomenų saugykla, sukurta naudojant patentuotą technologiją, kurią iš pradžių sukūrė „ParAccel“. Kokie yra įprasti Apache naudojimo būdai Hadoop ?

Ar AWS s3 „Hadoop“?

S3 iš tikrųjų yra begalinė saugykla debesyje, bet HDFS nėra. HDFS yra priglobtas fiziniuose kompiuteriuose, todėl ten galite vykdyti bet kurią programą. Jūs negalite nieko vykdyti S3 nes tai tik objektų parduotuvė, o ne FS.

Rekomenduojamas: