Kas yra AWS MapReduce?
Kas yra AWS MapReduce?

Video: Kas yra AWS MapReduce?

Video: Kas yra AWS MapReduce?
Video: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn 2024, Gegužė
Anonim

Amazon elastinga MapReduce (EMR) yra „Amazon Web Services“( AWS ) didelių duomenų apdorojimo ir analizės įrankis. „Amazon EMR“apdoroja didelius duomenis „Hadoop“virtualių serverių klasteryje „Amazon Elastic Compute Cloud“(EC2) ir „Amazon Simple Storage Service“(S3).

Tokiu būdu, kaip veikia AWS EMR?

Paslauga paleidžia kliento nurodytą Amazon EC2 egzempliorių skaičių, kurį sudaro vienas pagrindinis ir keli kiti mazgai. Amazon EMR paleidžia Hadoop programinę įrangą šiais atvejais. Pagrindinis mazgas padalija įvesties duomenis į blokus ir paskirsto blokų apdorojimą kitiems mazgams.

Be to, kuo skiriasi ec2 ir EMR? Skirtingai nei EMR , EC2 neskirsto pagalbinių mazgų į pagrindinius ir užduočių mazgus. Tai padidina HDFS duomenų praradimo riziką, jei mazgas bus pašalintas / prarastas. EC2 naudoja Apache bibliotekas (s3a), kad pasiektų duomenis apie s3. Iš kitos pusės, EMR naudoja AWS patentuotą kodą, kad greičiau pasiektų s3.

Be to, ar AWS EMR yra visiškai valdomas?

Amazon Elastic MapReduce ( EMR ) yra pilnai valdoma Hadoop ir Spark platforma iš Amazon žiniatinklio paslauga ( AWS ). Su EMR , AWS klientai gali greitai sukurti kelių mazgų „Hadoop“grupes, kad apdorotų didelių duomenų darbo krūvius.

Ar AWS naudoja Hadoop?

Amazon Žiniatinklio paslaugos naudoja atvirojo kodo Apache Hadoop paskirstytos skaičiavimo technologijos, kad būtų lengviau pasiekti didelius skaičiavimo galios kiekius, kad būtų galima atlikti daug duomenų reikalaujančias užduotis. Hadoop , atvirojo kodo Google MapReduce versiją, jau naudoja tokios kompanijos kaip Yahoo ir Facebook.

Rekomenduojamas: