Turinys:

Kas yra duomenų analizės nuokrypiai?
Kas yra duomenų analizės nuokrypiai?

Video: Kas yra duomenų analizės nuokrypiai?

Video: Kas yra duomenų analizės nuokrypiai?
Video: Finding an outlier in a dataset using Python 2024, Lapkritis
Anonim

Statistikoje an Pašalinių yra duomenis taškas, kuris labai skiriasi nuo kitų stebėjimų. An Pašalinių gali būti dėl matavimo kintamumo arba tai gali reikšti eksperimentinę klaidą; pastarieji kartais neįtraukiami duomenis rinkinys. An Pašalinių gali sukelti rimtų problemų statistinės analizės.

Atsižvelgiant į tai, kaip rasti duomenų nukrypimus?

Taškas, kuris patenka už duomenis komplekto vidinės tvoros priskiriamos nepilnamečiams Pašalinių , o tas, kuris patenka už išorinių tvorų, yra klasifikuojamas kaip pagrindinis Pašalinių . Norėdami rasti vidines tvoras savo duomenis pirmiausia padauginkite tarpkvartilinį diapazoną iš 1,5. Tada pridėkite rezultatą prie Q3 ir atimkite jį iš Q1.

Be to, ar turėčiau pašalinti iš savo duomenų nukrypimus? Dėl į didžioji dalis, jei savo duomenis esate paveiktas šių ekstremalių atvejų, jūs gali surištas į indėlis istoriniam atstovui savo duomenis tai neįtraukia nuokrypiai . Kiekvienu konkrečiu atveju nustatykite, ką į poveikis nuokrypiai buvo. Ir tada nuspręskite, ar norite pašalinti , pakeisti arba išlaikyti išskirtinis vertybes.

Kalbant apie tai, kaip duomenų analizė susidoroja su nuokrypiais?

Čia yra keturi būdai:

  1. Išmeskite išskirtinius įrašus. Billo Gateso ar kitos tikrovės pašalinimo atveju kartais geriausia visiškai pašalinti tą įrašą iš duomenų rinkinio, kad tas asmuo ar įvykis neiškreiptų jūsų analizės.
  2. Apribokite savo išskirtinius duomenis.
  3. Priskirkite naują vertę.
  4. Išbandykite transformaciją.

Koks yra nuokrypio pavyzdys?

Pašalinių . more Vertė, kuri „slypi už“(kuri yra mažesnė arba didesnė nei) daugumos kitų duomenų rinkinio reikšmių. Dėl pavyzdys 25, 29, 3, 32, 85, 33, 27, 28 baluose 3 ir 85 yra " nuokrypiai ".

Rekomenduojamas: