Üst hədləri hesablayın

Müəllif: Charles Brown
Yaradılış Tarixi: 8 Fevral 2021
YeniləMə Tarixi: 1 İyul 2024
Anonim
Incredible Cake NAPOLEON! Layer cake with yogurt cream
Videonuz: Incredible Cake NAPOLEON! Layer cake with yogurt cream

MəZmun

A daha üstündür və ya daha üstündür statistikada, nümunədəki digər məlumat nöqtələrindən əhəmiyyətli dərəcədə fərqlənən bir məlumat nöqtəsidir. Çox vaxt kənar şəxslər statistika işçilərinə ölçmələrdəki uyğunsuzluqlara və ya səhvlərə işarə edirlər, bundan sonra kənarları məlumat toplusundan çıxara bilərlər. Həqiqətən məlumat qrupundan kənarları aradan qaldırmağı seçsələr, bu işdən çıxarılan nəticələrdə əhəmiyyətli dəyişikliklər edə bilər. Buna görə statistik məlumatları düzgün şərh etmək istəyirsinizsə, həddən artıq olanları hesablamaq və müəyyən etmək vacibdir.

Addımlamaq

  1. Mümkün kənar şəxsləri necə aşkar edəcəyinizi öyrənin. Anomal dəyərlərin müəyyən bir məlumat dəstindən silinib-çıxarılmayacağına qərar vermək üçün əvvəlcə əlbəttə ki, məlumat dəstindəki mümkün hədləri müəyyən etməliyik. Ümumiyyətlə, həddən artıq göstəricilər, setdəki digər dəyərləri meydana gətirən trenddən əhəmiyyətli dərəcədə kənara çıxan məlumat nöqtələridir - başqa sözlə, onlar vurmaq digər dəyərlərin. Bunu cədvəllərdən və (xüsusən) qrafiklərdən tanımaq ümumiyyətlə asandır. Məlumat dəsti vizual olaraq qrafiklənərsə, kənar dəyərlər digər dəyərlərdən "uzaq" olacaqdır. Məsələn, bir məlumat dəstindəki əksər nöqtələr düz bir xətt meydana gətirərsə, həddən artıq olanlar bu xəttə uyğun gəlməzlər.
    • Otaqdakı 12 müxtəlif cisimin istiliyini göstərən bir məlumat dəstinə nəzər salaq. Əgər cisimlərdən 11-nin temperaturu ən çox 21 ° C civarında bir neçə dərəcə dəyişirsə, bir cismin, ocağın 150 ° C temperaturu olduğu halda, bir baxışda sobanın böyük bir üstünlük olduğunu görə bilərsiniz.
  2. Bütün məlumat nöqtələrini aşağıdan ən böyüyə qədər çeşidləyin. Çıxışların hesablanmasında ilk addım, məlumat dəstinin orta dəyərini (və ya orta dəyərini) tapmaqdır. Dəstdəki dəyərlər ən aşağıdan ən yüksək səviyyəyə qədərdirsə, bu vəzifə daha asan olur. Davam etmədən əvvəl, verilənlər bazanızdakı dəyərləri belə sıralayın.
    • Yuxarıdakı nümunə ilə davam edək. Bir otaqdakı müxtəlif cisimlərin Fahrenhayt dərəcəsindəki istiliyi göstərən məlumat dəstimiz budur: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Kümedeki dəyərləri ən aşağıdan ən yüksəkə qədər sıralasaq, bu yeni dəstimiz olur: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. Məlumat dəstinin orta hesablayın. Verilənlər bazasının ortalaması, məlumatların yarısının yuxarıda olduğu və məlumatların yarısının aşağıda olduğu məlumat nöqtəsidir - əslində verilənlər bazasının "mərkəzi" dir. Məlumat dəsti tək sayda nöqtə ehtiva edirsə, medianı tapmaq asandır - yuxarıdakı nöqtə aşağıda göstərilən qədər olan mediandır. Cüt nöqtələr varsa, bir mərkəz olmadığı üçün ortanı tapmaq üçün iki mərkəz nöqtəsinin ortalamasını götürməlisiniz. Çıxışları hesablayarkən, median adətən Q2 dəyişəninə istinad edilir - çünki birinci və üçüncü rüblər Q1 ilə Q3 arasında yerləşir. Bu dəyişkənləri daha sonra təyin edəcəyik.
    • Məlumat dəstləri ilə cüt nöqtələri olan səhvlərlə qarışdırmayın - iki orta nöqtənin ortalaması çox vaxt verilənlər bazasının özündə olmayan bir rəqəmdir - bu yaxşıdır. Lakin, iki orta nöqtə eynidirsə, ortalama əlbətdə bu rəqəm olacaqdır - bu da budur Tamam.
    • Bizim nümunəmizdə 12 xal var. Orta iki müddət, sırasıyla 6 və 7 - 70 və 71 nöqtələridir. Beləliklə, məlumat dəstimizin ortalaması bu iki nöqtənin ortalamasıdır: ((70 + 71) / 2) =70,5.
  4. İlk kvartili hesablayın. Q1 dəyişənlə işarə etdiyimiz bu nöqtə, müşahidələrin yüzdə 25inin (və ya dörddə birinin) altında yerləşdiyi məlumat nöqtəsidir. Başqa sözlə, bu, məlumat dəstindəki bütün nöqtələrin mərkəzidir aşağıda orta. Medianın altında cüt say varsa, medianı özünüz təyin etmək üçün etdiyiniz kimi Q1-i tapmaq üçün yenidən iki orta dəyərin ortalamasını götürməlisiniz.
    • Bizim nümunəmizdə altı xal medianın üstündə və altı pillə altındadır. Beləliklə, ilk dördlüyü tapmaq üçün alt altı nöqtədəki iki orta nöqtənin ortalamasını götürməliyik. Altı altındakı 3 və 4-cü nöqtələr hər ikisi 70-dir, buna görə ortalamaları ((70 + 70) / 2) = -dir70. Yəni Q1 üçün dəyərimiz 70-dir.
  5. Üçüncü kvartili hesablayın. Q3 dəyişənlə işarə etdiyimiz bu nöqtə, məlumatların yüzdə 25-nin yuxarıda yerləşdiyi məlumat nöqtəsidir. Q3 tapmaq praktiki olaraq Q1 tapmaqla eynidir, ancaq bu vəziyyətdə olan nöqtələrə baxmırıq yuxarıda orta.
    • Yuxarıdakı nümunə ilə davam edərək, medianın üstündəki altı nöqtənin iki orta nöqtəsinin 71 və 72 olduğunu görürük. Bu iki nöqtənin ortalaması ((71 + 72) / 2) =71,5. Yəni Q3 üçün dəyərimiz 71.5-dir.
  6. Interkartil aralığı tapın. İndi Q1 və Q3-i təyin etdikdən sonra bu iki dəyişən arasındakı məsafəni hesablamalıyıq. Q1 ilə Q3 arasındakı məsafəni Q3-dən Q1 çıxarıb tapa bilərsiniz. Interquartile üçündür üçün əldə etdiyiniz dəyər, məlumat dəstindəki sapmayan nöqtələrin sərhədlərini müəyyənləşdirmək üçün çox vacibdir.
    • Bizim nümunəmizdə Q1 və Q3 üçün dəyərlər müvafiq olaraq 70 və 71,5-dir. Interquartile aralığını tapmaq üçün Q3 - Q1: 71.5 - 70 = hesablayırıq1,5.
    • Q1, Q3 və ya hər iki rəqəm mənfi olsa belə, bu işləyir. Məsələn, Q1 üçün dəyərimiz -70 olsaydı, qruplararası aralıq 71.5 - (-70) = 141.5 olardı ki, bu da düzgündür.
  7. Verilənlər bazasının "Daxili məhdudiyyətlərini" tapın. Bir sıra ədədi hüdudlara düşüb-düşmədiklərini müəyyənləşdirərək kənara çıxanları tanıya bilərsiniz; sözdə "daxili sərhədlər" və "xarici sərhədlər". Datasetin daxili hüdudlarından kənara çıxan nöqtə bir kimi təsnif edilir mülayim açıqdırvə xarici hüdudlardan kənar bir nöqtə bir olaraq təsnif edilir həddindən artıq açıqdır. Məlumat dəstinin daxili sərhədlərini tapmaq üçün əvvəlcə bölmələrarası diapazonu 1,5-ə vurun. Nəticəni Q3-ə əlavə edin və Q1-dən çıxarın. İki nəticə, məlumat dəstinizin daxili sərhədləridir.
    • Bizim nümunəmizdə, interkartil aralığı (71.5 - 70) və ya 1.5-dir. 2,25 əldə etmək üçün bunu 1,5-ə vurun. Bu rəqəmi Q3-ə əlavə edirik və daxili sərhədləri tapmaq üçün Q1-dən çıxardırıq:
      • 71,5 + 2,25=73,75
      • 70 - 2,25=67,75
      • Yəni daxili sərhədlər 67.75 və 73.75.
    • Məlumat dəstimizdə yalnız sobanın temperaturu - 300 dərəcə Fahrenhayt - bu aralığın xaricindədir. Beləliklə, bu yüngül bir çıxış ola bilər. Bununla birlikdə, bu temperaturun həddən artıq olduğunu müəyyənləşdirməmişik, buna görə hələlik tələsməyək.
  8. Verilənlər bazasının "xarici hədlərini" tapın. Bunu daxili sərhədlərlə olduğu kimi, yalnız intervallararası məsafəni 1,5 əvəzinə 3-ə vurduğunuz fərqlə edirsiniz. Daha sonra nəticəni Q3-ə əlavə edir və xarici sərhəd dəyərlərini tapmaq üçün Q1-dən çıxarırsınız.
    • Nümunəmizdə, (1.5 * 3) və ya 4.5 əldə etmək üçün bölmələrarası məsafəni 3-ə vururuq. Artıq xarici sərhədləri daxili sərhədlərlə eyni şəkildə tapa bilərik:
      • 71,5 + 4,5=76
      • 70 - 4,5=65,5
      • Yəni xarici sərhədlər 65.5 və 76.
    • Xarici sərhədlərdən kənarda olan məlumat nöqtələri həddindən artıq həddə hesab olunur. Bizim nümunəmizdə sobanın temperaturu, 300 dərəcə Fahrenhayt, xarici hüdudlardan çoxdur. Beləliklə sobanın temperaturu əlbəttə həddindən artıq kənar.
  9. Çıxış edənləri "atma" olub-olmadığını müəyyən etmək üçün keyfiyyətli qiymətləndirmədən istifadə edin. Yuxarıda göstərilən metodla müəyyən nöqtələrin yüngül həddə, həddən artıq həddə və ya artıq olmamağa qərar verə bilərsiniz. Ancaq səhv etməyin - bir nöqtəni üstün hesab etmək onu yalnız bir hala gətirir namizəd dərhal silinən bir nöqtə deyil, verilənlər bazasından silinəcəkdir olmalıdır çevrilmək. The səbəb bir kənar göstəricinin çoxluqdakı qalan nöqtələrdən fərqi niyə kənarlaşmanın qaldırılmasının vacibliyini müəyyənləşdirmək üçün vacibdir. Ümumiyyətlə, bəzi səhvlərdən qaynaqlanan hədlər - məsələn ölçmələrdəki, qeydlərdəki və ya eksperimental dizayndakı bir səhv - silinir. Əksinə, səhvlərdən qaynaqlanmayan və yeni, gözlənilməz məlumatları və ya meylləri ortaya çıxaran kənarlaşmalar olur yox silindi.
    • Nəzərə alınmalı olan başqa bir meyar, həddən artıq göstəricilərin bir məlumat dəstinin ortalamasını əyri və ya yanıltıcı bir şəkildə təsir edib etməməsidir. Veri dəstinizin ortalamasından nəticə çıxarmağı planlaşdırırsınızsa, bu xüsusilə vacibdir.
    • Nümunəmizi mühakimə edək. Bəri ən yüksək Təbiətin gözlənilməz bir qüvvəsi səbəbindən sobanın 300 ° F-yə çatması ehtimalı azdır, nümunəmizdə ocağın təsadüfən açıldığına, anormal dərəcədə yüksək temperatur göstəricisinə səbəb olduğuna təxminən 100% əminliklə gələ bilərik. Əlavə olaraq, kənar tərəfi çıxarmırıqsa, məlumat dəstimizin ortalaması (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 ° olur. F, orta isə olmadan kənar (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70.55 ° F-ə çatır.
      • Dışa çıxma insanın səhvindən qaynaqlandığına görə və orta otaq istiliyinin 32 ° C-yə yaxın olduğunu söyləmək səhv olduğundan, kənar həddimizi istifadə etməyi seçməliyik. sil.
  10. Kənarların saxlanılmasının (bəzən) vacibliyini başa düşün. Bəzi kənar hədlər səhvlərin nəticəsi olduğu və ya nəticələri səhv bir şəkildə əydikləri üçün bir verilənlər bazasından çıxarılmalı olsa da, digər hədlər qorunmalıdır. Məsələn, kənara çıxan bir şəxs düzgün əldə edilmişsə (və bu səbəbdən bir səhvin nəticəsi deyilsə) və / və ya kənar ölçülən fenomen haqqında yeni bir fikir təklif edərsə, dərhal çıxarılmamalıdır. Elmi təcrübələr, kənara çıxanlarla məşğul olmaq məsələsində xüsusilə həssas vəziyyətlərdir - səhvən kənar bir kənarlaşdırma yeni bir trend və ya kəşf haqqında vacib məlumatları atmaq deməkdir.
    • Məsələn, bir balıq təsərrüfatında balıqları daha da böyütmək üçün yeni bir dərman dizayn etdiyimizi təsəvvür edin. Köhnə məlumat dəstimizi ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}) istifadə edək, indi hər nöqtənin bir balığın kütləsini (qram şəklində) fərqləndirməsi ilə ) doğuşdan başqa bir təcrübə dərmanı ilə müalicədən sonra. Başqa sözlə, birinci dərman bir balığa 71 qram kütlə verdi, ikincisi başqa bir balığa 70 qram kütlə verdi və s. Bu vəziyyətdə, 300 yenə də nəhəng bir kənar, amma indi qaldırmamalıyıq. Çünki, üstünlüyün bir səhvin nəticəsi olmadığını düşünsək, bu, təcrübəmizdə böyük bir müvəffəqiyyətdir. 300 qramlıq balıq istehsal edən dərman digər dərmanlardan daha yaxşı işlədi, buna görə də budur ən çox əvəzinə dəstimizdə əhəmiyyətli bir məlumat nöqtəsi ən az vacib məlumat nöqtəsi.

Göstərişlər

  • Daha çox nəticə əldə edirsinizsə, onları verilənlər bazasından çıxarmazdan əvvəl izah etməyə çalışın; paylanmada ölçmə səhvlərini və ya sapmaları göstərə bilərlər.

Ehtiyaclar

  • Kalkulyator