Statistika ja andmeanalüüs võivad esmapilgul tunduda keeruliste valemite ja arusaamatu terminoloogia kogumina, kuid paljud põhilised mõisted on tegelikult üsna intuitiivsed. Üks neist on mediaan, mis on keskväärtuse leidmise meetodina sageli märksa informatiivsem kui tavaline aritmeetiline keskmine. Kui soovite mõista, kuidas andmeid õigesti tõlgendada ja vältida äärmuslike väärtuste põhjustatud eksitavaid järeldusi, on mediaani arvutamise oskus hädavajalik. Selles artiklis selgitame samm-sammult, mis on mediaan, kuidas seda erinevate andmehulkade puhul arvutada ning miks see on paljudes olukordades parem näitaja kui keskmine.
Mis on mediaan ja miks see oluline on?
Lihtsalt öeldes on mediaan arv, mis asub sorteeritud andmehulga täpselt keskel. See jagab andmed kaheks võrdseks pooleks: pooled vaatlustest on mediaanist väiksemad või sellega võrdsed ning teine pool on sellest suuremad või sellega võrdsed. Erinevalt aritmeetilisest keskmisest, kus kõik arvud liidetakse ja jagatakse nende arvuga, ei sõltu mediaan üksikute äärmuslike väärtuste suurusest.
Kujutage ette olukorda, kus analüüsite väikeettevõtte palkasid. Kui üheksal töötajal on madal palk, kuid ühel juhil on ülikõrge palk, siis aritmeetiline keskmine näitaks kõrgemat summat, mis ei peegelda tegelikku olukorda “tavalise” töötaja jaoks. Mediaan aga jääb stabiilseks ja näitab, milline on “keskmine” töötasu nii, et pooled teenivad sellest vähem ja pooled rohkem. See teeb mediaanist suurepärase vahendi sissetulekute, kinnisvarahindade ja muude andmete analüüsimiseks, kus esineb erandeid.
Mediaani leidmise üldine protsess
Mediaani arvutamine on loogiline ja lihtne protsess, kuid see nõuab korrektsust. Enne arvutustega alustamist peate alati järgima kindlat järjestust:
- Koguge andmed: Veenduge, et teil on olemas kõik vajalikud arvud.
- Sorteerige andmed: See on kõige kriitilisem samm. Reastage kõik arvud väikseimast suurimani (või vastupidi).
- Leidke keskmine positsioon: Sõltuvalt sellest, kas arvude hulk on paaritu või paaris, on arvutuskäik erinev.
Mediaani arvutamine paaritu arvuga andmehulga korral
Kui andmete arv on paaritu (näiteks 5, 7 või 9 arvu), on mediaani leidmine kõige lihtsam. Sellisel juhul on keskmine arv täpselt olemas ja selle leidmiseks ei ole vaja keerulisi tehtemärke kasutada.
Näide: Meil on andmehulk: 3, 1, 7, 5, 9.
- Sorteerime arvud: 1, 3, 5, 7, 9.
- Loendame arvude arvu: siin on kokku 5 arvu (paaritu arv).
- Leiame keskmise positsiooni: Kuna arvude hulk on 5, on keskmine arv positsioonil (5+1)/2 = 3.
- Kolmas arv järjestatud reas on 5. Seega on mediaan 5.
Mediaani arvutamine paarisarvulise andmehulga korral
Kui andmeid on paarisarvuline hulk (näiteks 4, 6 või 10 arvu), ei ole meil ühte kindlat keskmist numbrit. Sellisel juhul on mediaan kahe keskmise arvu aritmeetiline keskmine. See tähendab, et liidate need kaks keskmist arvu kokku ja jagate summa kahega.
Näide: Meil on andmehulk: 10, 2, 8, 4, 6, 12.
- Sorteerime arvud: 2, 4, 6, 8, 10, 12.
- Loendame arvud: siin on kokku 6 arvu (paarisarv).
- Leiame kaks keskmist arvu: need on kolmas ja neljas arv, ehk 6 ja 8.
- Arvutame keskmise: (6 + 8) / 2 = 7.
- Mediaan on 7.
Korduma kippuvad küsimused
Kas mediaani saab arvutada ka tekstiliste andmete puhul?
Ei, mediaani saab arvutada ainult arvuliste väärtuste puhul, mida saab reastada. Tekstiliste andmete puhul kasutatakse sagedamini moodi, mis tähistab kõige sagedamini esinevat väärtust.
Kuidas mõjutavad outliers ehk äärmuslikud väärtused mediaani?
Mediaan on äärmuslike väärtuste suhtes väga vastupidav ehk robustne. Isegi kui üks väärtus andmehulgas on ebamõistlikult suur, jääb mediaan ikkagi andmete keskele, samas kui aritmeetiline keskmine nihkuks äärmuse poole märgatavalt.
Millal valida mediaan ja millal aritmeetiline keskmine?
Kasutage mediaani, kui andmed on viltuse jaotusega või sisaldavad äärmusi. Aritmeetilist keskmist on mõistlik kasutada, kui andmed on jaotunud sümmeetriliselt ja kõik väärtused on võrreldavad ning olulised.
Kas Excelis või Google Sheetsis saab mediaani arvutada automaatselt?
Jah, selleks on olemas funktsioon MEDIAN. Näiteks valemiga =MEDIAN(A1:A10) saate kiiresti ja vigadeta kätte oma andmete mediaani.
Praktilised näpunäited andmeanalüüsi oskuste arendamiseks
Statistiliste näitajatega töötamine muutub aja jooksul loomulikumaks, kui harjutate erinevate andmekogumite analüüsimist. Alustage väikeste tabelitega oma igapäevaelus, näiteks kulutuste või treeningute kestuse jälgimisega. Kui mõistate, kuidas mediaan teie isiklikke andmeid kirjeldab, hakkate ka uudistes või aruannetes toodud statistikat hoopis teise pilguga vaatama. Pidage alati meeles, et statistika on tööriist tõe mõistmiseks, mitte lihtsalt numbritemäng. Õigesti kasutatud mediaan on võimas viis näha pildi “päris” keskosa, laskmata end eksitada üksikutel erandjuhtudel, mis võivad tulemusi moonutada. Harjutamine teeb meistriks – proovige arvutada mediaani iga kord, kui puutute kokku arvude jadaga, ning peagi muutub see protsess teie jaoks täiesti automaatseks ja loomulikuks tegevuseks.
