kérjük, adja meg a vesszővel elválasztott számokat a számításhoz.
kapcsolódó statisztikák kalkulátor / szórás kalkulátor / Minta Méret kalkulátor
átlag
az átlag szó, amely több más szó homonimája az angol nyelvben, hasonlóan kétértelmű még a matematika területén is. A kontextustól függően, legyen az matematikai vagy statisztikai, mit jelent az “átlag” változás. Az adatkészletekre vonatkozó legegyszerűbb matematikai meghatározásában az alkalmazott átlag a számtani átlag, amelyet matematikai elvárásnak vagy átlagnak is neveznek. Ebben a formában az átlag egy diszkrét számkészlet közötti közbenső értékre utal, nevezetesen az adathalmaz összes értékének összegére, osztva az értékek teljes számával. A számtani átlag kiszámításának egyenlete gyakorlatilag megegyezik a populáció és a minta átlag statisztikai fogalmainak kiszámításával, az alkalmazott változók enyhe eltéréseivel:
az átlagot gyakran jelölik x, kiejtve “x sáv”, sőt más felhasználásokban is, amikor a változó nem x, a sávjelölés az átlag valamilyen formájának általános mutatója. A populáció átlagának konkrét esetben a változó használata helyett x, a görög szimbólum mu, vagy++, használjuk. Hasonlóképpen, vagy inkább zavaróan, a statisztikában a minta átlagát gyakran nagybetűvel jelölik X. Tekintettel az adatkészletre 10, 2, 38, 23, 38, 23, 21, a fenti összegzés alkalmazása hozamok:
10 + 2 + 38 + 23 + 38 + 23 + 21
|
= | = 22.143 |
mint korábban említettük, ez az átlag egyik legegyszerűbb meghatározása, mások pedig tartalmazzák a súlyozott számtani átlagot (amely csak abban különbözik, hogy az adathalmaz bizonyos értékei több értéket adnak, mint mások), valamint a geometriai átlagot. Az adott helyzetek és kontextusok megfelelő megértése gyakran biztosítja a személy számára a szükséges eszközöket annak meghatározásához, hogy milyen statisztikailag releváns módszert kell használni. Általánosságban elmondható, hogy az átlagot, a mediánt, a módot és a tartományt ideális esetben egy adott mintára vagy adatkészletre kell kiszámítani és elemezni, mivel ezek tisztázzák az adott adatok különböző aspektusait, és ha önmagában vesszük figyelembe, az adatok téves bemutatásához vezethet, amint azt a következő szakaszok mutatják be.
medián
a medián statisztikai fogalma olyan érték, amely két részre osztja az adatmintát, a populációt vagy a valószínűségi eloszlást. A medián megtalálása lényegében magában foglalja az érték megtalálását egy olyan adatmintában, amelynek fizikai helye van a többi szám között. Vegye figyelembe, hogy a véges számlista mediánjának kiszámításakor fontos az adatminták sorrendje. Hagyományosan az értékek növekvő sorrendben vannak felsorolva, de nincs valódi oka annak, hogy az értékek csökkenő sorrendben történő felsorolása eltérő eredményeket eredményezne. Abban az esetben, ha az adatmintában szereplő értékek száma páratlan, a medián egyszerűen az összes érték listájának közepén található szám. Ha az adatminta páros számú értéket tartalmaz, a medián a két középső érték átlaga. Bár ez zavaró lehet, egyszerűen ne feledje, hogy annak ellenére, hogy a medián néha magában foglalja az átlag kiszámítását, amikor ez az eset felmerül, csak a két középső értéket fogja bevonni, míg az átlag az adatminta összes értékét tartalmazza. Azokban a páratlan esetekben, amikor csak két adatminta van, vagy páros számú minta van, ahol az összes érték azonos, az átlag és a medián ugyanaz lesz. Tekintettel ugyanazokra az adatkészletekre, mint korábban, a mediánt a következő módon szereznék meg:
2,10,21,23,23,38,38
miután az adatokat növekvő sorrendben soroltuk fel, és megállapítottuk, hogy páratlan számú érték van, egyértelmű, hogy 23 a medián ebben az esetben. Ha van egy másik érték az adatkészlethez:
2,10,21,23,23,38,38,1027892
mivel páros számú érték van, a medián a két középső szám átlaga lesz, ebben az esetben 23 és 23, amelyek átlaga 23. Vegye figyelembe, hogy ebben a konkrét adathalmazban egy kiugró érték (a várt értéktartományon jóval kívül eső érték), az 1 027 892 érték hozzáadása nincs valós hatással az adathalmazra. Ha azonban ehhez az adatkészlethez kiszámítjuk az átlagot, akkor az eredmény 128 505,875. Ez az érték nyilvánvalóan nem jól reprezentálja az adathalmaz hét másik értékét, amelyek sokkal kisebbek és közelebb vannak az átlaghoz és a kiugró értékhez. Ez a fő előnye a medián használatának a statisztikai adatok leírásában az átlaghoz képest. Míg az adatok leírásakor mindkettőt, valamint más statisztikai értékeket is ki kell számítani, ha csak egyet lehet használni, a medián jobb becslést adhat egy adott adatkészlet tipikus értékéről, ha az értékek között rendkívül nagy eltérések vannak.
Mode
a statisztikában a mód a legtöbb ismétlődéssel rendelkező adathalmaz értéke. Lehetséges, hogy egy adathalmaz multimodális legyen, ami azt jelenti, hogy egynél több üzemmóddal rendelkezik. Például:
2,10,21,23,23,38,38
mind a 23, mind a 38 kétszer jelenik meg, így mindkettő mód a fenti adatkészlethez.
hasonlóan az átlaghoz és a mediánhoz, a módot a véletlen változók és populációk információinak kifejezésére használják. Az átlagtól és a mediántól eltérően azonban a mód olyan fogalom, amely nem numerikus értékekre alkalmazható, mint például az élelmiszerboltból leggyakrabban vásárolt tortilla chips márka. Például a Tostitos, a Mission és a XOCHiTL márkák összehasonlításakor, ha kiderül, hogy a tortilla chips eladásakor a Xochitl a mód, és 3:2:1 arányban értékesít a Tostitos és a Mission márka tortilla chipshez képest, az arány felhasználható annak meghatározására, hogy az egyes márkákból hány zsák van raktáron. Abban az esetben, ha egy adott időszakban 24 zsák tortilla chips kerül értékesítésre, az üzlet 12 zsák XOCHiTL chipet, 8 Tostitos-t és 4 Mission-t tárolna, ha az üzemmódot használja. Ha azonban az üzlet egyszerűen átlagosan 8 zsákot adott el, akkor 4 eladást veszíthet, ha az ügyfél csak XOCHiTL chipeket szeretne, és nem más márkát. Amint az ebből a példából kitűnik, fontos figyelembe venni a statisztikai értékek minden módját, amikor következtetéseket próbálunk levonni bármely adatmintáról.
tartomány
a statisztikai adathalmaz tartománya a legnagyobb és a legkisebb érték közötti különbség. Bár a tartománynak különböző jelentése van a statisztika és a matematika különböző területein, ez a legalapvetőbb meghatározása, és ezt használja a mellékelt számológép. Ugyanazt a példát használva:
2,10,21,23,23,38,38
38 – 2 = 36
ebben a példában a tartomány 36. Az átlaghoz hasonlóan a tartományt jelentősen befolyásolhatják a rendkívül nagy vagy kis értékek. Ugyanazt a példát használva, mint korábban: