geef Getallen gescheiden door komma om te berekenen.
Related Statistics Calculator / standaardafwijking Calculator / Sample Size Calculator
Mean
het woord mean, dat een homoniem is voor meerdere andere woorden in het Engels, is eveneens dubbelzinnig, zelfs op het gebied van de wiskunde. Afhankelijk van de context, wiskundig of statistisch, wat wordt bedoeld met de “gemiddelde” veranderingen. In zijn eenvoudigste wiskundige definitie met betrekking tot datasets, is het gemiddelde dat wordt gebruikt het rekenkundig gemiddelde, ook wel wiskundige verwachting Of gemiddelde genoemd. In deze vorm verwijst het gemiddelde naar een tussenwaarde tussen een afzonderlijke verzameling getallen, namelijk de som van alle waarden in de gegevensverzameling, gedeeld door het totale aantal waarden. De vergelijking voor de berekening van een rekenkundig gemiddelde is vrijwel identiek aan die voor de berekening van de statistische begrippen bevolking en steekproefgemiddelde, met geringe verschillen in de gebruikte variabelen:
het gemiddelde wordt vaak aangeduid als x, uitgesproken als “X bar,” en zelfs in andere toepassingen wanneer de variabele is niet x, de bar notatie is een gemeenschappelijke indicator van een bepaalde vorm van gemiddelde. In het specifieke geval van het bevolkingsgemiddelde wordt in plaats van de variabele x het Griekse symbool mu of μ gebruikt. Evenzo, of liever verwarrend, wordt het steekproefgemiddelde in de statistieken vaak aangegeven met een hoofdletter X. Gegeven de gegevensverzameling 10, 2, 38, 23, 38, 23, 21, toepassing van de optelling boven opbrengsten:
10 + 2 + 38 + 23 + 38 + 23 + 21
|
= | = 22.143 |
zoals eerder vermeld, is dit een van de eenvoudigste definities van het gemiddelde, en sommige andere omvatten het gewogen rekenkundig gemiddelde (dat alleen verschilt in dat bepaalde waarden in de gegevensverzameling bijdragen meer waarde dan andere), en geometrisch gemiddelde. Een goed begrip van bepaalde situaties en contexten kan een persoon vaak voorzien van de tools die nodig zijn om te bepalen welke statistisch relevante methode te gebruiken. In het algemeen moeten gemiddelde, mediaan, modus en bereik idealiter allemaal worden berekend en geanalyseerd voor een bepaalde steekproef of gegevensset, omdat zij verschillende aspecten van de gegeven gegevens ophelderen, en indien alleen beschouwd, kunnen leiden tot onjuiste voorstellingen van de gegevens, zoals in de volgende secties zal worden aangetoond.
mediaan
het statistische concept van de mediaan is een waarde die een gegevenssteekproef, populatie of kansverdeling in twee helften verdeelt. Het vinden van de mediaan impliceert hoofdzakelijk het vinden van de waarde in een gegevenssteekproef die een fysieke plaats tussen de rest van de aantallen heeft. Merk op dat bij het berekenen van de mediaan van een eindige lijst van getallen, de volgorde van de gegevens monsters is belangrijk. Conventioneel worden de waarden in oplopende volgorde weergegeven, maar er is geen echte reden dat het weergeven van de waarden in aflopende volgorde verschillende resultaten zou opleveren. In het geval dat het totale aantal waarden in een gegevenssteekproef oneven is, is de mediaan gewoon het getal in het midden van de lijst van alle waarden. Wanneer de gegevenssteekproef een even aantal waarden bevat, is de mediaan het gemiddelde van de twee middelste waarden. Hoewel dit verwarrend kan zijn, onthoud gewoon dat, hoewel de mediaan soms de berekening van een gemiddelde impliceert, wanneer dit geval zich voordoet, het slechts de twee middelste waarden zal impliceren, terwijl een gemiddelde alle waarden in de gegevenssteekproef impliceert. In de oneven gevallen waarin er slechts twee gegevensmonsters zijn of er een even aantal monsters is waarbij alle waarden hetzelfde zijn, zullen het gemiddelde en de mediaan hetzelfde zijn. Gegeven dezelfde gegevensverzameling als voorheen, zou de mediaan worden verkregen op de volgende manier:
2,10,21,23,23,38,38
na een opsomming van de gegevens in oplopende volgorde, en het bepalen dat er een oneven aantal waarden, is het duidelijk dat 23 is de mediaan gegeven dit geval. Als er een andere waarde aan de gegevensverzameling werd toegevoegd:
2,10,21,23,23,38,38,1027892
aangezien er een even aantal waarden zijn, is de mediaan het gemiddelde van de twee middelste getallen, in dit geval 23 en 23, waarvan het gemiddelde 23 is. Merk op dat in deze specifieke gegevensverzameling, de toevoeging van een uitschieter (een waarde die ver buiten het verwachte bereik van waarden ligt), de waarde 1.027.892, geen reëel effect heeft op de gegevensverzameling. Als echter het gemiddelde voor deze gegevensverzameling wordt berekend, is het resultaat 128.505.875. Deze waarde is duidelijk geen goede weergave van de zeven andere waarden in de gegevensverzameling die veel kleiner en dichter in waarde zijn dan het gemiddelde en de uitschieter. Dit is het belangrijkste voordeel van het gebruik van de mediaan bij het beschrijven van statistische gegevens in vergelijking met het gemiddelde. Terwijl beide, evenals andere statistische waarden, moeten worden berekend bij het beschrijven van gegevens, als slechts één kan worden gebruikt, kan de mediaan een betere schatting van een typische waarde in een gegeven gegevensverzameling bieden wanneer er extreem grote variaties tussen waarden zijn.
Mode
in statistieken is de modus de waarde in een gegevensverzameling met het hoogste aantal herhalingen. Het is mogelijk dat een dataset multimodaal is, wat betekent dat het meer dan één modus heeft. Bijvoorbeeld::
2,10,21,23,23,38,38
zowel 23 als 38 verschijnen elk twee keer, waardoor ze beide een modus voor de data set hierboven.
net als gemiddelde en mediaan wordt de modus gebruikt als een manier om informatie over willekeurige variabelen en populaties uit te drukken. In tegenstelling tot gemiddelde en mediaan echter, de modus is een concept dat kan worden toegepast op niet-numerieke waarden, zoals het merk van tortilla chips meestal gekocht bij een supermarkt. Bijvoorbeeld, bij het vergelijken van de merken Tostitos, missie, en XOCHiTL, als blijkt dat in de verkoop van tortilla chips, XOCHiTL is de modus en verkoopt in een 3:2:1 verhouding in vergelijking met Tostitos en missie merk tortilla chips respectievelijk, de verhouding kan worden gebruikt om te bepalen hoeveel zakken van elk merk op voorraad. In het geval dat 24 zakken tortilla chips verkopen tijdens een bepaalde periode, de winkel zou voorraad 12 zakken XOCHiTL chips, 8 van Tostitos, en 4 van de missie als het gebruik van de modus. Als echter de winkel gewoon gebruikt een gemiddelde en verkocht 8 zakken van elk, het zou mogelijk verliezen 4 verkopen als een klant wilde alleen Xochitl chips en niet een ander merk. Zoals blijkt uit dit voorbeeld, is het belangrijk om rekening te houden met alle manieren van statistische waarden bij het proberen om conclusies te trekken over een gegevenssteekproef.
bereik
het bereik van een gegevensverzameling in statistieken is het verschil tussen de grootste en de kleinste waarden. Hoewel bereik verschillende betekenissen heeft binnen verschillende gebieden van statistiek en wiskunde, is dit de meest fundamentele definitie, en is wat wordt gebruikt door de meegeleverde rekenmachine. Met hetzelfde voorbeeld:
2,10,21,23,23,38,38
38 – 2 = 36
het bereik in dit voorbeeld is 36. Net als het gemiddelde kan het bereik aanzienlijk worden beïnvloed door extreem grote of kleine waarden. Gebruikmakend van hetzelfde voorbeeld als voorheen: