Interkvartilintervall & Outliers

kvartiler & Boxes5-nummer Sammanfattningiqrs & Outliers

Purplemath

”interquartile range”, förkortat ”IQR”, är bara bredden på lådan i box-and-whisker-tomten. Det vill säga IQR = Q3 – Q1 . IQR kan användas som ett mått på hur spridda värdena är.

statistik förutsätter att dina värden är grupperade runt något centralt värde. IQR berättar hur spridda” mitten ” värdena är; det kan också användas för att berätta när några av de andra värdena är ”för långt” från det centrala värdet. Dessa” för långt borta ”punkter kallas ”outliers”, eftersom de” ligger utanför ” det område där vi förväntar oss dem.

IQR är längden på lådan i din box-and-whisker-plot. En outlier är något värde som ligger mer än en och en halv gånger längden på lådan från vardera änden av lådan.

innehållet fortsätter nedan

MathHelp.com

Box och morrhår tomter på MathHelp.com

det vill säga, om en datapunkt är under Q1 – 1,5 IQR eller över Q3 + 1,5 IQR, anses den vara för långt från de centrala värdena för att vara rimlig. Kanske stötte du på vägskalan när du gjorde den mätningen, eller kanske är din labbpartner en idiot och du borde aldrig ha låtit honom röra vid någon av utrustningen. Vem vet? Men oavsett deras orsak är avvikelserna de punkter som inte verkar ”passa”.

varför en och en halv gånger bredden på lådan för avvikarna? Varför skiljer det specifika värdet skillnaden mellan” acceptabla ”och” oacceptabla ” värden? För när John Tukey uppfann box-and-whisker-tomten 1977 för att visa dessa värden, valde han 1,5 hektar IQR som demarkationslinjen för outliers. Detta har fungerat bra, så vi har fortsatt att använda det värdet sedan dess. Om du går längre in i statistiken kommer du att upptäcka att detta mått på rimlighet, för klockkurvformade data, innebär att vanligtvis bara kanske så mycket som ungefär en procent av data någonsin kommer att vara outliers.

du kan använda Mathway-widgeten nedan för att öva på att hitta Interkvartilintervallet, även kallat ”H-spread” (eller hoppa över widgeten och fortsätt med lektionen). Prova den inmatade övningen, eller skriv in din egen övning. Klicka sedan på knappen och bläddra ner till ”Hitta Interkvartilintervallet (H-Spread)” för att jämföra ditt svar på Mathways.

vänligen acceptera” preferences ” cookies för att aktivera denna widget.

(klicka på ”tryck för att visa steg” för att tas direkt till Mathway-webbplatsen för en betald uppgradering.)

när du är bekväm att hitta IQR kan du gå vidare till att hitta avvikelserna, om några.

  • hitta eventuella avvikelser för följande datamängd:

10.2, 14.1, 14.4. 14.4, 14.4, 14.5, 14.5, 14.6, 14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4

för att ta reda på om det finns några avvikare måste jag först hitta IQR. Det finns femton datapunkter, så medianen kommer att vara på åttonde plats:

(15 + 1) ÷ 2 = 8

sedan Q2 = 14,6.

det finns sju datapunkter på vardera sidan av medianen. De två halvorna är:

10.2, 14.1, 14.4. 14.4, 14.4, 14.5, 14.5

…och:

14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4

Q1 är det fjärde värdet i listan, som är mittvärdet för den första halvan av listan; och Q3 är det tolfte värdet, som är mittvärdet för den andra halvan av listan:

Q1 = 14,4

Q3 = 14.9

sedan ges IQR av:

IQR = 14,9-14,4 = 0.5

Outliers kommer att vara några punkter under Q1 – 1.5 oc IQR = 14.4 – 0.75 = 13.65 eller över Q3 + 1.5 oc IQR = 14.9 + 0.75 = 15.65.

då är avvikelserna vid:

10.2, 15.9, och 16.4

innehållet fortsätter nedan

värdena för Q1-1.5 IQR och Q3 + 1.5 IQR är ”staket” som markerar de ”rimliga” värdena från outlier-värdena. Outliers ligger utanför staketet.

om din uppgift har du överväga inte bara avvikare utan också ”extrema värden”, då värdena för Q1 – 1.5st IQR och Q3 + 1,5st IQR är de” inre ” staketen och värdena för Q1 – 3st IQR och Q3 + 3st IQR är de ”yttre” staketen.

avvikelserna (markerade med asterisker eller öppna prickar) ligger mellan de inre och yttre staketet, och de extrema värdena (markerade med vilken symbol du inte använde för avvikelserna) ligger utanför de yttre staketet.

förresten, din bok kan hänvisa till värdet av ” 1.5 Ukrainian IQR ”som ett”steg”. Då kommer avvikelserna att vara siffrorna som ligger mellan ett och två steg från gångjärnen, och extremt värde kommer att vara siffrorna som är mer än två steg från gångjärnen.

om man tittar igen på föregående exempel skulle de yttre stängslen vara vid 14,4-3 kg 0,5 = 12,9 och 14,9 + 3 kg 0,5 = 16,4. Eftersom 16.4 är rätt på det övre yttre staketet, skulle detta anses vara en outlier, inte ett extremt värde. Men 10.2 är helt under det nedre yttre staketet, så 10.2 skulle vara ett extremt värde.

Affiliate

Affiliate

din grafräknare kan eller kanske inte ange om en box-and-whisker-plot innehåller avvikare. Till exempel inkluderar ovanstående problem punkterna 10.2, 15.9 och 16.4 som avvikare. En inställning på min grafkalkylator ger den enkla box-and-whisker-tomten som endast använder sammanfattningen med fem nummer, så de längsta avvikelserna visas som slutpunkterna för whiskers:

kalkylatorplot utan avvikare

en annan kalkylatorinställning ger box-and-whisker-plottet med avvikelserna speciellt markerade (i det här fallet med en simulering av en öppen punkt) och whiskersna går bara så långt som de högsta och lägsta värdena som inte är avvikare:

calculator plot med outliers

min räknare gör ingen skillnad mellan outliers och extrema värden. Din kanske inte heller. Kontrollera din bruksanvisning nu, innan nästa test.

om du använder din grafräknare för att hjälpa till med dessa tomter, se till att du vet vilken inställning du ska använda och vad resultaten betyder, eller räknaren kan ge dig ett helt korrekt men ”fel” svar.

  • hitta eventuella extremvärden och extremvärden för följande datamängd och rita box-and-whisker-diagrammet. Markera eventuella avvikelser med en asterisk och eventuella extrema värden med en öppen punkt.

21, 23, 24, 25, 29, 33, 49

annons

för att hitta extremvärden och extrema värden måste jag först hitta IQR. Eftersom det finns sju värden i listan är medianen det fjärde värdet, så:

Q2 = 25

första halvan av listan är:

21, 23, 24

…så Q1 = 23; den andra halvan är:

29, 33, 49

…så Q3 = 33. Sedan ges IQR av:

IQR = 33 – 23 = 10

avvikelserna kommer att vara några värden nedan:

23 – 1.5×10 = 23 – 15 = 8

…eller högre:

33 + 1.5×10 = 33 + 15 = 48

de extrema värdena kommer att vara de nedan:

23 – 3×10 = 23 – 30 = -7

…eller högre:

33 + 3×10 = 33 + 30 = 63

så jag har en outlier på 49 men inga extrema värden. Jag kommer inte att ha en topp whisker på min tomt eftersom Q3 också är den högsta icke-outlier. Så min plot ser ut så här:

 box-och-morrhår tomt

det bör noteras att metoderna, termer, och regler som beskrivs ovan är vad jag har lärt och vad jag har oftast sett lärt. Din kurs kan dock ha olika specifika regler, eller din räknare kan göra beräkningar lite annorlunda. Du kan behöva vara något flexibel för att hitta de svar som är specifika för din läroplan.

webbadress: https://www.purplemath.com/modules/boxwhisk3.htm

sida 1sida 2sida 3

Lämna ett svar

Din e-postadress kommer inte publiceras.

More: