四分位数&Boxes5-数値の要約Iqrs&外れ値
Purplemath
“四分位間範囲”は、”IQR”と略され、箱とひげのプロットの箱の幅です。 すなわち、IQR=Q3−Q1である。 IQRは、値がどのように拡散されているかの尺度として使用できます。
統計は、値が中心値の周りにクラスタ化されていることを前提としています。 IQRは、”中間”の値がどのように広がっているかを示します; また、他の値のいくつかが中央値から「遠すぎる」ときに伝えるために使用することもできます。 これらの「遠すぎる」点は、私たちが期待する範囲の外に「ある」ため、「外れ値」と呼ばれます。
IQRはボックス-アンド-ウィスカー-プロットのボックスの長さです。 外れ値は、ボックスの両端からボックスの長さの1.5倍以上の値です。
MathHelp.com
つまり、データポイントがQ1–1.5×IQRより下またはQ3+1.5×IQRより上にある場合、それは合理的であるには中心値から遠すぎると見なされます。 たぶん、あなたはその一つの測定をしていたときに体重計をぶつけた、または多分あなたの研究室のパートナーは馬鹿であり、あなたは彼が機器のいずれか 誰が知ってる? しかし、その原因が何であれ、外れ値は「適合」していないように見える点です。
外れ値のボックスの幅の1.5倍はなぜですか? その特定の値が”許容可能な”値と”許容できない”値の違いをマークするのはなぜですか? なぜなら、John Tukeyが1977年にこれらの値を表示するためにbox-and-whiskerプロットを発明していたとき、彼は外れ値の脱標線として1.5×IQRを選んだからです。 これはうまくいったので、私たちはそれ以来その価値を使い続けてきました。 さらに統計に進むと、ベルカーブ型のデータの合理性の尺度は、通常、データの約1%が外れ値になる可能性があることを意味します。
以下のMathwayウィジェットを使用して、”H-spread”とも呼ばれる四分位間の範囲を見つける練習をすることができます(またはウィジェットをスキップしてレッスン 入力した運動を試してみるか、自分の運動を入力してください。 次に、ボタンをクリックして下にスクロールして、「四分位間範囲(H-Spread)を見つける」をクリックして、あなたの答えをMathwayのものと比較します.
このウィジェットを有効にするには、”環境設定”cookieを受け入れてください。
(“タップしてステップを表示する”をクリックして、有料アップグレードのためにMathwayサイトに直接移動します。)
IQRを見つけるのが快適になったら、外れ値がある場合は、外れ値を見つけることに進むことができます。
-
次のデータセットの外れ値がある場合は、その値を求めます:
10.2, 14.1, 14.4. 14.4, 14.4, 14.5, 14.5, 14.6, 14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4
外れ値があるかどうかを調べるには、まずIQRを見つける必要があります。 15個のデータポイントがあるので、中央値は8番目の位置になります:
(15 + 1) ÷ 2 = 8
その後、Q2=14.6。
中央値の両側には7つのデータポイントがあります。 二つの半分は次のとおりです:
10.2, 14.1, 14.4. 14.4, 14.4, 14.5, 14.5
…と:
14.7, 14.7, 14.7, 14.9, 15.1, 15.9, 16.4
Q1はリストの4番目の値で、リストの前半の中間値であり、Q3はリストの後半の中間値である12番目の値です:
Q1=14.4
Q3= 14.9
次に、IQRは次のように与えられます。:
IQR=14.9–14.4=0.5
外れ値は、Q1–1.5×IQR=14.4–0.75=13.65より下またはQ3+1.5×IQR=14.9+0.75=15.65より上の任意の点になります。
次に、外れ値は次のようになります。:
10.2, 15.9, と16.4
内容は以下の通りです
Q1–1.5×IQRおよびQ3+1.5×IQRの値は、外れ値から”合理的な”値をマークする”フェンス”です。 外れ値はフェンスの外にあります。
外れ値だけでなく「極値」も考慮するように割り当てられている場合、Q1–1の値。5×IQRおよびQ3+1.5×IQRは「内側」のフェンスであり、Q1–3×IQRおよびQ3+3×IQRの値は「外側」のフェンスです。
外れ値(アスタリスクまたは開いたドットでマーク)は内側と外側のフェンスの間にあり、極値(外れ値に使用しなかったシンボルでマーク)は外側のフェン
ところで、あなたの本は”1.5×IQR”の値を”ステップ”として参照しているかもしれません。 次に、外れ値はヒンジから1〜2ステップの間の数値になり、極端な値はヒンジから2ステップ以上の数値になります。
前の例をもう一度見ると、外側のフェンスは14.4–3×0.5=12.9、14.9+3×0.5=16.4になります。 16.4は上の外側のフェンスにあるので、これは外れ値であり、極端な値ではないと考えられます。 しかし、10.2は完全に下の外側のフェンスの下にあるので、10.2は極端な値になります。
アフィリエイト
グラフ計算機は、箱ひげ図に外れ値が含まれているかどうかを示している場合とそうでない場合があります。 たとえば、上記の問題には、外れ値としてポイント10.2、15.9、および16.4が含まれています。 私のグラフ電卓の一つの設定は、五数の要約のみを使用する単純なボックスとウィスカーのプロットを与えるので、最も遠い外れ値はウィスカーの端点:
別の電卓設定では、外れ値が特別にマークされた箱とひげプロットが表示されます(この場合は、開いたドットのシミュ:
私の電卓は、外れ値と極値を区別しません。 あなたもそうではないかもしれません。 次のテストの前にあなたの所有者マニュアルを、今点検して下さい。
グラフ電卓を使用してこれらのプロットを支援している場合は、使用する設定と結果の意味を知っているか、電卓が完全に正しいが”間違った”答えを与える可能性があることを確認してください。
-
次のデータセットの外れ値と極値(存在する場合)を求め、ボックスとひげのプロットを描画します。 外れ値にはアスタリスクを付け、極値には開いた点を付けます。
21, 23, 24, 25, 29, 33, 49
広告
外れ値と極値を見つけるには、まずIQRを見つける必要があります。 リストには7つの値があるので、中央値は4番目の値です。:
第2四半期= 25
リストの前半は:
21, 23, 24
…だからQ1=23;後半は:
29, 33, 49
…だからQ3=33。 次に、IQRは次のように与えられます。:
= 33 – 23 = 10
外れ値は、以下の任意の値になります:
23 – 1.5×10 = 23 – 15 = 8
…またはそれ以上に:
33 + 1.5×10 = 33 + 15 = 48
極端な値は以下の値になります:
23 – 3×10 = 23 – 30 = -7
…またはそれ以上に:
33 + 3×10 = 33 + 30 = 63
だから私は49で外れ値を持っていますが、極端な値はありません。 Q3も最高の非外れ値であるため、私は私のプロット上のトップウィスカーを持っていません。 だから私のプロットは次のようになります:
上記で概説した方法、用語、およびルールは、私が教えてきたものであり、私が最も一般的に教えて見たものであることに留意すべきである。 ただし、コースには異なる特定のルールがある場合や、計算機の計算方法が若干異なる場合があります。 あなたのカリキュラムに特定の答えを見つけることで幾分適用範囲が広い必要がある場合もある。
: https://www.purplemath.com/modules/boxwhisk3.htm
1ページ目2ページ目3ページ目