Box Plot
盒鬚圖




程式作者:Rebecca Su     資料來源:統計生活館
[優點] 最適宜提供資料的位置和分布之資訊
[缺點] 作法較繁瑣
[作法]
盒鬚圖又稱為箱形圖,其繪製須使用常用的統計量,最適宜提供有關資料的位置和分散的參考,尤其在不同的母體資料時更可表現其差異,首先介紹常用的統計量 :
 。 平均數
 。 中位數
 。 百分位數
 。 四分位數
 。 全距
 。 四分位距
 。 變異數和標準差
 。 盒鬚圖的繪製
 
  1. 平均數:
    樣本平均數 ( 樣本統計量 ):
     
    母體平均數 ( 母體參數 ):
     
    基本上,樣本平均數即是樣本資料的『中心位置』
    例如:
    13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22


  2. 中位數:
    資料經由遞增或遞減的排序後:
    。 如果n為奇數,則中位數為中間值。
    。 如果n為偶數,則中位數為中間兩個值的平均數。
    注意:樣本平均數對極端值比樣本中位數對極端值來的敏感
    如下例資料所示, 1 3 5 7 9 2 4 6 8 100 則中位數為 5.5,但平均數卻變為 14.5,相差很大。
    例如: 12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31
    中位數 : (32+33)/ 2 = 32.5

  3. 百分位數:
    第p 個樣本百分位數是某一個數值,使得樣本中有 p 部分的觀察值小於或等於
    求第p 個百分位數的程序:
    1. 將資料由小到大排序。
    2. 計算第個位置
    3. 。 假如 i 不為整數,則取下一個比i 還要大的值,即為第 p 個百分位數。
     。 假如 i 為整數,則第p 個百分位數為第 i 和i+1的平均。
    注意:第50個百分位數 = 中位數

  4. 四分位數:
    當將資料區分為4個部份,這些區分的點即稱為四分位數。
    即為:
     *第一四分位數或第25個百分位數
     第二四分位數或第50個百分位數
     第三四分位數或第75個百分位數
    例如:
     12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31
     第一個四分位數,故取第3和第4位數的平均
     即Q1 = 29.5

  5. 全距:
    全距 = ( 資料的最大值 ) - ( 資料的最小值 )
    例如:
     甲班13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22 => 20
     乙班12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31   => 20
    注意:全距易受極端值的影響

  6. 四分位距:
    四分位距為第一個四分位數和第三個四分位數的差。
    IQR = Q3 -Q1

  7. 變異數和標準差:
    母體的變異數即為母體離差的平方和
      
    而樣本的變異數即為樣本離差的平方和
      
    例如:
     13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22
     
     則 s2 = 33.42

  8. 盒鬚圖之繪製方法:
    盒鬚圖即是提供下面五個常用的統計量,可以提供探討資料重要的位置和分散資訊
      。 最小值
      。 第一四分位數 Q1
      。 中位數 Md
      。 第三四分位數 Q3
      。 最大值 Max
      。 平均數
    1. 簡易盒鬚圖
     甲班 13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22
     乙班 12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31
     
     中間的*即是 平均數

    2. 完整盒鬚圖
     
     注意:資料在最小上限和最大上限之外稱為極端值。

《程式》      《目錄》      《首頁》