2013年8月2日

「平均」而言「平均」知多少

我們從小以平均定名次,平均處處可見,但「平均」知多少呢?

作者/陳昱成(任教高雄市立中山高中)

生活中常被一堆的數據淹沒,而不知所措。面對浩瀚的「數海」,需要一個代表整體集中趨勢的數字,讓我們對資料有個輪廓,而最常使用的數字,就是「平均」(average)。 政治人物常掛著「平均」國民所得要突破多少,「平均」經濟成長必須達到多少,才會比鄰國好,好像不如此,就不是在拼經濟。學生要算出月考「平均」,好定排名,未來申請高中或大學可能會用到。而報章雜誌報導的「平均」,更是不勝枚舉:某公司年終獎金「平均」是十幾個月,稱之為「幸福企業」讓上班族趨之若鶩;其他如每人「平均」有幾個門號;國民「平均」身高;每天「平均」運動時間;上班「平均」通勤時間;甚至統計「平均」塞車時間。時常看到政府利用一個簡單的數字,來解釋整體的趨勢,並作為施政的績效,宣稱讓數字說話,但數字說的話大家都懂嗎?

哪一家是幸福企業—用平均來證明?
假設有兩公司,競爭所謂的幸福企業。甲公司只有五個員工,分別是執行長郭董、李經理,以及林課長與陳、許兩職員;年薪分別為一億元、伍佰萬、一百萬、六十萬與五十萬。

乙公司則擁有九名員工,分別是CEO陳年薪四千五百萬,二位經理九百萬,中間幹部四人均為一百八十萬,兩位基層業務為45萬。

如果說一個公司的員工「平均」薪資是評斷幸福企業最重要的指標,則這兩家企業到底誰是幸福企業?

一般所提的「平均」(average), 第一個直接的想法就是數學的算術平均數(Arithmetic mean),一般化的算法為:
,為x1, x2, x3,…n筆資料的算術平均數。

所以甲公司的平均年薪為:(10000 + 500 + 100 + 60 +50)/5 = 2142(萬);而乙公司的平均年薪為:(4500 + 900+ 900 + 180 + 180 + 180 +180 + 45 + 45)/9 = 790(萬),根據算術平均數,甲企業是比較幸福的。

但故事總不會就此而停,輸的公司常會不服氣,像乙公司就可能會抱怨,還不是甲公司的CEO郭董薪資太高,拉高了「平均」。如果以中位數(median)來看,甲公司的中位數為100萬,而乙公司的中位數為180萬,乙公司取得領先。但什麼是「中位數」?可以當作平均嗎?

所謂的中位數,即將數字從小排到大,排序中間的數就是中位數。至於中位數可否當作「平均」,看一下每年牽動數十萬學測考生的大學學科能力測驗的成績一覽表,其中有個欄位寫著「均標」,顧名思義可解釋為所有考生的「平均」標準。根據中心對均標的解釋為:「成績位於第50百分位數之考生級分」,這種平均不是算術平均,是統計上的中位數(median)。中位數可不僅入學考試做為平均使用,底下是一個以中位數當做平均的有趣例子。

媒體(民視新聞2011/07/10)在網路上的一則新聞,說到「七年之癢」的形容詞,恐怕要改一改了!「七年之癢」形容夫妻婚後第7年,婚姻易出問題。媒體根據內政部統計資料,指出台灣的離婚「中位數」,從2001年落在7.48年,到2009年達到最高點,已變成8.7年,由此稱八年之癢或許更為合適!

再回到前一個話題,如果採用中位數做為「平均」,乙公司就領先了甲公司,這時幸福企業的頭銜拱手讓人,甲公司當然不服。於是發言人對乙公司喊話:

「想想從小到大月考名次如何排定,國、英、數三科總分最高,不見得是第一名,因為要按照各科的上課的時數,來「加權」算平均,月考平均即是所謂的加權平均數(Weighted mean),本(甲)公司,郭董持股比例最高,按加權平均的概念來算,公司的「平均」年薪,一定要比以算術平均數算出的「平均」還要高,乙公司根據加權平均來算,不可能超越本公司,幸福企業應該由本公司獲得才算實至名歸。」

如果依加權平均來比較,乙公司又屈下風了!這時乙公司發言人,豈能作壁上觀,又不甘示弱的出來發言:「甲公司薪資的標準差為4396.74萬元,本公司為1431.204萬元,標準差為衡量資料內離散程度的數據,甲公司的『貧富差距』比敝公司大,怎能算是幸福企業呢?孔子曾有言,不患寡而患不均,甲公司的不均程度比敝公司嚴重,我們乙公司才能算是幸福企業啊!」

  接著乙公司又補上一槍,繼續說道:「根據諾貝爾經濟學得主馬可維茲(Markowitz)的投資組合理論(profolio theory),最適合的投資是要在相同的風險下,有最大的報酬率,而其所提的風險是利用標準差來當指標,報酬率是用平均來求出,也就是說,考慮平均的比較不能沒有標準差的介入。」

從國小開始,「平均」在數學課本就不曾缺席,最先接觸的「平均」,應該就是所謂的「算術平均數」。例如有兩桶容量一樣的水桶,均裝滿水,其中一桶的溫度是攝氏25 度,另一桶為35度,則「平均」水溫為:(25+ 35)/2 = 30,這就是「算術平均數」。但如果改成一桶水是攝氏60度,另一桶為0度,「平均」雖然還是30度,但其代表性,很顯然比前面的例子還差,因為此例的原始資料的離散程度比較大。在比較資料的離散程度,最常使用的指標就是「標準差」,為離均差平方的平均再開根號,一般表示法為:
,其中 為x1, x2, x3…n筆資料的算術平均數。【更詳細的內容,請參閱第524期科學月刊】

沒有留言: