データを一つの数で要約したいとき、私たちは『代表値(平均)』を使います。代表値には平均値・中央値・最頻値の三つがあり、データの中心をそれぞれ違う方法で表します。また、データの散らばり具合を表すのが範囲です。このページでは、これら四つの量の求め方、度数分布表から平均を計算する方法()、状況に応じた最適な代表値の選び方、そして二つのデータの組を代表値と範囲を使って比較する方法を学びます。
When we want to summarise a data set with a single number, we use an average. There are three averages — the mean, the median and the mode — each describing the centre of the data in a different way. The range describes how spread out the data is. On this page you will learn how to find all four quantities, how to calculate the mean from a frequency table using , how to choose the best average for a situation, and how to compare two data sets using an average and the range.
Mean, median, mode and range
平均値(mean)はすべての値を合計し、個数で割った値です。中央値(median)はデータを小さい順に並べたときの真ん中の値で、個数が偶数のときは中央の二つの平均をとります。最頻値(mode)は最も多く現れる値で、なければ『なし』とします。範囲(range)は最大値から最小値を引いた値で、データの散らばりを表します(範囲は代表値ではありません)。
The mean is the total of all the values divided by how many there are. The median is the middle value when the data is arranged in order; if there is an even number of values, take the mean of the two middle ones. The mode is the value that occurs most often (if none repeats, there is no mode). The range is the largest value minus the smallest, and it measures spread (the range is not an average).
Finding the mean from a frequency table
同じ値が何回も現れるとき、度数分布表でまとめると平均が効率よく求められます。各値 にその度数 をかけた を全部足し()、度数の合計 (=データの総数)で割ります。 は全部の値の個数、 は全部の値の合計に等しいことに注意すると、これは平均の定義そのものだとわかります。
When the same values occur many times, a frequency table lets you find the mean efficiently. Multiply each value by its frequency to get , add these up to get , then divide by the total frequency (the number of data values). Note that is the number of values and is the total of all the values, so this is exactly the definition of the mean.
Choosing the best average
三つの代表値にはそれぞれ長所と短所があります。平均値はすべての値を使いますが、極端に大きい・小さい値(外れ値)に強く影響されます。中央値は外れ値の影響を受けにくく、偏ったデータに向いています。最頻値は『最も売れたサイズ』のような最も人気のある値や、文字データに使えます。どれを使うかは、データの性質と目的によって選びます。
Each average has strengths and weaknesses. The mean uses every value but is heavily affected by extreme values (outliers). The median is resistant to outliers and is better for skewed data. The mode is useful for the most popular value, such as the best-selling size, and works for non-numerical data. Which one to use depends on the data and the purpose.
Comparing two data sets with an average and the range
二つのデータの組を比べるときは、代表値(中心の位置)と範囲(散らばり)の両方を見ます。代表値が大きいほうが『全体的に大きい・成績がよい』、範囲が小さいほうが『安定している・ばらつきが少ない』と解釈できます。試験では必ず数値を引用し、文脈に沿って二点(中心と散らばり)を述べると得点になります。
To compare two data sets, look at both an average (the location of the centre) and the range (the spread). A higher average means the values are generally larger or the performance is better; a smaller range means the data is more consistent or less variable. In exams, always quote the numbers and make two comparisons — one about the centre and one about the spread — in context.
Worked examples
Practice
南数塾は、Cambridge Primary / IGCSE / A-Level の各単元を、日本式の分かりやすさと英語の数学用語の両面から指導します。無料体験からどうぞ。