こんにちは。開発・デザイン部のAYです。
統計学って以前に比べて色々なところで耳にするようになりましたね。「統計学が最強の学問である」とか話題になりました。
私もチャンネル登録しているYoutuberさん「サトマイ」さんの「謎解き統計学 | サトマイ」。「確率・統計を使って世の中の謎を解く「リアル謎解き」を体験していただく、教育エンターテイメント番組」ということですがいつも楽しんで拝見させていただいています。
たとえばみんな知ってそうな話題でいくとこういうやつを取り扱う教育エンターテイメント。
統計学って字面がむずかしそうですよね
「学」ってついていると難しそうですし、「統計学」ってなると、勉強するの大変そうだなとか、使えるようになるのかなとか、思ってしまう一方、「最強」とか言われてるくらいですし良さげな感じはしますよね。
標準偏差(ひょうじゅんへんさ、(英: standard deviation, SD)とは、データや確率変数の、平均値からの散らばり具合(ばらつき)を表す指標の一つである。偏差ベクトルと、値が標準偏差のみであるベクトルは、ユークリッドノルムが等しくなる。
https://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE
標準偏差を2乗したのが分散であり、従って、標準偏差は分散の非負の平方根である[1]。標準偏差が 0 であることは、データの値が全て等しいことと同値である。
母集団や確率変数の標準偏差を σ で、標本の標準偏差を s で表すことがある。
二乗平均平方根 (RMS) を用いると、標準偏差は偏差の二乗平均平方根に等しくなる。
今回は、日本人ならほぼ全ての人が意識したことのある偏差値(標準偏差)について説明しつつ、統計学の一番最初の入り口として、興味を持っていただければと思いこの記事を書くことにしました。
偏差値と標準偏差について
端的に、「使いどころ」と、「使い方」について説明です。
使いどころ
何事もゴールがあることが大事。まずは使い道を説明します。
標準偏差でできることは、いくつもある数字データの中で、全体としてどのくらいばらつきがあるか、どの値がどのくらい特徴的(レア)か、というのがわかるようになります。
例えば、直近100回のボーリングのスコアデータがあって、平均が130、標準偏差が20だった場合、150のスコアを出したときは偏差値としては60で、レア度としてはおおよそ上位16%の数値、もし170だった場合偏差値としては70、レア度としてはおおよそ上位2.5%の数値、ということがわかります。
偏差値って受験の際はみんな使ってますから慣れているものと思いますし(好きか嫌いかは別として)、レア度が分かると、気になった時に色々使えそうですよね。
使い方
EXCELやスプレッドシートで簡単に利用できます。
たったこれだけ!
https://ness-kraft.jp/2023/07/10/sd_cal_gsheet/
- 空のセルを選択する
- =STDEV()と入力する
- ()内に、標準偏差を計算したい範囲を入力する
- Enterを押す
まとめ
統計ってよく耳にするけど、いまいち難しそうでとっかかりがなかった方向けに、お気に入りのサトマイさんのご紹介と標準偏差(偏差値)のお話でした。
(画像は陶芸)
文:開発部AY