統計検定2級2017年6月 解答解説 問3(3)コレログラム




2017年6月実施の統計検定2級 問3(3)について解説したいと思います。

日本の「訪日外客数」の折れ線グラフと「訪日外客数の前年同月比伸び率」の折れ線グラフから、訪日外客数のコレログラムとして最も適切なものを1つ選ぶという問題。

「コレログラムって何??」という感じでしたが、公式問題集の2015年11月実施分の問6でコレログラムについての問題が出題されています。しかし、頻出な分野では無さそうだし、公式教科書でも「自己相関」だの「自己共分散関数」だの小難しい説明がされていて、他に参考書として使用していた本には出てこないので、マイナーな問題と考えて理解しないままにしていました。しかし、まんまと出題されてしまったわけで、35問しかない試験で1問落とすのは結構な痛手なので、とても悔やまれます。

さて、コレログラムとはどういったものかというと、横軸にラグ(時間差)、縦軸に自己相関係数をとったグラフです。

例として、以下のような、とある商品の1年間12か月分の売り上げのデータがあると考えます。

月数 1月 2月 3月 ・・・ 11月 12月
売上 10000円 15000円 14000円 ・・・ 12000円 13000円

コレログラムを作成するために、売上のデータを1月分(時間差)ずつずらして相関を求めていきます。
まず、ラグ(時間差)0の場合について考えます。X軸に基準となる月数の売上、Y軸に0月ずつずらした月数の売上(L0)をプロットして相関係数を求めます。

基準となる月数 1月 2月 3月 ・・・ 11月 12月
基準の月数の売上(X軸) 10000円 15000円 14000円 ・・・ 12000円 13000円
L0(Y軸) 10000円(1月分) 15000円(2月分) 14000円(3月分) ・・・ 12000円(11月分) 13000円(12月分)

この場合、X軸の値=Y軸の値となる散布図なので、回帰直線は45°の一直線となります。つまり、相関係数は1となります。

続いて、ラグ(時間差)1の場合について考えます。X軸に基準となる月数の売上、Y軸に1月ずつずらした月数の売上(L1)をプロットして相関係数を求めます。

基準となる月数 1月 2月 3月 ・・・ 11月
基準の月数の売上(X軸) 10000円 15000円 14000円 ・・・ 12000円
L1(1月分ずらした売り上げ)(Y軸) 15000円(2月分) 14000円(3月分) ・・・ 12000円(11月分) 13000円(12月分)

同様に時間差L2、L3・・という風に、データを時間差分ずらしたものと、基準のデータの相関係数を求めていきます。

そして時間差をX軸に、各時間差での相関係数をY軸にとってグラフとしたものがコレログラムとなります。
つまり、コレログラムはデータの周期性を確認するのに有効な方法です。例えば、4か月ごと全く同じ売り上げとなるという周期性があれば、時間差(X軸)が4の倍数となるときに相関係数(Y軸)が1となるコレログラムになります。3ヶ月毎に売り上げが減少するという周期性があれば、時間差Xが3の倍数のときに相関係数Yが負の値となるコレログラムとなります。
1週間で周期性のあるデータ、1年で周期性のあるデータなど、周期性のあるデータをコレログラムで表現すると周期性が理解しやすくなります。




今回の統計検定2017年6月実施分の問3(3)では、訪日外客数(アジア計)はおおまかにいって増加を続けており、また、12か月のデータの中で顕著な周期性は示していないことから、選択肢2は排除されます。選択肢2は1月ごとに増減を繰り返すデータを示しています。
また選択肢4は時間差が4の倍数で相関係数1となっていますが、これは4か月ごとに全く同じ値を示す周期性がある場合のコレログラムとなりますので、誤りです。
選択肢3については時間差0のとき以外は相関係数がとても小さい値となっていますが、折れ線グラフから訪日外客数は緩やかな増加傾向にあり、時間差が1、2などの場合に相関係数が0に近い値になるとは考えにくいので、選択肢3も除外できます。
よって、正解は選択肢1です。訪日外客数が緩やかに増加しているので、時間差が増加するにつれて、相関係数は小さくなっていくことがわかります。

統計検定2級の勉強 おすすめの本②




前回の投稿で統計検定2級の事前学習に使用した本を紹介しました。

続いて、実際に統計検定のための勉強に使用した本を紹介します。

  • 「日本統計学会公式認定 統計検定2級公式問題集 2014~206年」日本統計学会(編) 実務教育出版
  • 「改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎」日本統計学会(編) 東京図書

何はなくとも公式問題集は必須です。公式問題集で過去問を解くことが検定合格の一番の近道だと思います。公式の問題集は解説もしっかり記載されているので、基本的なことを理解していれば、解説の内容も理解できると思います。私は統計検定を受ける前に、2016年分(6月実施・11月実施)、2015年分(6月実施・11月実施)の2年分を2回解いて、2回目でも自信をもって解けなかった問題を3回解きました。正直言って解説を何度読んでも理解できない問題もありましたが、出題されやすい分野、毎回出題される分野などを理解することができますし、過去問で理解できた問題の類似の問題は、本番で落とさないようにすることが大事だと思います。

公式の教科書については、以前の投稿で紹介したような本と比べると決して分かりやすいものではなく、あまり使いませんでした。しかし、今年の問題でも出題されたコレログラムであったり、Rでの重回帰分析の出力結果の解釈など、一般的な統計学の教科書では説明されていないようなことについては、こちらの教科書で確認することが出来たので全く役に立たなかったわけでは無いし、持っていたほうが心強いかな。。と思います。ただし、コレログラムについては教科書の解説を読んでも全然理解できませんでしたので、今回出題されたコレログラムの問題は落としました。。

私は始めのうちは公式の問題集の解説を読んでも、一体どんな理由でその計算をしているのかサッパリ分からないという状態でした。公式の教科書も理解不能だし。。そんなときに参考書として活用したのは以下の本です。

  • 「まずはこの一冊から 意味がわかる統計学」石井俊全著 ベレ出版
  • 「まずはこの一冊から 意味がわかる統計解析」涌井貞美著 ベレ出版

どちらも同じ出版社から出版されている本で、内容も重なる部分がありますが、とても分かりやすく、この2冊を駆使して公式問題集の解説を解読しました。

「意味がわかる統計学」の方は、確率変数の計算や検定などの計算の過程を詳しく丁寧に解説されているので、問題集の解説で省略されている計算の過程を理解するのに役立ちました。また「意味がわかる統計解析」の方は、それぞれのテーマを比較的コンパクトに分かりやすく説明してあり、解説の解読に一番使用しました。また、ベイズ統計や分散分析など、「意味がわかる統計学」ではカバーできな分野についても説明されていて、統計検定2級の出題範囲をかなりカバーしている内容だと思います。




その他、分からない用語などはネットで調べるなどして、なんとか過去問を9割程度理解できた状態で試験に臨みました。

今後は自分なりの試験の攻略法や、今回の試験の解説なども記載していきたいと思います。

 

統計検定2級の勉強 おすすめの本①




私が統計検定2級の勉強を始めるにあたり、まず初めに基礎的な内容を理解するために読んだ本を紹介します。

普段、仕事でがっつり数式と向き合うような機会は滅多になく、学生時代からのブランクもあるため、基本的な内容から勉強するために、出来るだけ平易な説明をしてくれている本を探して概要を理解するようにしました。

始めに読んだのは以下の2冊です。

  • 「マンガでわかる統計学入門」滝川好夫著 新星出版社
  • 「完全独習 統計学入門」小島寛之著 ダイヤモンド社

統計学をマンガで解説した本はいくつかありますが、「マンガでわかる統計学入門」を選んだのはKindleでたまたま価格が安くなっていたからです。なので、他のマンガでの解説本とは比較していませんが、統計学の基礎的な内容や区間推定、検定について概要を理解するのは大変よい内容でした。図で解説されているので確率分布など文章や数式だけだと理解しにく部分も割とすんなりと理解することが出来ました。最近は統計学に限らず色々な分野のマンガがでていて、難しい内容も理解しやくなっているのは素晴らしいことだと思います。なんとなくマンガで勉強って年齢的に(?)周囲の人に見られるのが恥ずかしいような気がして外出先で読むのは憚れたのですが、タブレットで読めば外出先でも周りを気にせずに読めますし。

「完全独習 統計学入門」については、「”使うのは中学数学だけ”」ということで、とにかく平易な説明で書かれている本ということと、amazonでの評価がよいので選びました。標準偏差の説明にかなりのページを費やしているのですが、統計学を学び始めた頃は標準偏差って何の意味があるのかイマイチ掴めないという方も多いと思いますので、この本でみっちり標準偏差の意味について理解を深めることができます。また、区間推定や検定などの基本的な内容を難しい数式を使わずに説明されているので、数式を読むのが苦手な私でも苦痛を感じることなく読み進められました。

上記の2冊を読み終えて、統計学について大体のイメージを掴んだ後に、以下の本でより詳しく勉強することにしました。

  • 「入門 統計学 検定から多変量解析・実験計画法まで」栗原真一著 オーム社

上記の2冊と比べると、より教科書らしいおもむきで、難しいテーマに関する内容も含まれます。統計検定2級の範囲の大部分はカバーできている内容だと思います。しかし、「数式ばかりで何が何だか分からない」というような事はなく、出来るだけ理解しやすいように考慮して文章で説明されているので、読み進めるのを断念してしまうことはありませんでした。統計検定2級の範囲よりも進んだ内容もあるので、一度試験の範囲を確認したうえで、多変量解析に関する部分などは飛ばして読みました。t検定を繰り返し行うのではなく、分散分析を使う理由など、色々な手法の意味を解説されているので、理解が深まりました。




以上の3冊で統計学の概要を掴んで、その後は公式の問題集に取り組ました。問題集を解く際に参考書として使用した書籍などはまた別の投稿で紹介したいと思います。

統計検定2級(2017年6月18日)を受けました。




2017年6月18日(日)に統計検定2級を受験してきました。CBTではなく従来の紙で受ける試験で受けました。

試験後の感触としては自信をもって回答できた問題が6割ちょっとくらいだったので、ボーダーラインぎりぎりか、不合格か。。。という印象でした。

受験後に解答の速報などはないか調べてみましたが、速報などを出しているサイトは見つけられず、公式ホームページの新着情報の履歴を辿ると前回試験では試験の2日後に解答が公開されているようでした。

2日後の6月20日の午後4時ごろに確認すると解答が公開されていましたので、会社でこっそりと自己採点したところ、

35問中25問正解

ボーダーラインは60%程度ではないかと言われていますし、CBT方式試験では合格基準が60%以上と明記されていますので、約7割正解ならばマークミスなどがなければ合格出来たのではないかと思います。

意外な問題を間違えていたり、全く手が付けれらなかった問題などもあったので、詳しい解説などを見つけられたら復習したいと思います。

 

統計検定の2級の勉強時間は、私の場合は35時間程度と思います。

統計検定の勉強を始めるまでは、「標準偏差」「正規分布」とかの言葉の意味をなんとなくイメージで理解している程度。一応理系なのですが、普段の仕事で数式を見ることも書くこともなく、「定積分ってどうやって解くんだっけ。。?」というレベルでした。

勉強方法としては、統計学についてやさしく説明してある本や漫画を何冊か購入して、通勤時間や帰りにカフェなどで漫然と読むことに10時間くらいを費やし、なんとなく分かったような気になってきたところで試験の1週間前。

そろそろ実際の問題を解いてみようと考えて、公式の問題集に着手するも、ほとんど解けず。1問1問解答と参考書を見比べながら、解答の意味を理解するのにかなり時間がかかってしまい、試験1回分の問題を5時間くらいかけてなんとか9割くらいの問題の解答の意味を理解することができる程度。

その後、直近の4回分の過去問を2回ずつ解いて、ベイズや回帰分析などのよく出題される分野は解答を何度も見返して、結局過去問も1割くらいは解答を読んでも理解できていない状態での試験となりました。




今回はなんとか合格できたかと思いますが、統計は仕事でも活用できる場が多いので、今後も勉強して自分の得意分野にしていきたいと思います。

統計検定の準1級や1級、また統計の知識が必要になるQC検定などの資格にも挑戦したいと考えているので、統計学の勉強に関する記事は備忘録として今後投稿していきたいと思います。

2017年7月19日追記

統計検定2級の合格証が無事届きました。

ポストに突っ込まれてたので丸まってしまっていたので、厚紙とかで折れないようにしてあったらいいのになーと思いました。

とりあえず、合格できていてよかったです。