この度、無事に第2回データサイエンティスト検定リテラシーレベルに合格しましたので、学習方法などを共有しようと思います。
バックグラウンド
20年前に私立文系(早稲田大学商学部)を卒業しました。大学受験で数学を選択したので、当時高校2年生までの数学は勉強しました。社会人になってから大学数学の教養レベル(偏微分・固有値ベクトルを求めるぐらいはできる)を学習しましたが、本試験で必須な知識はないです。
統計検定2級(PBT/CBT)に合格していたので、データサイエンス力で問われる「基礎数学」「データの理解・検証」「推定・検定」の分野は対応しやすかった。
中小企業診断士を取得しているので、1次試験で問われた経営情報システムの試験範囲である、データエンジニアリングの「データベース」「ITセキュリティ」の分野は対応しやすかった。
モチベーション
データサイエンスの勉強を5年前から始めて、3年前に統計検定2級を取得しました。その後、統計検定準1級の取得を目指して勉強をしていましたが、私立文系卒にはハードルがなかなか高く歯が立たない状況でした。そこで、もう少し現在の自分のレベルに合った学習をして基礎力を高めようと思いデータサイエンティスト検定リテラシーレベルの受験しようと思った経緯です。
試験について
・全国の試験会場で受験可能です。自分で試験会場を選んで受験日時を決めます。
・問題数は90問で試験時間は90分なので平均1問1分程度です。
・合格基準は非公開ですが、おおむね70%〜80%程度の正答率と想定(公式リファレンスブックより)されています。
学習方法
本試験の1ヶ月前から試験対策に取り掛かりました。学習教材は、最初にインプレス社が出版している「データサイエンティスト検定問題集 リテラシーレベル対応」に取り組みました。第1章から第7章までは本試験で問われる分野別に問題と解答があります。解答はテキストぐらい詳しく書いてあります。そして、第8章に総仕上げの問題が90問掲載されています。この問題がおおよそ7割から8割程度の正答率が合格の目安になると思います。間違えた問題は解説を読み、わからないければ該当分野をネット検索で理解するようにしました。総仕上げ問題は、90問中77問(正答率85%)で本試験に臨みました。解答時間は88分でした。
その後、本試験までまだ1週間程度あったので、技術評論社が出版している「データサイエンティスト検定リテラシーレベル公式リファレンスブック」の目次を見て、未学習のテーマの該当ページを理解するようにしました。本試験では試験範囲にあるすべてのカテゴリー(テーマ)が問われるわけでないです。上で紹介した2冊の書籍で見たことがない初見の問題も2割程度出題されますが、問題集で7割から8割程度の正答率であれば対応できると思います。試験時間も1問1分ですので、タイムマネジメントを特別意識する必要はないと思います。
「公式リファレンスブック」をやってから「問題集」をやる人の方が多いと思いますが、試験まで時間が少ない人や短期間で試験対策を終わらせたい人は、インプレス社の「問題集」から取り掛かる方が私は効率的だと思います。
反省点
データサイエンティスト検定リテラシーレベルで問われる分野や多岐に渡りますので、最初に苦手な分野を洗い出してそこを重点的に学習した方がよいと思います。私は、問題集で最初から順番に問題を解きましたが苦手な分野は時間が新しい知識を理解するのに時間がかかりました。
最後に
データサイエンティスト検定リテラシーレベルは初学者レベルですが、データサイエンスの全体像を理解するために試験勉強をすることは有効だと思います。ただ、 PythonやRを使ったデータ分析などは試験範囲外ですので、データサイエンティストを目指す人は別で勉強する必要があると思います。データサイエンティスト検定の上位試験では、今後PythonやRを用いたデータ分析に関するコードや知識が問われるのかもしれません。