別記事「私のデータサイエンティスト検定合格の軌跡 ~ 何時間勉強した?どうやって対策したの?」では、著者のデータサイエンティスト検定リテラシーレベル(以下DS検定)の合格の軌跡を紹介しました。
著者は、2冊の教材を用い学習&試験対策を行いましたが、その模擬試験や問題集のスコア(正答数)を記録しながら学習を進めておりました。
ということで、今回の記事は、
- DS検定合格者の、最終的な公式本&黒本の正答率に興味がある
- DS検定合格者の、公式本&黒本の正答率の推移に興味がある
という人に向けて、「DS検定は公式本&黒本でどの程度のスコアを採れば合格できるか?」と題して、著者がDS検定合格までに用いた教材の、実際の正答率スコアの推移と、その結果を振り返ってみた内容を紹介していきます。
DS検定は公式本&黒本でどの程度のスコアを採れば合格できるか?
DS検定学習で用いた2冊の教材
著者は次の2冊を用い、DS検定の学習を行いました。
- 技術評論社出版「最短突破データサイエンティスト検定
(リテラシーレベル) 公式リファレンスブック(本記事では公式本と記載)」 - インプレス社出版「徹底攻略データサイエンティスト検定問題集(本記事では黒本と記載)」
そして、本記事では、上記2冊の教材より、
- ①公式本・模試のスコア遍歴
- ②黒本・問題集のスコア遍歴
- ③黒本・総仕上げ問題のスコア遍歴
の3つのスコア遍歴を紹介します。
①公式本・模試のスコア遍歴
公式本の最後に、模擬試験があります。
問題数45問✖️制限時間45分に設定されている模擬試験です。
著者は本模試を、試験までの間に合計4回取り組みました。
それぞれの回を取り組んだタイミングでの、著者の学習ステータスは次の通りです。
- 1回目 (8月24日):事前学習なしで挑戦
- 2回目 (10月26日):公式本を一通り読み終えた後に再挑戦
- 3回目 (11月23日):黒本で鍛えた後に再々挑戦(第3回後に初めて解答を読む)
- 4回目 (12月2日):試験前日に総仕上げも兼ねて挑戦
この前提も踏まえて、この後の実際の模試スコアを参考にしてください。
公式本・模試のスコア遍歴
では、具体的な各回の模試のスコア(正答数)を見ていきます。
範囲 | 1回目(8.24) | 2回目(10.26) | 3回目(11.23) | 4回目(12.2) |
データサイエンス(15問) | 10 | 10 | 13 | 14 |
データエンジニアリング(10問) | 6 | 5 | 7 | 9 |
ビジネス(10問) | 10 | 10 | 9 | 10 |
数理・データサイエンス(10問) | 9 | 9 | 10 | 10 |
※正答数の太字部は満点を表す
上記結果より「ビジネス」「数理・データサイエンス」の範囲は、本試験の学習前から理解度が高かったことが伺えます。
一方で「データサイエンス」「データエンジニアリング」の範囲は、理解度が不十分な状態からスタートし、そこから理解度を高めていった形となります。
そして、模試全体の正答数・正答率・解答時間は次のような結果となりました。
合計 | 1回目(8.24) | 2回目(10.26) | 3回目(11.23) | 4回目(12.2) |
正答数(45問) | 35 | 34 | 40 | 43 |
正答率(45問) | 78% | 76% | 89% | 96% |
解答時間(45分制限) | 40分 | 37分 | 30分 | 19分 |
では、この結果を踏まえ、各回を振り返っていきます。
1回目の模試
1回目の模試は、本試験の事前学習なしの状態で取り組んだ回ではありましたが、この時点で、正答率78%で解答時間40分という結果でした。
合格ラインが8割程度と言われている同試験において、初回から8割近い正答率を採ることができ、また解答時間も45分制限に対して40分とやや余裕をもって終えられたことから、この時点で著者は、本試験は、この後もしっかり学習を進めれば、十分1発合格を狙える試験だと感じました。
つまり余裕だと思ったわけですが、その淡い期待は、2回目の模試で脆くも砕かれてしまいます。
2回目の模試
2回目の模試は、1回目の模試の後に、公式本を一通り読み、理解度が高まっているはずの状態で行ったのですが、結果はまさかの1回目より低いスコア。
試験までおおよそ1ヶ月を残した状態のこの結果は、著者にとって、学習のギアを切り替える良いトリガーとなりました。
3回目の模試
3回目の模試は、2回目模試から1ヶ月後のタイミングであり、黒本を1周終えた後の理解度を高めた状態での挑戦。結果は、ようやく、スコアアップできていることを確認。
そして、第3回模試の後に、ようやく、はじめての模試の正答確認(間違えた問題内容とその問題の正答の確認)を行いました。
4回目の模試
4回目の模試は、試験前日に行いました。
前回の模試で正答確認を行なっており、また日にちも空いていないことから、問題の内容をある程度覚えている状態での回となりました。
そのため、基本スラスラ解ける状態での取り組むことができたのですが、それでも全問正解とはなりませんでした。
結果的には、まだ正しく理解できていない箇所を点検する位置付けの回となりました。
②黒本・問題集のスコア遍歴
インプレス社から出版される「徹底攻略データサイエンティスト検定問題集(黒本)」は、その名前の通り同試験に対応した問題集となります。
著者は黒本を、試験までの間に合計3周取り組みました。
黒本・問題集のスコア遍歴
各周の具体的なスコア(正答数)は次の通りです。
章・単元 | 1周目(11.9~11.17) | 2周目(11.26) | 3周目(12.3) |
①DS/数理統計(26問) | 15 | 24 | 22 |
②DS/機械学習(36問) | 23 | 31 | 35 |
③DE/知識(15問) | 13 | 15 | 14 |
④DE/SQL(16問) | 9 | 12 | 15 |
⑤BIZ/プロジェクト(7問) | 7 | 6 | 7 |
⑥BIZ/法律倫理(8問) | 4 | 8 | 7 |
⑦モデルカリキュラム(11問) | 11 | 11 | 11 |
合計正答率 | 69% | 90% | 93% |
※正答数の太字部は満点を表す
1.黒本問題集は公式本模試よりやや難しい
前述の通り、著者は事前学習なしに、公式本の模試で78%の正答率を採ることができました。
しかし、その後に取り組んだ黒本の問題は、公式本の模試よりやや難しい問題が多い印象を受けました。
つまり、公式本の模試で良いスコアをとったとしても、油断をしてはいけないということになります。
2.黒本問題集は単元毎に正答確認
著者は、公式本の模試で、3回目を終えるまでは正答確認はいっさい行いませんでした。
それは、DS検定は過去問が公開されていないこともある、取り組むことができる問題の絶対数が少ない中にあって、問題の正答確認することは、問題&正答を覚えてしまうことに繋がり、まっさらな気持ちで取り組める問題数が減ってしまう状態を避けたかったためとなります。
一方で、黒本の問題集では、最初から章ごと(単元毎)に正答確認を行い、さらには、間違えた問題&自信がなかった問題は、その内容をカンペにまとめる作業を行いました。
黒本を取り組み始めたのが、試験1ヶ月前であり、試験まで猶予がなかったことが主たる理由となりますが、結果的には問題を解き間違えた箇所を重点的に対策していくことが、統計検定2級でも感じた、王道な対策だと感じました。
3.イージーミスには本当に注意
上記結果にもある通り、2周目で満点だった単元も、3周目でスコアを落としていたりします。
そして、その中にはイージーミスで落としている問題がいくつかありました。
限られた時間で問題を解く上で、「計算ミス」「あてはまるものを選べ/あてはまらないものを選べの取り違い」「単純なマークミス」をするリスクはあります。
頭では理解しているつもりあったとしても、実際に問題集を取り組む過程でイージーミスをしている事実を認識できたことは、著者にとっては、本番前の良い戒めとなりました。
③黒本・総仕上げ問題のスコア遍歴
黒本の最後にも総仕上げの問題があります。
問題数は90問✖️制限時間は90分に設定されており、実際の試験と同じ設定となります。
著者は本総仕上げ問題を、試験までの間に合計3回取り組みました。
黒本の総仕上げ問題のスコア遍歴
それぞれの回のスコア遍歴は次の通りです。
総仕上げ問題 | 1回目(11.20) | 2回目(11.30) | 3回目(12.3) |
正答数(90問) | 73 | 86 | 87 |
正答率 | 81% | 96% | 97% |
解答時間(90分) | 68分 | 54分 | 21分 |
1.ほぼ解ける状態までに仕上げた
著者は、黒本・総仕上げ問題の内容について、1回目こそ8割程度の正答率でしたが、2回目&3回目では95%以上の正答率まで仕上げました。
問題集の正答率を高い状態に仕上げたことで、間違えた問題を集中的に知識補強することに時間を取ることができました。
また、試験当日は「ここまで仕上げたのだから悔いはない」という前向きな気持ちで試験を受けることができました。
2.学習量に応じて解答時間は短くできる
著者は、総仕上げ問題に挑戦する度に正答確認を行っていたため、回を重ねるたびに正答率はあがり解答時間は短くなる、当然の結果となりました。
しかし、DS検定は、学習量に応じて解答時間が短くすることができる試験だと思います。
統計検定2級は、計算で解く問題が多いことから、覚えるのは問題の解き方になります。そのため、過去問を何度やっても、その解答時間が劇的に短くなることはありませんでした。
一方で、DS検定は、用語の知識と理解を問う問題が多い試験となります。そのため、学習量(あとは問題の速読力)に応じて解答時間が短くできる試験となります。
解答時間を短くすることで、分からない&計算が必要な問題をじっくり対応することができるようになり、また見直し時間を確保できるのでイージーミスを低減することにも繋がります。
そのことから、学習量を増やし知識&理解力を深めることは、正攻法とは言えますが、本試験において有効な対策と言えるように感じました。
まとめ
今回の記事では「DS検定は公式本&黒本でどの程度のスコアを採れば合格できるか?」というテーマで、著者の公式本・黒本のスコア遍歴とその振り返りを紹介しました。
著者のDS検定合格までの実際の公式本および黒本のスコア(正答率)遍歴は以下の通りでした。
- 公式本・模試:78%→76%→89%→96%(計4回)
- 黒本・問題集:69%→90%→93%(計3回)
- 黒本・総まとめ:81%→96%→97%(計3回)
この結果より、公式本&黒本で安定的に9割以上の正答率を取れるようになれれば、同試験の合格の確度は高くなると言えるのかもしれません。(ぜんぜん統計学に基づいた主張になっていない訳ですが、その点はご容赦を。)
これからデータサイエンティスト検定にチャレンジしようと考えている人や、現在学習中の人にとって、本記事の内容がひとつの指標となれば幸いです。
私たちは20代から50代のビジネスパーソンに向けて、パラレルキャリア研究会というコミュニティーを運営しています。当研究会はデータサイエンスについても互いに学び合う場を提供しています。
私達と一緒に学んでみたいという意欲のある方、データサイエンスの自学自習に少しでも興味がある方は、お気軽にこちらからお問い合わせください。
じゃあ。
関連記事