データサイエンティストに必要な3つの能力「ビジネス力(BUSINESS PROBLEM SOLVING)」「データサイエンス力(DATA SCIENCE)」「データエンジニアリング力(DATA ENGINEERING)」のうち、「データエンジニアリング力」を高める学習ルートについては別記事データサイエンティストを目指すための学習ルート「データエンジニアリング」でお話ししました。
今回は「データエンジニアリング力」を高めるためにおすすめな学習教材をご紹介します。
学習効率がいいのは動画学習>書籍>学校
別記事データサイエンティストに必要な3つの能力とはでお話したとおり、「データエンジニアリング力」とはPythonやRでプログラミングする力のことで、Webデザイナーに置き換えれば、フォトショップを使う力のことです。基本的に操作を学ぶものなので、学習には画面の動きを追うことのできる動画教材が向いています。
一方で、動画教材は「ながら学習」が難しく、そのためスキマ時間では学習できません。スキマ時間という意味では書籍にメリットがありますが、書籍は画面のスクリーンショットが掲載されているだけなので、最初は難しいと感じてしまう人も多いかもしれません。
また、最初の一歩として学校に通って基本操作を教えてもらうというのもアリですが、データの前処理やよく使うライブラリの全てを学校が網羅してくれるわけではないことに注意が必要です。結局のところ、学校に通った後も書籍や動画などで自分で学びを重ねる必要があります。一般的には学校→書籍→動画という流れになるとは思いますが、学校に行っただけでは、完璧にマスターできるようにはならないことをあらかじめ理解しておきましょう。
データエンジニアリングの勉強におすすめの動画学習サービス
先程も申し上げたように、私はデータエンジニアリングの勉強には動画が一番向いていると思っています。学校に比べて動画であれば自分の理解度に応じで繰り返し再生できたり、ピンポイントで必要な部分のみを視聴できたりもします。データを渡してくれるところもあり、有料のサービスだとしてもお手頃な価格でさまざまなコンテンツが視聴できます。具体的には下記のサービスが挙げられます。
・gacco
・Schoo
・Udemy
・ストアカ
gaccoは基本的には無料でさまざまなコンテンツを見られるのでおすすめです。中でも無料で学べるオンライン講座というのがあり、データサイエンスだけではなく、デジタル系の様々なトピックについて大学の授業が無料で受けられます。例えば、大学生のためのデータサイエンスなどでは、レポートを出すなどの宿題もあります。必要な部分のみをスポットで視聴することもできるので、こちらをメインに学習を進めてもいいくらいです。
視聴する講義を選ぶ際にはトピック的、流行り物的な内容よりも、PythonやRの基本操作やデータサイエンスの実践から学ぶデータ分析入門のような、今後の基礎となるものを選ぶことをおすすめします。大学の講義のため単調ではありますが、内容が難しそうであれば、高校生のためのデータサイエンスなどもあるので、こちらから見てもいいかもしれません。
またストアカはオンライン学習サービスではありませんが、メンターが見つけられという点にメリットがあります。最初のうちはメンターは必要ありませんが、中級者程度になってくると、質問できるメンターのような存在がいると学習が楽になります。ストアカは人と人とのつながりの場でもあったりするので、このようなサービスを使って講師の先生と仲良くなるというのはアリです。
データエンジニアリングの勉強におすすめの書籍
データエンジニアリングに関する書籍は数多くあります。本屋に行けば、「Rで学ぶ統計学入門」といったような、プログラム言語を使って統計学を学ぶ内容の書籍が並んでいます。これはWebデザインでいえば、フォトショップを使って絵の書き方、デザインを学ぶというイメージです。データエンジニアリングを学ぶ教材として統計学を勉強しつつ、操作方法を覚えられるようになっています。こういった内容の本がR向け、Python向け、エクセル向けに存在します。
どれを選べばいいかというと、中身は基本操作に関するものなので、どれをとっても大差ありません(笑)。英語の文法書と同様に書いてある内容はどれも同じで、その表現方法や説明の仕方、挿絵の多さなどが異なっています。もう少しレベルが高くなってくればまた違いますが、入門レベル程度ではそこまで差はありません。そのため、試しに読んでみて頭に入りやすいものを選びましょう。大きな本屋では、「統計学」のコーナーや一部マーケティングのコーナーに置いてある場合があります。地方在住の方はAmazonなどで試し読みをして選んでみてください。
ただ、ひとつ言えるのは難しい内容の本は選ばない方がいいです。統計学入門レベル程度の、自分で勉強できそうだと思う本を選ぶようにしてください。そういう意味では、最初はエクセル向けの本から始めるのもいいかもしれません。データエンジニアリングはツールの操作方法を勉強をするものであるため、データサイエンスの本質ではありません。ただ、いきなりフォトショップを使うのはキツいので、最初はペイント程度でやるというイメージです。
ただ、PythonやRの本を試しに読んで、頑張れると思ったらエクセルを飛ばしてそちらから着手したほうがいいです。長い目で見てPythonやRのほうが使い勝手はいいため、最初からこれらのツールを使ってしまったほうが、経験効果的に考えてコスパがいいのです。
データエンジニアリングの勉強におすすめの学校
データエンジニアリングの講座を提供している代表的な学校には下記があります
・すうがくぶんか
・和から
・データミックス
・デジタルハリウッド
・キカガク
私は「すうがくぶんか」に3年ほど通っていますが、こちらは非常におすすめです。統計学と数学を専門にしているマニアックな学校ではありますが、家庭教師のような感じで個別指導もあり、講師に分からないところを教えてもらったり、勉強の相談をしたりできます。料金も1時間5,000円と良心的です。講師の数も多いので自分に合う講師を選んで分からないところを教えてもらうことができます。また、数Ⅰ、数Ⅱ、数Ⅲといった高校数学や統計の授業、統計学の講義、大学の線形代数とか、微分積分などの講義もあるので、数学の授業を本当にゴリゴリやりたい人にはおすすめです。ただ、文系の方は少ない印象です。
データエンジニアリングを学べる学校は数多くありますが、中にはあまり良心的でないスクールもあるので注意してください。意識は高いけれども情報リテラシーは低い人をターゲットに「○ヶ月でデータサイエンティストになれる」「これだけやっていれば大丈夫」と謳っている学校は、疑ってかかったほうが賢明です。
データエンジニアリングを含めたデータサイエンスは、半年や1年程度スポットでやったところで、できるようになるようなものではありません。その後も地道にコツコツと勉強を重ね、知識をアップデートしていくものなのです。そのため、甘い言葉を謳っているスクールよりも、ちゃんと現実をとらえているスクールを選ぶようにしましょう。
まとめ:
データエンジニアリングの学習教材には「学校」「書籍」「動画」がありますが、どの方法をとるにせよ一番大事なのは自分で継続してコツコツと自習できるようになることです。学校に通っても、そこで満足して終わってしまっては意味がありません。それよりは自分で勉強をする習慣を作るほうがはるかに重要です。学校のカリキュラムを修了してからも、書籍や動画で地道に勉強を進めていく、謙虚に学び続ける姿勢が大事です。