データサイエンス初学者が、データエンジニアリングから学ぶべき理由

データサイエンス初心者が、データエンジニアリングから学ぶべき理由のアイキャッチです

近年、人事、法律、教育などさまざまな分野でテクノロジーの活用が広がり「HRテック」、「リーガルテック(legaltech)」、「エドテック(EdTech)」などさまざまな「○○テック(xTECH:クロステック)」が生み出されてきました。さらに今後は「マーケティングサイエンス」など、数量分析の手法を駆使した「○○サイエンス」がさまざまな分野に広がっていくと思われます。

このような流れの中で、経営や事業について知見のある文系ビジネスパーソンが「統計学」や「プログラミング」を学ぶことで、データサイエンティストとして即戦力になるという点については、別記事文系ビジネスパーソンこそ統計学を学ぶべき理由でお話しました。

それでは、私のような文系ビジネスパーソンがデータサイエンスの素養を身につける場合に、どのような学習ルートを辿ればよいのでしょうか。

初学者はまずデータエンジニアリングに着手すべし

別記事「データサイエンティストに必要な3つの能力とは」の中で、データサイエンティストには「ビジネス力(BUSINESS PROBLEM SOLVING)」「データサイエンス力(DATA SCIENCE)」「データエンジニアリング力(DATA ENGINEERING)」の3つが必要であると述べました。

一般社団法人データサイエンティスト協会と独立行政法人情報処理推進機構(IPA)が作成したガイドライン「データサイエンティストのためのスキルチェックリスト/タスクリスト概説」では、それぞれの力は下記のように定義されています。

データサイエンティストに必要な3つの能力の図です
・ビジネス力(BUSINESS PROBLEM SOLVING):課題背景を理解し、ビジネス課題を整理・解決に導く力
・データサイエンス力(DATA SCIENCE):情報処理・人工知能・統計学などの情報科学系の知恵を理解し使う力
・データエンジニアリング力(DATA ENGINEERING):データサイエンスを意味のある形として扱えるようにして、実装・運用する力

この3つをわかりやすくWebデザイナーの例に置き換えて考えると、「ビジネス力」はどのようなデザインが好まれるのか、高く売れるのかといった傾向を捉え、デザインの意図を第三者にうまく説明できる能力、「データサイエンス力」はWebデザイナーとしての根幹を成すスケッチ力、遠近法、影の付け方などのテクニックやデザイン力、「データエンジニアリング力」はデザインを形にするツール(フォトショップなど)を使う力に当たります。

・ビジネス力:デザインのニーズを汲み取る力、デザインの理由などを第三者に伝える力
・データサイエンス力:スケッチ力、遠近法、影の付け方などのテクニック、デザイン力
・データエンジニアリング力:フォトショップを使う力

文系ビジネスパーソンはこれまでの経験からすでに「ビジネス力」を備えていると考えられ、またこの分野に関連する書籍なども多いので、勉強のハードルはそこまで高くないと思います。問題は「データサイエンス力」と「データエンジニアリング力」の習得です。この2つを習得しようと思った場合に、私はまず「データエンジニアリング力」から着手することをおすすめします。

文系の人がデータエンジニアリング力から高めるべき理由

データサイエンス初心者が、データエンジニアリングから学ぶべき理由の写真です

前述のように、「データサイエンス力」とは統計学(応用数学)の知識のことです。この統計学というのは、文系の人にとってはかなりハードルが高いものです。そのため、これまで数学に触れたことのない人は、最初は数学の部分はライブラリを用いて自動化できるデータエンジニアリングから着手するほうがいいでしょう。Webデザイナーの例でいえば、いきなりデザインの勉強から入っても、「これは何のためにやっているのか」と、勉強自体がつまらなくなってしまうことが危惧されます。そうなるくらいであれば、まずは実践的なフォトショップの使い方からスタートしたほうがいいということです。

さらに、データサイエンス(統計学)の勉強はインプットが中心になります。具体的には、数理統計モデルの理解や計算方法を考えることが多く、実際の観測データを用いて分析することは少なく、ひたすら数理統計モデルの理解と計算方法を学びます。その点、データエンジニアリングは例題としてリアルな仕事のデータなどを操作して分析したりというアウトプットが中心であるため、「やってる感」を得ることができます。勉強を重ねるごとに「こんなことができるようになった」と、自己肯定感が高まるでしょう(笑)。

一方、データサイエンスは自己肯定感や達成感が高まりにくく、むしろ「なぜ自分はこんなに分からないんだ」と、自己否定感に苛まれる恐れすらもあります。しかし、それでもデータサイエンス力は身につけなければならないものなのです。

なぜデータサイエンス力が必要なのか

データサイエンス初心者が、データエンジニアリングから学ぶべき理由の写真です

データエンジニアリングを勉強している人の中には、データサイエンスにはあまり足を踏み入れたがらず「なんとなく分かれば良い」というスタンスの方も見受けられます。しかし、文系のビジネスパーソンが本来身につけておくべきはこのデータサイエンス力とビジネス力なのです。

データエンジニアリングはプログラミング力(データの操作)であることから、将来的にAIに取って代わられる可能性があります。Webデザインの例で言えば、元々はフォトショップでデザインしていたものが、今では「Canva」などを使えば、パワーポイントを作成する感覚でデザインできるようになっています。これと同じくECサイトやスマートフォンアプリも、現在ではノーコード(NoCode)といって、ソースコードを直接記述せずパワーポイントを作成する感覚で制作できるようになっています。

これからはデータエンジニアリングもどんどんとその方向に向かっていくと考えられます。PythonもRも現段階ではエクセルよりも難解ですが、いずれ簡単にデータ分析ができるツールが登場し、将来的にはデータ分析が自動化されていくでしょう。そうなった場合に、本質的に必要とされるのはデータサイエンスです。これが分からないと、コンピューターが弾き出した結果を信じることしかできず、「もっといいやり方があるんじゃないか」という仮説思考ができません。そのため、私は今後はデータサイエンスの習得に力を入れるべきだと思っています。

現在では、理系だけではなく商学部や経済学部、心理学などの文系の分野でも統計学が必修となっているところがほとんどです。早稲田大学の国際教養学部の2つある選択必修科目のうちの1つが統計学となっています。このように現在では大学生でも普通に統計学を学ぶカリキュラ厶になっており、統計学を身につける重要性が認識され始めていることの現れだと思います。

データエンジニアリングでデータサイエンスへの抵抗感が少なくなる

データエンジニアリングはプログラミングやエクセルを通じて統計学を学ぶため、学習を進めるうちにある程度はデータサイエンスの内容が理解できるようになっていきます。具体的には、高校生レベル程度の統計は理解できるようになっているのではないでしょうか。データエンジニアリングを習得すると同時に初歩の統計学も学ぶことができるので、効率を考えても、データエンジニアリングから学ぶのがおすすめです。

まとめ:

データサイエンティストに必要な3つの能力のうち、データサイエンスは文系の人にとってはハードルが高く挫折しやすいため、いきなりここから手を付けることはおすすめしません。しかし、それはデータサイエンスをやらなくていいという意味ではなく、あくまで入り口をデータエンジニアリングにしたほうがいいということです。

データエンジニアリングは将来的にAI技術によって代替され、価値がなくなってしまう可能性もあります。また、データ分析の結果についてより踏み込んで考えるためにもデータサイエンス(統計学)の知識は不可欠です。文系ビジネスパーソンにとって強みになるのはデータサイエンスの部分です。それを念頭におきながら、実践的なデータエンジニアリングから始めるのがよいでしょう。

[article-banner-2]

ABOUTこの記事をかいた人

ビジネスパーソンのリスキングを支援するパラレルキャリア研究会を主宰。 【経歴】 京セラ→アマゾンジャパン→ファーウェイジャパン→外資系スタートアップ→独立(起業)。早大商卒、欧州ESADEビジネススクール経営学修士(MBA)。「デジタル戦略コンサルティング(社外のデジタル戦略参謀)」、「講師業」、「Webアプリ開発」、「データサイエンス」を生業にするパラレルワーカー。