別記事「私がPythonの学習で最初に購入した書籍とおすすめポイント2つ」では、Anaconda(アナコンダ)と呼ばれるツールをインストールし、書籍とともに学習を進めていったことを紹介しました。
今回の記事では、
- Pythonを学び始めるにあたり、どのツールを導入すれば良いかを知りたい
- Pythonをクラウド環境で勉強しているが、Anacondaというツールは知らない
- Anacondaというツールは聞いたことがあるが、よく分からない
という人に向けて、私がPythonを学び始めるにあたり導入した、Anacondaについてその特徴と注意点を紹介していきます。
Python開発環境ツール Anacondaの3つの特徴と注意点
Anaconda(アナコナダ)とは?
Anaconda(個人版)は、世界中で2,500万以上ものユーザーが利用する、PythonおよびR言語のオープンソースのディストリビューション(ソフトウエア群をひとつにまとめ利用者が容易にインストールおよび利用できるようにしたもの)です。
PythonやR言語を用いたデータサイエンスや機械学習などのプログラミング開発を個人PCで可能とする開発環境管理ツールであり、Windows, macOS, Linuxの各OSに対応しています。
Anacondaの最新版(Python3.8対応)はこちらのリンク先から入手できます。
Anacondaの特徴
1.Jupyter Notebookが使える
Anacondaをインストールすると、Jupyter Notebook(ジュピター ノートブック)が利用できるようになります。
Jupyter NotebookはPythonの開発環境のひとつです。最終的にはJupyter NotebookがあればPythonでのプログラミング開発が出来るようになるのですが、このJupyter Notebookをインストールしようとすると、多くの場合、Anacondaのインストールに行き着くようです。
「Jupyter Notebook インストール」でgoogle検索を行った結果、上位10個のサイトのうち、8個のサイトがAnacondaでの導入を紹介していることからも、Anacondaがメジャーなオープンソースであることが分かります。
2.データ分析に必要なパッケージが最初から揃っている
Anacondaは、データ分析・科学計算・機械学習などで使われる数多くのパッケージ(再利用な関数の集まり)をサポートしています。
具体的には、Python向けでは、インストール時点で250以上のパッケージを同梱しており、さらに650以上のパッケージをサポートしています(サポートしているパッケージ一覧のリンク)。
たとえば、データ分析で用いるpandas, numpy, scipyや、スクレイピングで用いるrequests, beautifulsoup4などが最初から使える状態となっているので、大抵の分析はインストール直後から可能です。
3.無償で利用できる
Anaconda Individual Edition(個人版)は、誰でも無償で利用することが出来ます。
ツール同様に、データ分析・科学計算・機械学習で使われるパッケージの多くも無償で利用することができます。
Anacondaは世界中で2,500万以上のユーザーが利用するオープンソースなツールであり、安心して使用することができるツールと言えます。
比較までに、数値計算ソフトウエアのMATLAB、個人用途(非営利目的)でデータサイエンス向けのツールボックスをセットにした場合の価格は37,950円となるこからも、無償で利用できることの価値はあると言えます。
Anaconda導入の注意点
1.Python環境の競合に注意が必要
Anacondaのインストールを考えているPCに、他のアプリでPythonを使っている場合などの理由ですでにPythonがインストールされている場合、Anacondaをインストールすることで、以前よりPythonを使っていたアプリの動作に影響が出る可能性があるため注意が必要となります。
一方で、Windows PCにはPythonはプリインストールされていません。
そのため、個人用途のWindows PCで、Pythonをインストールしていないというのであれば、特ににAnacondaのインストールに注意を払う必要はないと言えます。
2.PCの容量を消費する
Anacondaには、Jupyter Notebookだけでなく、R言語の開発環境のRStudioやソースコードエディタのVisual Studio Codeなどの他のアプリケーションも含まれています。
そのため、PCに十分な容量がなく、不要なアプリケーションはなるべくインストールしたくないという方は、注意が必要となります。
一般的に、Anacondaのインストールには最低3GB以上の空き容量が必要と言われています。
私の場合、パッケージのバージョンアップや追加なども行った状態で、7.5GB程度の容量を使用しています。これは、Pythonのコードや分析で用いるデータは含まない容量となります。
なお、不要なアプリケーションはAnacondaのツール上で削除することができます。しかし、インストールしたばかりの頃は、どのアプリケーションが自分にとって必要なのかの判断は難しく、結果的に不要なアプリケーションを削除できないまま使い続けてしまう可能性があるように思えます。
そのため、もし、不要なパッケージは極力導入したくないと考える方は、Anacondaの最小構成版であるMinicondaの導入を考えてもいいかもしれません。
3.すべてのライブラリが導入されているわけではない
Anacondaのメリットのひとつとして「データ分析に必要なパッケージが最初から揃っている」と書きました。
しかし、すべてのパッケージがあらかじめ同梱されているわけではありません。そのため、ユーザーは必要に応じて、手動で追加のパッケージを導入する必要があります。
たとえば、グラフ描画ライブラリmatplotlibはデフォルト(初期状態)では日本語表示に対応していません。そのため、グラフの日本語表示対応のためには、別途、日本語フォントをダウンロードしたうえで、環境の設定変更が必要となります。
また、ブラウザ操作の自動化を可能にしてくれるseleniumと呼ばれるライブラリも含まれていません。
そのため、スクレイピングやブラウザ自動化のプログラムを作りたい場合には、別途、パッケージの追加が必要となります。
手動でパッケージ導入するのは少しだけ手間のように思うかもしれません。しかし、魅力的なパッケージが数多く存在することがPythonの特徴でもあるので、注意点として挙げましたが、デメリットと捉えずに、カスタムでパッケージを導入するスキルは必須と考えておいたほうがいいです。
まとめ
今回の記事では、著者自身がPythonの学習を始めるにあたり導入した「Anaconda(アナコンダ)」について、3つの特徴と3つの注意点を紹介しました。
Pythonの開発環境はいくつか存在するため、どのツールを選べば良いのか、迷ってしまう可能性があります。しかし、初学者にとって、ツール選びに時間をかけるのはもったいない行為であると言えます。
そのため、周りの知り合いが使っているツールや書籍などで紹介されているツールを、トライアル的に使ってみるのも良いのではないでしょうか。
私たちは20代から50代のビジネスパーソンに向けて、パラレルキャリア研究会というコミュニティーを運営しています。当研究会はデータサイエンスについても互いに学び合う場を提供しています。
私達と一緒に学んでみたいという意欲のある方、データサイエンスの自学自習に少しでも興味がある方は、お気軽にこちらからお問い合わせください。
じゃあ。