お勉強ドットねっと

scikit-learnを習得する勉強法!

いよいよ、scikit-learn入門です。

ここから難易度が少し上がります。

ぼくも機械学習を勉強し始めた頃は同じ道を通りました。

始めたばかりの頃は
「何のこっちゃ」
と道に迷うこともしばしばでした。

この記事では、scikit-learnを独学する際に、道標となる抑えるべきポイントを紹介していきます。

ひとつひとつ課題を克服していきましょう。

やがて全体像が見えてきます。

ただし、実際に勉強するのはあなた自身です。

ガンバりましょう。

scikit-learn習得のためのお勉強ポイントをまとめてみました。

    目次
  1. scikit-learnとは?
  2. scikit-learnをインストールする
  3. Kaggleとは?
  4. Kaggleに挑戦する。
  5. 最後に

scikit-learnとは?

まずは、本家のホームページへ。

scikit-learn

いきなり全部、英語。

これまで少しずつでも英語に触れて慣れてきたとしてもハードルは高い…かもしれません。

でも、気にしないで進みましょう。

いろいろ見回してください。

Machine Learning in Pythonと書いてあります。

つまり、Pythonで機械学習をするためのライブラリ。

また、Built on NumPy, SciPy, and matplotlibと書いてあります。

つまり、scikit-learnはNumpyなどのライブラリを使って作られている。

とくに、Numpyはデータや計算を扱う部分で多用される。

PythonとNumpyを勉強してきたことが役に立つはず。

そして、Open source, commercially usable – BSD license

要するに、オープンソースで無料で商用利用も可能(BSDライセンス)なので、好きなように使える。

もちろん勉強し放題。

scikit-learnを使うとデータから学ぶプログラムを作ることできる。

さあ、最初の一歩です。

scikit-learnをインストールする

このページからインストールしてみる。

Install

わからなくなったら、Google Translateで訳してみる。

あるいは、Googleにたずねる。

「scikit-learn インストール」

環境によってインストールの仕方も多少変わってくるので、
検索に条件を加える。

「scikit-learn インストール mac」
「scikit-learn インストール windows」
「scikit-learn インストール linux」
「scikit-learn インストール ubuntu」

健闘を祈る。

Kaggleとは?

Kaggleは機械学習のコンペで賞金がかかっているものもあります。

例題のようなものもありscikit-learnの練習をする場として使えます。

参考記事:
Kaggleとは?機械学習初心者が知っておくべき3つの使い方

情報はたくさんあるので詳しくは、「Kaggleとは」で検索。

Kaggleに挑戦する。

Kaggleを始める人は、まず「タイタニック」で練習するのが鉄板です。

Titanic: Machine Learning from Disaster

この記事を参考に、「タイタニック」で生き残れる人を予測してみましょう。

【Kaggle初心者入門編】タイタニック号で生き残るのは誰?

こちらも参考に。

Kaggleのタイタニック号のチュートリアルを試す

最後に

お疲れ様でした。

実際に、機械学習のプログラムを使って予測をしてみた感想はどうでしょうか?

楽しいですか?

楽しければこのまま勉強を続けてください。

つまらない方は、もしかしたらあまり向いてないかも。

もちろん決めるのはあなた自身です。

ここまでやってきたら、機械学習のプログラムを動かせるようになってるはず。

タイタニック号の生存者を7割以上予測できたなら次に進んでください。

これからは、少し仕組み的な話をした方が見通しが良くなります。

scikit-learnの続きで理論的なことを勉強しましょう。

では、また。