nashidos’s diary

アルゴリズムとか機械学習とか色々

Pythonでデータ分析を始める人におすすめの学習リソース

はじめに

Pythonでデータ分析をするためには多くの知識が求められます。

データの可視化、回帰分析、機械学習、特徴量生成、ファイル操作など必要な知識は多岐にわたります。

そこで本記事では、ファイル操作やデータの可視化、回帰分析などの基礎的な知識を学べる教材と、機械学習や特徴量生成などの応用的な知識が学べる教材をそれぞれ紹介します。

データ分析の基礎を学びたい人はUdemyの「ゼロから始めるデータ分析」がおすすめ

【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門

f:id:nashidos:20200725232033p:plain

Udemyは動画でプログラミングを学習できるサービスです。

多種多様なコースが用意されており、それぞれの分野で第一線で活躍されている方が講師を務めてるのでクオリティはかなり高いです。

今回紹介する【ゼロから始めるデータ分析】 は3000件以上のレビューが存在しUdemyのデータ分析系の教材の中では群を抜いて人気です。

実際に私が受講してみて感じたおすすめできるポイントは以下の通りです。

おすすめポイント

  • 8時間なので途中で飽きることなく続けることができる
  • 初心者向けに丁寧に説明されている
  • データ分析のコンペティションに参加することができる
  • 機械学習に触れることができる


Udemyで教材を選ぶ際についついコスパを意識して動画時間が長いものを選択してしまいそうになりますが、あまりに長い動画だと途中で飽きてしまうこともしばしばあります。

8時間であれば最短で1日、もしくは1日1時間ちょっとずつすれば1週間で修了できる分量ですので、最後までやり遂げることが出来ると思います。

【ゼロから始めるデータ分析】の学習の流れ

  1. 環境構築(Jupyter)
  2. Pythonの基本的な操作の確認
  3. グラフの書き方
  4. 単回帰分析、重回帰分析
  5. 特徴量の生成
  6. 機械学習(決定木)

ガッツリ機械学習を使ってデータ分析を学びたい人には「Kaggleで勝つデータ分析の技術」がおすすめ

この本はタイトルの通りKaggleというデータ分析のコンペで勝つための技術が集結されている一冊です。

モデルの精度を上げるための実践的な方法が記述されています。

ただし、Pythonの基本的な使い方、データ分析の基本がわかっていないと読み進めるのは難しいかもしれません。

この本のおすすめポイントと注意点を以下にまとめます。

おすすめポイント

  • ただモデルを作成するだけではなく評価指標の最適化や特徴量の作成、チューニング方法など予測モデルを作成する際の知識が網羅されている
  • 他の機械学習の解説書には載っていないようなテクニックが多く載っている
  • サンプルコード付きなのですぐに実践することができる

注意点

まとめ

私は実際にこの2つの教材を使ってデータ分析について学び、その後は趣味でデータ分析のコンペに参加して勉強しています。

Kaggleで人のコードを見るのもすごく勉強になるので、データ分析に関する基礎知識が身に着いたらぜひ参加してみることをおすすめします。

おわり