データサイエンスと機械学習の勉強におすすめな本
モデルによると、データサイエンスは、数学と統計確率、コンピューターサイエンスと情報学、および専門知識とビジネス知識(経済学または商売市場)の共通部分です。したがって、データサイエンティストになるには、上記の分野の知識と経験が必要だと言われています。
データ構造とアルゴリズム
1.Automate the Boring Stuff with Python (Al Sweigart) (退屈なものをPythonで自動化する)
これは非常にシンプルで理解しやすい本で、Pythonでプログラミングを学び始めたばかりの人に適しています。
関数/メソッド(方程式/メソッドのタイプ)、変数、フローコントール(フローコントール/データ送信速度)などの基本的知識に精通しているだけでなく、.csv、.excel、.pdf 、.json.などのドキュメントを操作することもできます。
2. Problem Solving with Algorithms and Data Structures using Python (Pythonを使用したアルゴリズムとデータ構造による問題解決)(BradMillerとDavidRanum)
この本は、再帰(再帰的アルゴリズム)、ソートと検索(分類と検索)、ツリーとツリーアルゴリズム(ツリーアルゴリズム)、グラフとグラフアルゴリズム(グラフアルゴリズム)などのアルゴリズムに焦点を当てています。
それらはかなり重要な知識だと言われました。なぜかというと、データサイエンス自体も、
問題などを分析し、理解し、最適な解決策を考え出すプロセスからです。アルゴリズムを勉強することで推論と論理的思考の改善に役立つだと思われます。
統計–数学統計
1. An Introduction to Statistical Learning with Applications in R(James et al)
統計確率に関する完全に専門的な本ではありませんが、この本は、複雑なデータセットをモデル化して学習するための一連の方法である、いわゆる統計的学習方法を紹介してくれます。
この本では、線形回帰、分類、決定木、サポートベクターマシン(2つのデータグループを分類するための多次元平面を見つけるアルゴリズム*)など、機械学習モデルに直接関連するメソッド、および、 R言語で記述されたアプリケーションを使用したクラスタリング(データをグルーブに分けます)を紹介しています。
4. Think Stats(O’Reilly * – Downey)
Think Statsは、Python言語を使用して確率と統計を導入します。
記述統計、累積分布関数、確率、仮説検定、相関(相関係数)などの基本的な統計知識が説明され、常にデータセット(データセット)に適用されます。各章の終わりには、レビューの質問と用語をまとめてくれます。
機械学習とデータサイエンス–機械学習とデータサイエンス
5.Machine Learning for Dummies ダミーのための機械学習(IBM Limited Edition – Hurwitz and Kirsch)
冗談めかして「ダミー向け」と呼ばれるこの本は、実際には機械学習やデータサイエンスについて知っている人に適するものです。特に、ビジネスにMLを適用し、データサイエンティストのチームを構築しようとする主にプロジェクトマネージャーまたはマネージャーを対象としております。
この本は数学的な説明はなく、理解しやすい言語で書かれており、重要で覚えておく必要のある項目を示すアイコンがたくさん付いています。
6.Understanding Machine Learning(機械学習を理解する)(ShaiShalev-ShwartzおよびShaiBen-David)
この本は主に、機械学習および関連のアルゴリズムを紹介しています。
取り上げるトピックには、機械学習における「学習」要素の計算の複雑さ(学習の計算の複雑さ)、確率的勾配降下法、ニューラルネットワーク、構造化出力学習などの重要なアルゴリズムモデルが含まれます。統計的確率と線形代数の知識を持っている人に適すると言われました。
7.A Programmer’s Guide to Data Mining データマイニングのプログラマーズガイド(Zacharski)
データマイニングガイドは、データサイエンスの知識の説明を提供するだけでなく、各章ごとに、読者がデータを処理するために学んだ知識を適用する練習をすることを可能にするという点で興味深いです。言い換えれば、実践による学習アプローチです。
この本で紹介されているアルゴリズムは、主に、分類アルゴリズム、ナイーブベイズ、クラスタリングなどのレコメンデーションシステムを構築するのに役立ちます。
8. A Brief Introduction to Neural Networks ニューラルネットワークの簡単な紹介(Kriesel)
この本は(出版社によって)公式にリリースされていませんが、著者のWebサイトで公開され、無料でダウンロードできます。
簡潔に書かれた本ではありますが、この本は、ニューラルネットワークと高度な機械学習アルゴリズムを解決することを中心としております。
9.Deep Learning(MITプレスブック– Goodfellow et al)
ディープラーニングと人工知能(AI)の分野に興味があり、かつ深く学びたい人には、この本は最適です。数学モデルから、機械学習の概念、深層学習のアルゴリズム、研究の世界での問題アプローチまで、詳細に記載されています。
10.Machine Learning Yearning(機械学習への憧れ)(Andrew Ng)
Andrew NgはGoogle Brain、Coursera、Deeplearning.aiの共同創設者、Baiduのチーフサイエンティストとして、人工知能と機械学習の分野における学界、研究に多大な貢献をしています。
この本は、メトリック(信頼性、時間など)の実行時間、エラー率の最適化、または過剰適合(モデルの過剰適合)などのモデルに関する問題など、機械学習プロジェクトを効率的かつ正確に実施するための技術戦略を提供します。