ブンジニアの記録

文系でありながら理系に間違われる人

SQL, R, Pythonなんかで仕事場で傍らに置いている本

別に大したことしてません。

それと、アフィリエイトリンクでもないので、クリックしていただいてお金を儲けようなんて思ってないのです。

代表的な本です。他にもたくさんあります。よく参照してるか、何回か通しでやってみた本です。では、始めましょうか。

 

やっぱSQLPython, Rでもコード例がいろいろ書いてあります。データベースがあることが前提。ウェブ系で正規表現駆使してデータ作る(その系統は機械にとってかわられます)のではなく、データベースから特徴量をひっぱってくる技術

前処理大全[データ分析のためのSQL/R/Python実践テクニック]

前処理大全[データ分析のためのSQL/R/Python実践テクニック]

 

 

Rの神様Hadley師のTidyverseを使ったモダンな世界。原題、R for Data Science

Rではじめるデータサイエンス

Rではじめるデータサイエンス

 

 

pandasとnumpyだけでここまでできるのか、と基礎固めをきっちり。私が買った時は、python 2.7、3.xが混在してたので、その点でも勉強になりました。

 

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

 

 

やはりこの本はずっと必須です。しかしDB増えましたね。

[改訂第4版]SQLポケットリファレンス

[改訂第4版]SQLポケットリファレンス

 

 

世の中に出回っているいろんな汚いレイアウトの集計表のお供に

Pythonではじめるデータラングリング ―データの入手、準備、分析、プレゼンテーション

Pythonではじめるデータラングリング ―データの入手、準備、分析、プレゼンテーション

 

 

基本大事 

R/S‐PLUSによる統計解析入門

R/S‐PLUSによる統計解析入門

 

 他にもありますが、

 

機械学習にしろ、パッケージのマニュアル群。ちゃんと読まないといけないなと思います。
https://cran.r-project.org/web/packages/

東工大の先生が書いてくださった膨大なとてもありがたいマニュアル
http://minato.sip21c.org/swtips/R-jp-docs/

 

こんなところです。

 

機械学習に関する本がないですね。サンプルを溜め込んでるのと、出番がほとんど無いためです。