1,800円以上の注文で送料無料

データサイエンティスト養成読本 の商品レビュー

3.6

17件のお客様レビュー

  1. 5つ

    3

  2. 4つ

    6

  3. 3つ

    1

  4. 2つ

    2

  5. 1つ

    1

レビューを投稿

2019/02/11

これの機械学習編がオススメされていたので一緒に借りた。 最初に興味を持つきっかけとしては良い本? ただ全くの初級者対象にしては用語解説が少ないから使用タイミングが難しい気もする。

Posted byブクログ

2018/11/09

電子書籍ある(2018/09/26) https://app.box.com/folder/6442530817

Posted byブクログ

2017/07/18

良くも悪くも広く浅くデータサイエンスについての雰囲気を味わえる本。バランスはいいと思うので、表面的な知識を得るためには最適な一冊だと思う。一方で、この一冊だけでRやPythonなどでデータ分析する方法を学ぼうとすると生煮えになってしまうため、実行せず眺める程度に止めておくほうが無...

良くも悪くも広く浅くデータサイエンスについての雰囲気を味わえる本。バランスはいいと思うので、表面的な知識を得るためには最適な一冊だと思う。一方で、この一冊だけでRやPythonなどでデータ分析する方法を学ぼうとすると生煮えになってしまうため、実行せず眺める程度に止めておくほうが無難かと思われる。

Posted byブクログ

2017/05/07

昨今のビッグデータ時代の世の中で、どの様に活用してソリューションしているのか、全体を大掴みしたいなと思い、読んでみました。 自分にとって初めての用語がかなり多くて、読み進めるのに難航しましたが、なかなか面白かったです。 仕事では、正規分布や検定・推定といった古典統計しか使用してま...

昨今のビッグデータ時代の世の中で、どの様に活用してソリューションしているのか、全体を大掴みしたいなと思い、読んでみました。 自分にとって初めての用語がかなり多くて、読み進めるのに難航しましたが、なかなか面白かったです。 仕事では、正規分布や検定・推定といった古典統計しか使用してませんが、ここで述べられている機械学習で利用している各種ツール(k-means法、SVMなど)について、せっかくの機会なので、今の仕事のどこかで適用できたらいいなと思ってます。 それが、この本を読んだ価値に繋がると思いますので。

Posted byブクログ

2016/06/25
  • ネタバレ

※このレビューにはネタバレを含みます

データサイエンス侮り難し。思いの外、求められる技術が 多岐にわたっている。 自分の場合は、まずは統計学なんだろうなあ。 いかんせん使われている言葉が分からなすぎる。 そして、RかPythonだろうなあ。もしくは用途に応じて 両方なのかもしれない。 Webスクレイピングはちょっと怖いけど、面白そう。 基本的に、分析するよりも情報収集している方が 楽しいんだろうな。。。

Posted byブクログ

2015/10/17

教科書チック。データサイエンティストに必要なスキルを体系的にザッと学べる。読んでみたもののかなり難しく、興味も持てなかったためほとんど読み飛ばし。自分がデータサイエンティストに向いてないことが分かったことは大きな収穫。響きは面白そうなんだけどね笑

Posted byブクログ

2015/09/22

2015/09/22 全体を網羅する点では素晴らしい。書いてある内容を一個づつ参考書籍やWebなどで、自分のものにしていけばそれなりに最先端に近づくような教材っぽい仕上がり。 網羅性に長けているわけでも、実務性に長けているわけでもないのが残念で、興味のとっかかりとしての雑誌のよう...

2015/09/22 全体を網羅する点では素晴らしい。書いてある内容を一個づつ参考書籍やWebなどで、自分のものにしていけばそれなりに最先端に近づくような教材っぽい仕上がり。 網羅性に長けているわけでも、実務性に長けているわけでもないのが残念で、興味のとっかかりとしての雑誌のような役割だと思う。

Posted byブクログ

2015/05/10

データ活用の流れ、必要なスキルセット、代表的なデータ分析手法などがまとめられています。タイトル通りに「身につく」かどうかはわかりませんが、概要を知るにはよい雑誌だと思います。熟読するほど深みはありませんが、手元に置いておきたい一冊です。

Posted byブクログ

2014/10/11

ざっくり知るには良いでしょう なんとなく分かるだけで詳しくは分かりません 初めてデータサイエンスの世界を知りたい人に有効です

Posted byブクログ

2014/05/13

1.センサー技術 2.Rというオープンソース 機械学習、RFM分析(マーケティング) ーー 機械学習には 教師あり学習と教師なし学習があり、教師あり学習はランダムフォレストとSVMがある。 ーーーーーデータサイエンティストのリテラシー MySQL:構造化データ MongoDB:非...

1.センサー技術 2.Rというオープンソース 機械学習、RFM分析(マーケティング) ーー 機械学習には 教師あり学習と教師なし学習があり、教師あり学習はランダムフォレストとSVMがある。 ーーーーーデータサイエンティストのリテラシー MySQL:構造化データ MongoDB:非構造化データ WEBスクレイピング用にWEBスクレイピング関数を創ればよい。本書に掲載されている。 seekRにいろいろなプログラムが掲載されている。 カテゴリカル変数・連続値変数 棄却率は5パーセント 対立仮説と帰無仮説の相対する2つの仮説を立てる。 t検定(対応あり/対応無し)及び分布状況によらないU検定がある。 ratioの検定を行うカイ二乗検定。 はずれ値の検定を行うスミルノフ・グラブス検定もある。 ーーーーーー ●散布図行列ってなんだ?(不明) ●機械学習がよくわからん。 ーーーーー ●データマイニングで必要な10個のスキル ①C4.5 C5.0はRに実装されている。 ②k-meansアルゴリズム クラスタリングで最も優れた手法。 ・データにクラスタうぃ割り振る、 ・平均値を計算 上記2つを収束するまで計算。GAP統計量というクラスタ数を推測する関数をRでは出ている。 ③サポートベクタマシン(SVM) 機械学習の分野で最も優れた手法。手入力推測等で使用。 ④アプリオリアルゴリズム 大量のトランザクションからつながりを見つける。 ⑤EMアルゴリズム 別名:期待値最大化法。Rでは尤度比検定関数として用意されている。 E:予想/M:最大化で収束するまで繰り返す。 ⑥ページランク ⑦アダブースト ブースティング手法の一つ。 いくつかの学習器を組み合わせて強力な予測性能が得られる。 Rでは勾配ブースティングモデル(GBM)関数として実装。 ⑧k-近傍分類 まる暗記型分類器。 ⑨ナイーブベイズ クラスを予測するための手法。 統計、データマイニング、機械学習、パターン認識の分野で改良中。 Rではlearn関数で実装。 ⑩CART クラス、連続値、生存時間等の予測。 ーーーーマーケティングサイエンス 広告は3つに大別 ①情報提供型 ②説得型 ③リマインダー型 ※知覚マップの作り方がわからん GrossRatingPoint コンバージョン率の関連性の決定:カイ二乗検定 ー 多変量テスト(実験計画法/コンジョイント分析)??? アパッチmahoutは機械学集のオープン。 ーーー 有向ネットワークと無向ネットワーク エッジリストと隣接表列からネットワーク解析が始まる。 行列の知識が必要。 人間関係には密度がある。それをクラスター係数で表現する。 ホモフィリー:類は友を呼ぶの意味。 AUC(ROC曲線下面積):分析結果の当てはまりの分析。 Fluentdはログ解析の基。Runyで実装。グラフを実装している。(watcherで再構成可能) ーーーーーーーーーーーーー WEBスクレイピング robots.txt:クローラに対する負荷の宣言ファイル Python、Perl、Ruby等のを使う。

Posted byブクログ