1,800円以上の注文で送料無料

JS+Node.jsによるWebクローラー/ネットエージェント「開発テクニック」 の商品レビュー

4.7

5件のお客様レビュー

  1. 5つ

    2

  2. 4つ

    1

  3. 3つ

    0

  4. 2つ

    0

  5. 1つ

    0

レビューを投稿

2021/05/09

Web上のデータを集める手法の説明だけではなく集めた情報の活用方法までを提案している本。技術的な面で掘り下げたいのであれば「Pythonクリーニング&スクレイピング」がよい。 1章 開発環境の準備  省略 2章 Webデータの収集  cheerio-httpcliを使ったスク...

Web上のデータを集める手法の説明だけではなく集めた情報の活用方法までを提案している本。技術的な面で掘り下げたいのであれば「Pythonクリーニング&スクレイピング」がよい。 1章 開発環境の準備  省略 2章 Webデータの収集  cheerio-httpcliを使ったスクレイピングを解説。対象は青空文庫、Wikipedia。再帰的な方法をつかってサイトを丸ごとDLする方法。定期的にDLする方法など。 3章 ログインの必要なサイトをクロールする  Flickrサイトの猫の写真をスクショでとって保存する方法、ログインする方法などを紹介。  Electronを使ってデスクトップアプリをつくってスクショを実行させるなど、いろいろとテンコ盛り 4章 データの整形と保存  文書の保存に関して文字コードの変換方法を解説。データ形式としてJSON/JSON5/CSON/XML/RSS/YAML/INI/CTV/TSVをNode.jsで扱う方法。ここで突然CoffeeScriptの紹介?  データの保存としてデータベースを紹介。SQlite3、LevelDBの使い方。青空文庫の作品を保存する例が紹介されている。 5章 形態素解析で日本語を扱う  MeCabを使ってわかちだちをして文書の要約、文書校正を試みている。WordCountも行っている 6章 クローラのためのデータソース  有効な情報サイトとしてOpenDataなどの紹介。 TwitterAPIの活用、Facebook、はてなブックマーク、Amazon、Flickr、YouTube、Yahoo!Finance、Wikipedia、の活用 7章 データの分類と予測と機械学習  ベイジアンフィルタによる分類を使って読み込んだ文書が信長に関する記述なの漱石に関する記述なのかを判定させている  もう一つの技術である予測に関しては気象データを学習して温度の予測をする。  人工無能との会話などなど 8章 データの視覚化と応用  Google Charts,D3を使った視覚化(チャート) こういったクローリング、スクレイピング本にありがちであるが本執筆時点のサイトの構成と試行した時のサイトの構成が違っており本のとおりにはならないことが数か所あった。そこは応用力でしょう。

Posted byブクログ

2017/12/03

ChatTool用のBOTを作ろうとした時に参考にした本 情報収集の自動化など検討している方にははじめに読むと参考になると思います。技術の紹介や自分がどんなものを作りたいのかの手助けをしてくれると思います。 複数の方法を幅広く紹介しているので習得していない言語への挑戦やツールの選...

ChatTool用のBOTを作ろうとした時に参考にした本 情報収集の自動化など検討している方にははじめに読むと参考になると思います。技術の紹介や自分がどんなものを作りたいのかの手助けをしてくれると思います。 複数の方法を幅広く紹介しているので習得していない言語への挑戦やツールの選定にも参考になります。

Posted byブクログ

2017/07/23

人が引っ掛かりやすいところを、うまくピックアップして説明してある良書です。技術書は、どうでもいい説明が長くて、大切なポイントが抜け落ちているパターンが多い気がするのですが、この人が書いた本はまた読みたいと感じました。javascriptにあまり詳しくない自分でも簡単に読めたので、...

人が引っ掛かりやすいところを、うまくピックアップして説明してある良書です。技術書は、どうでもいい説明が長くて、大切なポイントが抜け落ちているパターンが多い気がするのですが、この人が書いた本はまた読みたいと感じました。javascriptにあまり詳しくない自分でも簡単に読めたので、上級者には物足りないかもしれません。electron、node.js、javascriptの知識が少ないけど、勉強する必要に迫られたという人が入門書として読む本かなと思いました。

Posted byブクログ

2016/04/19

機械学習とその学習のためのデータをどのように取得するかが学べる。 機械学習周りの最初の勉強にオススメ。

Posted byブクログ

2015/12/06

Webスクレイピングについて興味があって買った本。だけど、想像以上に広範囲な技術がとりあげられていて期待を遥かにこえたすごい本だった。 Webスクレイピングだけでなく、スクレイピングしたデータを用いた形態素解析やベイジアンフィルタによる分類、文字認識やチャートの作成まで書かれてあ...

Webスクレイピングについて興味があって買った本。だけど、想像以上に広範囲な技術がとりあげられていて期待を遥かにこえたすごい本だった。 Webスクレイピングだけでなく、スクレイピングしたデータを用いた形態素解析やベイジアンフィルタによる分類、文字認識やチャートの作成まで書かれてあり、JavaScript(ほとんどはNode.js)でここまでできるのかと驚いた。 また、データの収集・利用だけについてでなく、nanoというLinuxのエディタやCoffeeScriptの詳しい説明などとてもためになった。JavaScriptをある程度勉強して次のステップにいきたいと思う人には本当にオススメしたい。Node.jsについても丁寧に解説されているので、ブラウザで動くJavaScripはある程度わかっているが、Node.jsはあまり分かっていないという人にもオススメ。げんに、自分がそうだったけど、この本を読んでだいぶNode.jsについてわかった気がした。 正直、いろいろこんなことができるのかと驚いたことが多くて、ここには書ききれない。ブラウザのスクリーンショット画像をCasperJSというものを使えばプログラムで簡単に作成できるとか、Node.jsのofficegenやPDFKitというモジュールを使えばExcelやPDFファイルを作ることができる等。知らなきゃ損な気がしてくるぐらいだった。 個人的に、今年、買ってよかった本ナンバーワンだ。

Posted byブクログ