1,800円以上の注文で送料無料

カルチャロミクス 文化をビッグデータで計測する の商品レビュー

3.7

13件のお客様レビュー

  1. 5つ

    1

  2. 4つ

    5

  3. 3つ

    4

  4. 2つ

    0

  5. 1つ

    0

レビューを投稿

2023/03/02

ビッグデータを用いた言語解析を(ほぼ)はじめに実現した若き研究者の奮闘記。 彼らが新しい研究分野に果敢に挑んでいく様子が、真面目にときにユーモラスに、 そして、まだまだ学者としてはひよっ子なので...と言った感じで謙虚に綴られていて、大変楽しく読むことができました。 いかにして...

ビッグデータを用いた言語解析を(ほぼ)はじめに実現した若き研究者の奮闘記。 彼らが新しい研究分野に果敢に挑んでいく様子が、真面目にときにユーモラスに、 そして、まだまだ学者としてはひよっ子なので...と言った感じで謙虚に綴られていて、大変楽しく読むことができました。 いかにして著作権法の壁を回避しながら解析を進めるか、 ビッグデータの供給元であるGoogleにどうやって協力を仰ぐか、 研究資金を確保するためにどんなプレゼンをしたら良いのか、 様々な協力者とのコラボレートの工夫など、 知的好奇心の種から実を生み出すためのアイデアが満載でした。 また、実際の研究成果についても、英語限定ながら、大変に興味深いものばかりであるとともに、言葉の集積からいかにして文脈を読み取るか、まだまだアイデアの出しがいのある研究分野だとも感じました。

Posted byブクログ

2022/12/22

面白かった! 当たり前と言えば当たり前だけど、流行の言葉、今起きてる関心ごとは本の中の「単語」の数として反映される nグラムデータおもしろい!

Posted byブクログ

2019/12/09

 文化を定量的に把握する試み。古今東西の書籍のなかから、特定の語彙 (N-gram) の出現回数をたどってゆく。各時代において話題となったキーワードはより多く出現するだろう。それは完ぺきではないけれども、おおよその傾向をとらえているはずだ……。  ざっくり言ってしまえばこのよう...

 文化を定量的に把握する試み。古今東西の書籍のなかから、特定の語彙 (N-gram) の出現回数をたどってゆく。各時代において話題となったキーワードはより多く出現するだろう。それは完ぺきではないけれども、おおよその傾向をとらえているはずだ……。  ざっくり言ってしまえばこのようなことなのだけど、実現はとても難しかったようだ。著作権などの法的な問題、そしてOCR(光学的文字認識)などの技術的な問題は一研究者に解決できる問題ではなかった。それで著者らははじめ、対象を一部の書籍に限定して、それでも何百冊という書籍を自力で読み、そのなかで語彙の出現頻度を地道に数えていった。なんと驚くべき仕事。  そんな著者らにとって、世界中の書籍を電子化するグーグルのプロジェクトはまさに視野を一気に広げる「新たな望遠鏡」に欠かせない材料だっただろう。それはガリレオの望遠鏡のように、世界から革新的な発見をするかもしれない。  このビッグかつロング(時間的に)なデータは、3000万冊以上、これまでに出版された本の四分の一以上という、およそ人間では処理しきれない量の情報を対象にとらえることができる。最初に述べた通り、それは世の中の傾向をおおよそで捉えるものにすぎないけれども、その精度は飛躍的に上がったことは間違いがない。  私が面白いと思ったのは、語彙の出現回数をたどるこのやり方は、当然言葉の使い方の変化をはっきり示すというところ。新たな単語の登場から滅亡(死語)、用法の変化。私たちを悩ませる不規則動詞は、そうした変化のなかで生き残ってきた単語だったが、いつかは死滅するかもしれない。また、辞書は実際に語彙を吸い上げているのか、という問題。もはや人間が一から用例採集をする必要もないのだろうか。  著者らの取り組みは文化全体を対象に入れることができるのかもしれないが、やはり言葉の未来を考えたくなった。

Posted byブクログ

2019/03/18

新しい「レンズ」は科学の境界を広げる。原題こそ、まさにこの本を表している。「Uncharted: Big Data as a Lens on Human Culture」

Posted byブクログ

2017/04/29

本書はテキストマイニングに関する一般書である。所々参考になるところがあったものの、大半が本質とは関係ない事例の話であり、本質的なところもそこまで驚くべきものでもなければ、それがなぜ重要なのかというところもいまいちわからず、終始so what感が否めなかった。

Posted byブクログ

2018/10/21

170107 中央図書館 google docsを元に、個人情報を再現できないように単語でバラバラにし、しきい値以下の稀頻度ワードをオミットした単語リスト「nグラム」を用いて、各年代別にワードの頻度を調べるというbig dataならではの手法で、「文化」とその変化をある種の切り口...

170107 中央図書館 google docsを元に、個人情報を再現できないように単語でバラバラにし、しきい値以下の稀頻度ワードをオミットした単語リスト「nグラム」を用いて、各年代別にワードの頻度を調べるというbig dataならではの手法で、「文化」とその変化をある種の切り口で定量化する試み。 ・不規則動詞drive drove driven等は、[ed]: デンタル・サフィックス規則に抗って「母音交替」を保存することができている頻出動詞であるが、長い歴史の流れの中で何れ淘汰される運命 ・名前の登場頻度で「名声」を定量化 ・ナチスや天安門事件に関する中国のアクションなど、言論弾圧の痕跡も明々白々 ・新らしい言葉が生まれ、流行り、忘れられていく軌跡は、半減期こそ異なれ、パターンは皆同じ など、面白い証拠がたくさん。 飯間浩明さんはこの本を既に読んでいるのかな?

Posted byブクログ

2019/06/02

[関連リンク] 全世界の本を分析した研究記録──『カルチャロミクス 文化をビッグデータで計測する』 - 基本読書: http://huyukiitoichi.hatenadiary.jp/entry/2016/03/01/173000

Posted byブクログ

2016/07/09

グーグルの本を全部データ化するというプロジェクトを利用して、単語データベースを用いて、過去の文化を定量的に調べる話。 ウォークマン、真珠湾でも911でも広まった言葉はピークを迎えるまでは基本伸び続け、ピーク後は半減期があり、その半減期はだんだん短くなってきている。 ナチスドイツの...

グーグルの本を全部データ化するというプロジェクトを利用して、単語データベースを用いて、過去の文化を定量的に調べる話。 ウォークマン、真珠湾でも911でも広まった言葉はピークを迎えるまでは基本伸び続け、ピーク後は半減期があり、その半減期はだんだん短くなってきている。 ナチスドイツの時代などの文化統制はある機関からばったり帰省後がなくなるなど、明らかな痕跡が残る。ライフログなど今後はこれまでなかった社会科学的なものがより定量化され、それが分析の対象にはなろうが、プライバシーの問題はよりクローズアップされよう。

Posted byブクログ

2016/05/22

検閲への適用に、はっとさせられた。不規則動詞から規則動詞への移り変わりや、「ディケンズって特別な存在なんだなあ」ということがデータとしてわかるのが面白い。 Googleの活動がいろいろなところに影響していること、法は新たな技術には厄介な存在であること、一方の立場だけで考えてはい...

検閲への適用に、はっとさせられた。不規則動詞から規則動詞への移り変わりや、「ディケンズって特別な存在なんだなあ」ということがデータとしてわかるのが面白い。 Googleの活動がいろいろなところに影響していること、法は新たな技術には厄介な存在であること、一方の立場だけで考えてはいけない問題であり、なかなか難しいなあと思う。

Posted byブクログ

2016/05/08
  • ネタバレ

※このレビューにはネタバレを含みます

カルチャロミクス、という造語だけだと???という感じになりますが、人文科学の世界がビッグデータという新しい武器を手に入れたら、こんなコトができます!という解説と展望が書かれた本です。これでもちょっとわかりにくいなぁ。。 具体的な内容を挙げると、著者がGoogleの協力を得て作った「昔からの本の内容が全てデータで取り込まれた、単語の使用頻度が年別にわかるシステム」を使って、新たな発見をしていくというもの。たとえば… ・英語のあのわかりづらい不規則動詞、実は徐々に減っている…? ・ナチスの言論弾圧が本に与えた影響は? 様々なテーマが語られた上で、最終章は「ビッグデータがもたらす未来」として、上記のシステムの話を少し離れて、ライフログの扱いや、未来予測が可能なのかといったことにも触れられています。 個人的な印象は、まだ著者も新しい武器を手に入れた!という興奮のさなかで、その紹介にとどまったような感はあります。新しい分野が融合して素晴らしい化学反応が起きつつあるというのは理解できるのですが。 最終章はSF的な話でもあって面白かったです。ライフログが国家に管理されるディストピアになるという懸念も示されていましたが、これだけデータが巨大化していくと、データの保有・管理をバラバラの民間企業に任せておいて良いのか?という話もそのうち提起されそう。でも、未来の我々はより賢くなっていると信じたいところです。 この本をきっかけに、色々な発想が生まれそうな、可能性を感じる本でした。 ちなみに、本文はジョーク交じりで専門用語もできるだけ排したわかりやすいものでしたが、解説の方がむしろ難しいという罠がありました。。

Posted byブクログ