商品詳細
内容紹介 | |
---|---|
販売会社/発売会社 | 草思社 |
発売年月日 | 2016/02/01 |
JAN | 9784794221872 |
- 書籍
- 書籍
カルチャロミクス 文化をビッグデータで計測する
商品が入荷した店舗:店
店頭で購入可能な商品の入荷情報となります
ご来店の際には売り切れの場合もございます
お客様宅への発送や電話でのお取り置き・お取り寄せは行っておりません
カルチャロミクス 文化をビッグデータで計測する
¥2,420
在庫あり
商品レビュー
3.7
13件のお客様レビュー
ビッグデータを用いた言語解析を(ほぼ)はじめに実現した若き研究者の奮闘記。 彼らが新しい研究分野に果敢に挑んでいく様子が、真面目にときにユーモラスに、 そして、まだまだ学者としてはひよっ子なので...と言った感じで謙虚に綴られていて、大変楽しく読むことができました。 いかにして...
ビッグデータを用いた言語解析を(ほぼ)はじめに実現した若き研究者の奮闘記。 彼らが新しい研究分野に果敢に挑んでいく様子が、真面目にときにユーモラスに、 そして、まだまだ学者としてはひよっ子なので...と言った感じで謙虚に綴られていて、大変楽しく読むことができました。 いかにして著作権法の壁を回避しながら解析を進めるか、 ビッグデータの供給元であるGoogleにどうやって協力を仰ぐか、 研究資金を確保するためにどんなプレゼンをしたら良いのか、 様々な協力者とのコラボレートの工夫など、 知的好奇心の種から実を生み出すためのアイデアが満載でした。 また、実際の研究成果についても、英語限定ながら、大変に興味深いものばかりであるとともに、言葉の集積からいかにして文脈を読み取るか、まだまだアイデアの出しがいのある研究分野だとも感じました。
Posted by
面白かった! 当たり前と言えば当たり前だけど、流行の言葉、今起きてる関心ごとは本の中の「単語」の数として反映される nグラムデータおもしろい!
Posted by
文化を定量的に把握する試み。古今東西の書籍のなかから、特定の語彙 (N-gram) の出現回数をたどってゆく。各時代において話題となったキーワードはより多く出現するだろう。それは完ぺきではないけれども、おおよその傾向をとらえているはずだ……。 ざっくり言ってしまえばこのよう...
文化を定量的に把握する試み。古今東西の書籍のなかから、特定の語彙 (N-gram) の出現回数をたどってゆく。各時代において話題となったキーワードはより多く出現するだろう。それは完ぺきではないけれども、おおよその傾向をとらえているはずだ……。 ざっくり言ってしまえばこのようなことなのだけど、実現はとても難しかったようだ。著作権などの法的な問題、そしてOCR(光学的文字認識)などの技術的な問題は一研究者に解決できる問題ではなかった。それで著者らははじめ、対象を一部の書籍に限定して、それでも何百冊という書籍を自力で読み、そのなかで語彙の出現頻度を地道に数えていった。なんと驚くべき仕事。 そんな著者らにとって、世界中の書籍を電子化するグーグルのプロジェクトはまさに視野を一気に広げる「新たな望遠鏡」に欠かせない材料だっただろう。それはガリレオの望遠鏡のように、世界から革新的な発見をするかもしれない。 このビッグかつロング(時間的に)なデータは、3000万冊以上、これまでに出版された本の四分の一以上という、およそ人間では処理しきれない量の情報を対象にとらえることができる。最初に述べた通り、それは世の中の傾向をおおよそで捉えるものにすぎないけれども、その精度は飛躍的に上がったことは間違いがない。 私が面白いと思ったのは、語彙の出現回数をたどるこのやり方は、当然言葉の使い方の変化をはっきり示すというところ。新たな単語の登場から滅亡(死語)、用法の変化。私たちを悩ませる不規則動詞は、そうした変化のなかで生き残ってきた単語だったが、いつかは死滅するかもしれない。また、辞書は実際に語彙を吸い上げているのか、という問題。もはや人間が一から用例採集をする必要もないのだろうか。 著者らの取り組みは文化全体を対象に入れることができるのかもしれないが、やはり言葉の未来を考えたくなった。
Posted by