1,800円以上の注文で送料無料

正規表現とテキスト・マイニング 情報発見のツール・キット
  • 中古
  • 書籍
  • 書籍

正規表現とテキスト・マイニング 情報発見のツール・キット

佐良木昌(著者), 新田義彦(著者)

追加する に追加する

正規表現とテキスト・マイニング 情報発見のツール・キット

定価 ¥3,080

550 定価より2,530円(82%)おトク

獲得ポイント5P

在庫なし

発送時期 1~5日以内に発送

商品詳細

内容紹介
販売会社/発売会社 明石書店/
発売年月日 2003/10/17
JAN 9784750318004

正規表現とテキスト・マイニング

¥550

商品レビュー

4

4件のお客様レビュー

レビューを投稿

2011/12/17

 読まなくても良かった。でも、基本的なことは、読めて良かったと思う。  何か学ぶこと、実践したいなと思うこと、特に無い。

Posted by ブクログ

2011/06/17
  • ネタバレ

※このレビューにはネタバレを含みます

正規表現(regular expression)という技術は、C言語の専売特許ではなく、 英語の文字列検索の基本技術である。 正規表現は、grepというコマンドで提供しているOSがある。 ないOSでも、該当するOSのフリーソフトとして出ていることがある。 grepは global regular expression print の略で、正規表現(regular expression)で全体(global)を検索して表示(print)する便利な道具である。 grepの出力はKWIC(key word in context)といって、該当する行とともに、 検索語を表示するという検索技術の基本形式を取るものである。 sedというエディタや、awk, perlというプログラミングは、grep同様C言語で書かれており、同じ正規表現の検索が可能である。 著者らが開発した特許翻訳システム(PAT TRANSER)の原型は、 sed, awk, perlを駆使したものが基本系としてあり、 多くの特許文書をこれらの道具を使って料理してきた経験がある。 そのため、集計、解析する前に、検索コマンドを投入した時点で、 プログラマであれば統計処理もすませることができるため、 自分でプログラミング言語を少しでも触ってみると、 それまで表計算ソフトでやっていたことが、表計算ソフトを使わなくてもできることに驚くかもしれない。 大量のデータの処理は表計算ソフトではできないことがある。プログラミング言語で記述すると、複雑な制約条件を設定することが可能になる。 表計算ソフトでは十分にできなかったことがある人、 表計算ソフトでしか統計処理はできないと思っている人には、 自分でプログラムを書いてみるよい機会かもしれない。 データ処理は、複数の方法をとって、その結果が同じであるかどうかを検証することは必須である。 合計であれば、縦横の合計が同じになる方法も一つであるため、一つの検証をしたことなる。 分析作業で、しばしばソフトウェアの入力、設定、処理間違いに気がつかずに結論を出してしまうことがある。 責任ある結果を出そうとする人には、結果を2つの側面から確認するプログラムを書き始めたり、 誰かに検証してもらうための仕様を明確にする第一歩になるかもしれない。

Posted by ブクログ

2011/03/27

本書は、テキスト・マイニングを、思考の道具を使って行う創造の作業の「材料」を効率的に集めてくるものと定義している。しかしながら私の関心は、創造の作業の側にあった。すなわち、テキストから特徴的な語を集積し抽出する方法ではなく、抽出された語から何を見出すかという展望である。語句を集積...

本書は、テキスト・マイニングを、思考の道具を使って行う創造の作業の「材料」を効率的に集めてくるものと定義している。しかしながら私の関心は、創造の作業の側にあった。すなわち、テキストから特徴的な語を集積し抽出する方法ではなく、抽出された語から何を見出すかという展望である。語句を集積し抽出する方法について書かれた本書はしたがって、私の意図に対しては的外れといえた(それが選ぶ者の過誤であることはいうまでもない)。

Posted by ブクログ