インターネットデパート - 取扱い商品数1000万点以上の通販サイト。送料無料商品も多数あります。

Spidering hacks―ウェブ情報ラクラク取得テクニック101選

価格: ¥3,675
カテゴリ: 単行本
ブランド: オライリー・ジャパン
Amazon.co.jpで確認
楽しく読めて、実用的 ★★★★★
「Perlをある程度勉強している」+「Webページから情報を抜き出すことに興味がある」
の二項目に当てはまれば持っていて損はない本だと思います。

もともとが洋書であるため、対象サイトが海外のものであるのもちらほらありますが、
翻訳する際にソースや内容も日本人向けに変更しているのでそこまで問題になりません。

翻訳もよく、難しくも面白い内容を取り扱っている本なので、
個人的には買ってよかったと思える本でした。

因みに、自分はスパイダリングに関する本を読んだのはこれが初めてですが、
初心者(Perlの知識はある程度必要)でも全く何が書いてあるのか分からないということはありませんでした。
情報収集 ★★★★★
このHacksシリーズのよさは、テクニック100選にあるかもしれない。
技術を体系的に教えようとしたり、解説しようとすると、書きたいことが多すぎて、整理しきれないことがある。本書のように、100という制約を設けると、じゃ、何を書いて、何を削ろうという選択がしやすい。そのため、内容も厳選され、質も揃うことになるのではないかと推測できる。
ただ、本書だけは101になっている本当の理由はなんだろうかは興味がある。

Spideringという情報検索(収集)ロボットに関する技術紹介である。
自分のPCに取得した方がよいか、常にネットにつながるところで作業するかは、仕事の仕方によるかもしれない。

情報の機密性、価値などに対する考え方で、集めてくるのがいいかどうか。
情報の整理の仕方についても考えさせられる。
回り道しても読む価値がありました ★★★★★
私には投資のためにウェブ情報を利用するアイデアがあり、それを実現する方法を探していた時にこの本を見つけました。

書いてある事は興味深かったのですが、事例のほとんどがPerlで書かれており、Perlがわからないのでさっぱり理解できません。そこで入門本を買ってPerlの学習から始めました。そのために数ヶ月回り道しましたが、その価値はあったと思います。「知りたい事を知る事ができた」というより「自分の世界が拡がった」感じです。
初心者は買っても無駄 ★★☆☆☆
中級者以上用。
洋書の役なので中級者以上でないと意味不明の訳が多い。
『Hacks』の白眉 ★★★★★
2004年5月26日リリース。O'REILLYの『Hacks』シリーズの邦訳。最近のO'REILLYの『Hacks』のシリーズと『The Missing Manual』シリーズはどれも見逃せない面白さである。(●^o^●)

『Spider』とはインターネットから様々な情報を自動的に取得するプログラムの総称である。ネットの海から欲する情報を吸い出す。それは単にWWWだけでなく、例えば電子メールのPOP3サーバから添付ファイルだけを抜き出す。それら徹底した収集方法を獲得し、次にそれらをRSSを用いてデータを再利用したり、ダッシュボードのウイジットの引っ張るデータとしたりする。(●^o^●)最高にCoolな本である。

特徴として執筆者2名を支える『貢献者』が圧倒的に厚い(熱いとも言える(●^o^●))事が上げられる。それがこの本の中身をすばらしいものにしている!!!『Hacks』の白眉が本書である。