2月
23
2007

先にやられた!

先にやられた!
しかも、洗練されてできている!!

http://www.atmarkit.co.jp/news/200702/20/scrubyt.html

ずっと、スクレイピングをやってきたわけです。しかもRubyで。
ハハハ、先にやられてしまいました。

WWW:Mechanizeは、Perlは知っていたんだけれど、Rubyのが去年の夏に出て
いたなんて。。。

またHpricotは、scrAPIよりも洗練されているHTMLを分析するツール。

そして、それらをまとめている。scRUBYtがある。

あの?、小規模で独自にライブラリを整備しながら作っていたんです
が、、、、、、、、私のよりも洗練されたものを発表されてしまいました。

えーい、こうなったら仕方ない。これまでのライブラリを見直して、これま
でのノウハウを活かしながらこれらのツールを使いこなそう。

自分の先見性について正しかったのはうれしいけれど、先を越されてしまっ
たのはちょっと悲しい感じがする。でもまだ全ての機能を実現しているわけ
ではないので、プロジェクトを修正して続けることにしようっと。

しかし、atmarkitの以下の見出しは説得力あるな。1年前の未踏の応募のと
きにこういうこと言えれば、今頃日本発で同じことを発表できたかも。いや
技術力もあるか・・・・

「世の中のWeb1.0サイトをWeb2.0化

WebサービスのAPIやRSSフィードを使って複数サイトのサービスや情報を
マッシュアップ??。これはWeb2.0が包含するいくつかの概念のうち、最も重
要なものの1つだ。Amazon.comやGoogle、Yahoo!、楽天といった大手Webサイ
トは、RESTやSOAPを用いたAPIを公開しており、さまざまなサービス提供者
や個人がAPIを通して各種サービスを利用している。その一方、世の中のWeb
サイトの大多数はWeb1.0的な HTMLやCGIフォームしか提供していないのが現
実だ。こうした背景からWeb1.0サイトから構造化されたデータを引っ張り出
す“Webスクレイピング”技術が急速に発展してきているようだ。」

Written by in: 楽天日記 | タグ: ,

コメントはまだありません »


コメント&トラックバック




トラックバック URL

コメントのRSS feed