2007年2月27日 星期二
HTTPUnit
最近為了找一個html parser, 找到了htmlparser,跟另一個parser, 使用htmlparser自動登入form, 然後存下cookie, 用這個cookie在去fetch其他網頁, 這是使用在論壇的系統, 類似RSS般的自動把沒提供RSS的網站把最新的帖文fetch下來.
剛剛在逛ptt的java板發現這個: HttpUnit, http://httpunit.sourceforge.net/doc/cookbook.html, 從這個link可以看到他支援一些簡單的javascript, 對於操作網頁上的一些元素如基本的link, image, 甚至table, form 都可以操作,就有如javascript在操作網頁一樣的方式使用, 是個令一個不錯使用的http client, 但是絕的根htmlparser有重複的地方,但也有不重複的地方.
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言