2007年2月27日 星期二
HTTPUnit
最近為了找一個html parser, 找到了htmlparser,跟另一個parser, 使用htmlparser自動登入form, 然後存下cookie, 用這個cookie在去fetch其他網頁, 這是使用在論壇的系統, 類似RSS般的自動把沒提供RSS的網站把最新的帖文fetch下來.
剛剛在逛ptt的java板發現這個: HttpUnit, http://httpunit.sourceforge.net/doc/cookbook.html, 從這個link可以看到他支援一些簡單的javascript, 對於操作網頁上的一些元素如基本的link, image, 甚至table, form 都可以操作,就有如javascript在操作網頁一樣的方式使用, 是個令一個不錯使用的http client, 但是絕的根htmlparser有重複的地方,但也有不重複的地方.
可恨的Linux smbmount
在Linux裡要mount windows的分享,碰到了windows使用unicode的問題, 似乎linux的unicode跟window的unicode不合, 在window安裝完unicode補完計畫後,可以看到許多文字: 日文, 韓文, 簡體中文等. 但是smbmount時設定的iocharset, codepage得需另外設定一個好的參數,才可以正確mount window的分享並且看到unicode, 以下是Fedora Core 4 使用成功的語法:
smbmount ‘\\xx\xx’ mountpoint/ -o unicode,username=’x',password=’x',iocharset=’utf8′,codepage=’unicode’
codepage指的是server端的使用.
可惡的Java package
class hello in a.x.yclass hello in b.x.y原本利用socket送object過去應該可以互通: hello in = (hello) objectInputStream.readObject(),沒想到居然會丟出ClassNotFound的exception!!
搞了一下下原來發現聯package name都要相同才算同class….所以改成class hello in x.y 在a projectclass hello in x.y 在b project
又是一件浪費我時間debug的機車事….
可惡的IE7
今天在抓樂譜的時候,發現ie7沒辦法下載php redirect的檔案下載,到了firefox卻可以, vm裡的ie6也可以, 怪怪, 還以為ie7英文版不support中文url, 跟tea在try了 Fiddler 跟 HTTP Sniffer之後,發現Sniffer的header中Location: http://vision.csie.ncku.edu.tw/~mj23gto/web/piano_note/即便幾度分手-《悲傷戀歌》插曲 鋼琴版.ove可以正確顯示中文檔名, 可是若用這個location直接當url放到網址列直接連, ie6, opera都不行而顯示404 File not found, 神奇的是firefox 1.5可以連的到.後來發現ie7個網際網路選項把永遠傳送utf-8的url選項拿掉 就可以下載php redirect的檔案,甚至直接連http://vision.csie.ncku.edu.tw/~mj23gto/web/piano_note/即便幾度分手-《悲傷戀歌》插曲 鋼琴版.ove 也可以!只是又發現ie6這個選項是預設勾著的, 所以結論就是IE7內部不具備big5 encode/decode, 必須把url utf-8拿掉, 採用系統使用的big5則可以連通…..機車IE7, 中文版快出啦!
訂閱:
文章 (Atom)