Discussion:
[問題] 如何fetch網頁上的資料
(时间太久无法回复)
BB
2006-12-28 10:06:22 UTC
Permalink
※ 引述《Argentina (21公克的重量)》之銘言:
: 小弟最近有個project需要寫一支程式 透過網路去fetch網頁上的一些資料
: 請問在JAVA有什麼API可以使用呢? 哪些Class是用來對付這樣的問題?
: 謝謝您的回答 :)

只用URL就行囉

try {
URL google = new URL ("http://www.google.com.tw");
InputStreamReader is = new InputStreamReader(google.openStream());
BufferedReader in = new BufferedReader(is);
while (in.ready())
System.out.println (in.readLine());
} catch (Exception e) {System.exit(0);}

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.208.33
愚人
2006-12-28 10:12:17 UTC
Permalink
※ 引述《banyh (BB)》之銘言:
: ※ 引述《Argentina (21公克的重量)》之銘言:
: : 小弟最近有個project需要寫一支程式 透過網路去fetch網頁上的一些資料
: : 請問在JAVA有什麼API可以使用呢? 哪些Class是用來對付這樣的問題?
: : 謝謝您的回答 :)
: 只用URL就行囉
: try {
: URL google = new URL ("http://www.google.com.tw");
: InputStreamReader is = new InputStreamReader(google.openStream());
: BufferedReader in = new BufferedReader(is);
: while (in.ready())
: System.out.println (in.readLine());
: } catch (Exception e) {System.exit(0);}

單以 `功能' 而言是沒錯。

但是有功能與達到目的要求是不同的。

還有 http 的參數要弄,

不然有些東西抓不下來,甚至連不上。

至少要有 HttpURLConnection 比較方便

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.26.34.20
※ 編輯: qrtt1 來自: 163.26.34.20 (12/28 18:11)
※ 編輯: qrtt1 來自: 163.26.34.20 (12/28 18:12)
f***@ptt.cc
2006-12-28 12:02:05 UTC
Permalink
抓完資料也要能夠 parse 吧...

我推薦 httpunit, 以前用過還蠻滿意的!

http://httpunit.sourceforge.net/


※ 引述《banyh (BB)》之銘言:
: ※ 引述《Argentina (21公克的重量)》之銘言:
: : 小弟最近有個project需要寫一支程式 透過網路去fetch網頁上的一些資料
: : 請問在JAVA有什麼API可以使用呢? 哪些Class是用來對付這樣的問題?
: : 謝謝您的回答 :)
: 只用URL就行囉
: try {
: URL google = new URL ("http://www.google.com.tw");
: InputStreamReader is = new InputStreamReader(google.openStream());
: BufferedReader in = new BufferedReader(is);
: while (in.ready())
: System.out.println (in.readLine());
: } catch (Exception e) {System.exit(0);}

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 220.236.142.69
愚人
2006-12-26 07:29:26 UTC
Permalink
※ 引述《Argentina (21公克的重量)》之銘言:
: 小弟最近有個project需要寫一支程式 透過網路去fetch網頁上的一些資料
: 請問在JAVA有什麼API可以使用呢? 哪些Class是用來對付這樣的問題?
: 謝謝您的回答 :)

Socket
HttpURLConnection
HttpClient (apache)
etc. :)

--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 163.26.34.213

继续阅读narkive:
Loading...