2011年7月13日水曜日

Javaで外部サイトのHTMLを取得する

PHPのfile_get_contents()は外部サイトのHTMLを取得できます。
さらに、クエリストリングを付与してなんちゃってサーバ間通信までできてしまいます。
Javaでもそんなの欲しいな~ということで作ってみました。

Windows7のコマンドプロンプトから実行して、EUC-JPのサイトのHTMLを取得、表示で問題なく動作しています。
ただ、文字コードを自動判別することろにJISAutoDetectを利用しているので文字化けする可能性があります。
文字コードを指定してあげれば問題ないと思います。

0 件のコメント: