代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Java
】
使用httpClient和httpParser获取指定网址的title
作者:
金璇
/ 发布于
2017/1/18
/
534
package com.xinhuanet.cloudDesk.controller; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.commons.httpclient.HttpClient; import org.apache.commons.httpclient.HttpConnectionManager; import org.apache.commons.httpclient.methods.GetMethod; import org.apache.commons.httpclient.params.HttpConnectionManagerParams; import org.htmlparser.Parser; import org.htmlparser.visitors.HtmlPage; public class R { public static void main(String[] args) throws Exception { HttpClient httpClient = new HttpClient(); httpClient.getHostConfiguration().setProxy("202.84.17.41", 8080); HttpConnectionManager httpConnManager = httpClient .getHttpConnectionManager(); if (httpConnManager != null) { HttpConnectionManagerParams mgrParams = new HttpConnectionManagerParams(); mgrParams.setSoTimeout(20000000); mgrParams.setTcpNoDelay(true); mgrParams.setConnectionTimeout(20000000); mgrParams.setLinger(0); mgrParams.setStaleCheckingEnabled(false); httpConnManager.setParams(mgrParams); } String url = "http://www.poetry4cn.com"; GetMethod methodGet = new GetMethod(url); httpClient.executeMethod(methodGet); String charset = getCharSet(new String(methodGet.getResponseBody())); System.out.println("getCharSet:" + charset); String responseGet = new String(methodGet.getResponseBody(), charset); System.out.println(responseGet); Parser myParser = Parser.createParser(responseGet.toString(), charset); HtmlPage visitor = new HtmlPage(myParser); myParser.visitAllNodesWith(visitor); String textInPage = visitor.getTitle(); System.out.println("title:" + textInPage); } public static String getCharSet(String content) { // String regex = ".*charset=([^;]*).*"; String regex = "<meta.+?charset=[^\\w]?([-\\w]+)"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(content); if (matcher.find()) return matcher.group(1); else return null; } }
试试其它关键字
同语言下
.
List 切割成几份 工具类
.
一行一行读取txt的内容
.
Java PDF转换成图片并输出给前台展示
.
java 多线程框架
.
double类型如果小数点后为零则显示整数否则保留两位小
.
将图片转换为Base64字符串公共类抽取
.
sqlParser 处理SQL(增删改查) 替换schema 用于多租户
.
JAVA 月份中的第几周处理 1-7属于第一周 依次类推 29-
.
java计算两个经纬度之间的距离
.
输入时间参数计算年龄
可能有用的
.
List 切割成几份 工具类
.
一行一行读取txt的内容
.
Java PDF转换成图片并输出给前台展示
.
java 多线程框架
.
double类型如果小数点后为零则显示整数否则保留两位小
.
将图片转换为Base64字符串公共类抽取
.
sqlParser 处理SQL(增删改查) 替换schema 用于多租户
.
JAVA 月份中的第几周处理 1-7属于第一周 依次类推 29-
.
java计算两个经纬度之间的距离
.
输入时间参数计算年龄
金璇
贡献的其它代码
(
13
)
.
自动安装Nginx脚本,采用case方式,选择方式,也可以
.
/* 获得当前浏览器JS的版本 */
.
计算字符串MD5值
.
C# 和 Unix 时间戳转换
.
比较两个string数组(string[])每一个值是否相等
.
使用httpClient和httpParser获取指定网址的title
.
读取Hive中所有表的表结构,并在新Hive库中创建表,索引
.
正则表达式文件路径验证
.
读取Excel中指定的Sheet名称或索引
.
LogUtil,Log统一管理类
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3