代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Shell
】
批量查找未注册的域名
作者:
mh942408056
/ 发布于
2014/4/11
/
955
package com.blog.collection; import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; import com.blog.model.Blog; public class CollectionHandler { private Progress progress; public void setProgress(Progress progress) { this.progress = progress; } public Progress getProgress() { return progress; } public void go(String user){ HttpRequest request=new HttpRequest(); System.out.println("加载中..."); String content=request.sendGet("http://blog.csdn.net/"+user+"/article/list/1", ""); //获取页码-摘要视图 String count=matcher(content, "(?<=<div[\\s\\S]{0,10}id=\"papelist\"[\\s\\S]{0,10}class=\"pagelist\">[\\s\\S]{1,100}共)\\d+(?=页</span>)"); Integer code=count.equals("")?0:Integer.parseInt(count); List<String> urls=new ArrayList<String>(); getUrls(content, urls, null); for(int i=2;i<=code;i++){ getUrls(null,urls, "http://blog.csdn.net/"+user+"/article/list/"+i); } System.out.println("数量:"+urls.size()); for (String string : urls) { System.out.println(string); handler(string); } System.out.println("处理完成"); } public void getUrls(String text,List<String> urls,String url){ HttpRequest request=new HttpRequest(); String content=null; if(text==null){ content=request.sendGet(url, ""); }else{ content=text; } String regex="(?<=<span[\\s\\S]{0,10}class=\"link_title\"><a[\\s\\S]{0,10}\")[\\s\\S]*?(?=\">)"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(content); while(matcher.find()){ urls.add("http://blog.csdn.net"+matcher.group()); } } /** * 处理博文 * @param url */ public void handler(String url){ Blog blog=new Blog(); HttpRequest request=new HttpRequest(); String content=request.sendGet(url, ""); //System.out.println(content); String regex = "(?<=<span class=\"link_title\"><a[\\s\\S]{0,1000}?>)[\\s\\S]*?(?=</a></span>)"; //标题 String title=matcher(content, regex).replaceAll("\n", "").replaceAll(" ", ""); System.out.println("标题"); System.out.println(title); blog.setTitle(title); //文章内容 regex="(?<=<div[\\s\\S]{0,100}id=\"article_content\"[\\s\\S]{0,100}class=\"article_content\">)[\\s\\S]*?(?=</div>[\\s\\S]{0,100}<!--)"; System.out.println("博文"); String text=matcher(content, regex); blog.setContent(text); //分类 regex="(?<=<span[\\s\\S]{0,100}class=\"link_categories\">[\\s\\S]{0,1000}<a[\\s\\S]{0,200}?>)[\\s\\S]*?(?=</a>)"; System.out.println("分类"); String type=matcher(content, regex); blog.setTags(type); System.out.println(type); if(this.progress!=null){ progress.handler(blog, type); } } public String matcher(String content,String regex){ Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(content); if (matcher.find()) { String group = matcher.group(0); return group; } return ""; } }
试试其它关键字
未注册的域名
同语言下
.
判断用户输入的是否为IP地址
.
根据web访问日志,封禁请求量异常的IP,如IP在半小时
.
iptables自动屏蔽访问网站频繁的IP
.
批量修改服务器用户密码
.
监控httpd的进程数,根据监控情况做相应处理
.
创建10个用户,并分别设置密码,密码要求10位且包含大
.
Expect实现SSH免交互执行命令
.
输入数字运行相应命令
.
用shell打印示例语句中字母数小于6的单词
.
扫描主机端口状态
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
mh942408056
贡献的其它代码
(
9
)
.
随机背包
.
随机队列
.
Android文本输入框(EditText)切换密码的显示与隐藏
.
批量查找未注册的域名
.
日志清理
.
判断用户是否手机访问
.
Hibernate 主从数据库配置
.
清除日志和收缩日志
.
清除或收缩数据库日志
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3