代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
PHP
】
多线程抓取网站内容
作者:
李敬塔
/ 发布于
2012/12/5
/
888
/** ** @author: 李敬塔(Tiger) ** @desc: 多线程抓取网站内容 ** @createDate:2011-08-11 **/ class MultiHttpRequest{ public $urls = array(); public $curlopt_header = 1; public $method = "GET"; function __construct($urls = false){ $this->urls = $urls; } function set_urls($urls){ $this->urls = $urls; return $this; } function is_return_header($b){ $this->curlopt_header = $b; return $this; } function set_method($m){ $this->medthod = strtoupper($m); return $this; } function start(){ $req_text=""; if(!is_array($this->urls) or count($this->urls) == 0){ return false; } $curl = $text = array(); $handle = curl_multi_init(); foreach($this->urls as $k=>$v){ $curl[$k] = $this->add_handle($handle, $v); } $this->exec_handle($handle); foreach($this->urls as $k=>$v){ $text[$k] = curl_multi_getcontent ($curl[$k]); $req_text.=$text[$k]; curl_multi_remove_handle($handle, $curl[$k]); } curl_multi_close($handle); return $req_text; } private function add_handle(&$handle, $url) { $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $url); curl_setopt($curl, CURLOPT_HEADER, $this->curlopt_header); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); curl_multi_add_handle($handle, $curl); return $curl; } private function exec_handle(&$handle) { $flag = null; do { curl_multi_exec($handle, $flag); } while ($flag > 0); } } $urls = array("http://www.php.net/",http://www.baidu.com); $mp = new MultiHttpRequest($urls); $req_text=$mp->start(); preg_match('/<div[^>]*id="headmenu"[^>]*>(.*?) <\/div>/si',$req_text,$match); //得到某区域的内容 print_r($match[1]);echo "<br/>"; //echo $req_text;
试试其它关键字
抓取网站内容
同语言下
.
用net匹配并替换iOS标准的emoji表情符号
.
处理带Emoji表情的的字符串
.
获取微信昵称时 过滤特殊字符
.
通过判断上传文件的头字符来判断文件的类型
.
模拟百度URL加密解密算法
.
以太坊检查地址是否合法
.
实现crontab解析类
.
获取每个月的开始和结束时间
.
图片上传工具类
.
APP手机应用信息采集
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
李敬塔
贡献的其它代码
(
13
)
.
PHP模拟登录获取邮箱联系人地址
.
HTML节点交换(兼容FF/IE)
.
js数组分页
.
兼容FF的右键菜单
.
实现textarea内字符串选择查询替换功能
.
SQL的形式操作文件
.
可以传对像的setTimeout函数
.
音频播放器
.
仿 MSN网站首页弹出式欢迎词(兼容Firefox/IE)
.
支持IE、FF纯js 颜色选择器
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3