代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Perl
】
通过xpath抓取网页内容
作者:
dezai
/ 发布于
2014/9/12
/
1102
#!/usr/bin/perl use strict; use warnings; use HTTP::Request; use LWP::Simple; use Data::Dumper; use HTML::TreeBuilder::XPath; use Web::Scraper; use URI; my $dest = 'http://www.sharejs.com/'; get_parse_result($dest); ############################################################## sub get_parse_result { my ($url) = @_; return unless $url; my $xpath = '/html/body/div[2]/div/form/span[2]'; my $html = get($url); my $tree = new HTML::TreeBuilder::XPath; $tree->parse( $html ); $tree->eof; #$tree->dump; my $items = $tree->findnodes( $xpath ); for my $item ( $items->get_nodelist() ){ print $item->as_HTML; } print "\n=========\n"; my $scraper = scraper { process "$xpath",'key' => 'HTML'; }; my $uri = URI->new($url); my $result = $scraper->scrape($uri); print $result->{key}; }
试试其它关键字
xpath
抓取网页内容
同语言下
.
获取本机所有IP和设备的绑定情况
.
生成隨機密碼
.
取文件的最后修改时间
.
获取本机所有IP和设备的绑定情况
.
将perl脚本变成乱糟糟的一团
.
从 HTML网页中解析出链接
.
使用 HTTP::Request 请求 URL 并将响应保存到文件
.
使用指定的User-Agent抓取网页
.
使用 Net::SMTP发送邮件
.
编写的一个简单 Web服务器
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
dezai
贡献的其它代码
(
1065
)
.
双色球
.
列出所有物理网络适配器
.
快乐数的 Python 实现
.
计算当月还剩天数
.
猜属相
.
二十四小时时钟
.
每日一语
.
很酷的日历
.
超长日历表单
.
最简单的时钟
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3