代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
C
】
简单小爬虫
作者:
超级猪小峰
/ 发布于
2013/11/28
/
637
一个简单的小爬虫,练手用下,主要是加入一个种子url然后抓它页面,之后解析下
标签, 提取出链接,再循环抓.
// ClientNode client; // Parser parser; // std::list<std::string> todolist; // std::list<std::string> visitedlist; // std::string url = "http://www.sina.com.cn/"; // todolist.push_back(url); // // while(!todolist.empty()) { // url = todolist.front(); // // if(client.InitConnect(url)) // client.Fetch(); // // parser.ParseHtmlFile(client.GetFileName(), todolist); // // visitedlist.push_back(url); // todolist.pop_front(); // sleep(3); // } // std::list<std::string>::iterator it = todolist.begin(); // for(;it!=todolist.end();++it) { // printf("%s\n", (*it).c_str()); // }
试试其它关键字
小爬虫
同语言下
.
获取手机通讯录 iOS去除数字以外的所有字符
.
异步加载音乐等资源
.
交通罚单管理系统
.
freemark实现,简单的替换
.
计算斐波那契数列
.
base64解码 包括解码长度
.
图像显示
.
冒泡排序
.
输入十进制数,输出指定进制
.
链式栈
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
超级猪小峰
贡献的其它代码
(
1
)
.
简单小爬虫
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3