代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
C
】
获取当前网页的所有连接
作者:
dezai
/ 发布于
2014/8/26
/
637
获取当前网页的所有连接
// getURLS.cpp : 定义控制台应用程序的入口点。 // #include "stdafx.h" #include <iostream> #include <fstream> #include <map> #include <string> using namespace std; int _tmain(int argc, _TCHAR* argv[]) { const char* filepath=".\\test.htm"; //网页文件路径 map<string,int> mapLink; //容器用于存放抽取出来的链接和计数 string line; //一行数据 string htmlcontent; //html文件内的所有内容 ifstream readfile(filepath); if(!readfile) //打开文件失败 { cout<<"打开文件失败!"<<endl; getchar(); return 0; } else { while(getline(readfile,line)) //一行行读取html文件 { htmlcontent+=line+"\n"; } string::size_type st1,st2; string strlink; //一条链接 string baseurl; //基准url,用于相对路径 st1=htmlcontent.find("base href=\""); st2=htmlcontent.find("\"",st1+11); if(st1!=string::npos&&st2!=string::npos) { baseurl=htmlcontent.substr(st1+11,st2-(st1+11)); } st1=0; while(true) //抽取出链接 { st1=htmlcontent.find("href=\"",st1); //找到链接的开始标记href=" if(st1!=string::npos) //若存在链接 { st2=htmlcontent.find("\"",st1+6); //找到链接的结束标记" strlink=htmlcontent.substr(st1+6,st2-(st1+6)); //截取子字符串,即链接 if(strlink.find("http://")!=0) //不是以http://开头的链接加上baseurl { if(!baseurl.empty()) { strlink=baseurl+strlink; } else { strlink.erase(); st1=st2+1; continue; } } mapLink[strlink]++; //将链接加入容器,并计数 strlink.erase(); st1=st2+1; } else { break; } } for(map<string,int>::iterator it=mapLink.begin();it!=mapLink.end();it++) { cout<<it->first<<"---计数:"<<it->second<<endl; } } getchar(); return 0; }
试试其它关键字
网页
连接
同语言下
.
获取手机通讯录 iOS去除数字以外的所有字符
.
异步加载音乐等资源
.
交通罚单管理系统
.
freemark实现,简单的替换
.
计算斐波那契数列
.
base64解码 包括解码长度
.
图像显示
.
冒泡排序
.
输入十进制数,输出指定进制
.
链式栈
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
dezai
贡献的其它代码
(
1065
)
.
双色球
.
列出所有物理网络适配器
.
快乐数的 Python 实现
.
计算当月还剩天数
.
猜属相
.
二十四小时时钟
.
每日一语
.
很酷的日历
.
超长日历表单
.
最简单的时钟
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3