Asp.Net获取HTML里面的超链接,图片,FLASH地址
作者: / 发布于2012/8/7/ 583
/// /// 返回文本中的url地址 /// /// html文本 /// 正则表达式 /// 关键字 /// public ArrayList geturl(string html, string regstr, string keyname) { ArrayList resultStr = new ArrayList(); Regex r = new Regex(regstr, RegexOptions.IgnoreCase); MatchCollection mc = r.Matches(html); foreach (Match m in mc) { resultStr.Add(m.Groups[keyname].Value.ToLower()); } if (resultStr.Count > 0) { return resultStr; } else { //没有地址的时候返回空字符 resultStr.Add(""); return resultStr; } } 链接地址: 正则表达式: "((http|https|ftp):(////|////)((/w)+[.]){1,}(txt|rar|doc|iso|pdf|zip|xls|[0-9]{1,3})(((//[/~]*|//[/~]*)(/w)+)|[.](/w)+)*(((([?](/w)+){1}[=]*))*((/w)+){1}([/&](/w)+[/=](/w)+)*)*)"; 图片: ]+src=/s*(?:'(?[^']+)'|""(?[^""]+)""|(?[^>/s]+))/s*[^>]*> FLASH: ]+src=/s*(?:'(?[^']/S*.swf/b+)'|""(?[^""]/S*.swf/b+)""|(?[^>/s]/S*.swf/b+))/s*[^>]*>
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved 站长博客 粤ICP备13059550号-3