【Java】
java正则表达式获取html标签及分组
作者:bobshi / 发布于2012/10/8/ 685
此代码用到了java中正则表达式的分组。注意正则表达式中的([\\s\\S]*?),加了一个()包围,还有代码中的matcher.group(1),如果是matcher.group(),则获取的是包含标签的值。具体原因请参看正则表达式知识中的分组部分。
本来不需要用到正则,即全部用Jsoup来匹配。但是textarea中的值中存放的是html标签,jsoup解析它时就会有bug,即里面存放的所有html标签经过它解析后都没有/>结束符。所以读取会有问题。我仔细看过代码后发现太“高深”,没有办法修改,所以才会有以上正则表达式的代码。