tzkr.net
当前位置:首页 >> 正则表达式提取网页数据 >>

正则表达式提取网页数据

用这个正则 获取 <div\sclass="\sshop-hd\srow">[\s\S]*title="([^"]*)"

Java正则表达式:(.*?) 完整的Java程序如下:(android也是java程序,把主函数下的代码拷贝到你的android程序中就可以了) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 import java.util.regex.Matcher; import java.util.

直接写 “转发数:”很多情况是 转发数:3876 这种,可以直接写个简单的正则来拿到后面的数字.转发数:[^>]*>[^>]*>([^解释:“转发数:后面不等于 大于号 的所有值,这样就能拿到第一个 的大于号,然后自己补一个大于号,然后在跳过一个不为大于号的所有字符,就是 red 后面的大于号了,然后在自己补一个大于号,这时候你的光标起点就是 3 这个数字前面,那么只要拿到光标位置到不为小于号之间的所有值,那就是你需要的那个数字了~”

]+>(.*?)\s*]+>(.*?)\s*]+>(.*?)

<\w+>\s*?(?<id>\d+)\s*?</\w+>\s*?<\w+>\s*?(?<name>\s*?[\u4E00-\u9FA5]{2,6})\s*?</\w+>\s*?<\w+>\s*?(?<phone>\d+)\s*?</\w+>\s*?<\w+>\s*?(?<qq>\d+)\s*?</\w+>\s*?<\w+>\s*?(?<email>\w+@\w+\.\w+)\s*?</\w+> 试试把.

string reg = "^[a-za-z0-9\u4e00-\u9fa5]+$"; pattern pattern = pattern.compile(reg); matcher matcher = pattern.matcher("需要去匹配该正则的string字符串"); boolean b = matcher.matches(); reg代表就是你要写的正则的规则!让后就会返回

正则不容易理解,干嘛那么费劲,你用javascript或更方便的jquery.比如提取 “光纤ADSL 100M下行/2M上行”,用javascript就可以这么写:document.getElementById("LblShow_0").innerText这样就提取了“光纤ADSL 100M下行/2M上行”,比正则好用多了.再说了,正则的强项不是干这个用的,javascript才是你所要的,建议多学习些知识,然后再整合,就感觉方便多了.

// 正则表达式对象var re = new RegExp(" :[\\d\\w]{12}", "");// 查找var mresult = re.exec("your string");if( mresult != null ){ alert("founded: " + mresult);\\这里就是你的操作..}

HTML网页是一个文本文档,正则表达式的主要作用是匹配文本文档中的特定字符串,当然,它不仅仅是从文档中找出一个确定的字符串,例如“text”这么简单,而是使用一种很灵活的词法表达一个字符串模式,按照这个模式匹配.从HTML文

var reg = /.*新.*址[新.*码[var htmlContent = '新址

网站首页 | 网站地图
All rights reserved Powered by www.tzkr.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com