最近在写爬虫练手,但是发现匹配出来数据很少以博客园为例,这个是我的正则/http\:\/\/www\.cnblogs\.com\/'.$name.'\/[^\"]+.html/i然后匹配这位同学:http://www.cnblogs.com/hoojo/default.html?page=1发现只有42条数据,但是这位同学明显不止42篇文章,请问如何优化我的正则
以博客园为例,这个是我的正则/http\:\/\/www\.cnblogs\.com\/'.$name.'\/[^\"]+.html/i然后匹配这位同学:http://www.cnblogs.com/hoojo/default.html?page=1发现只有42条数据,但是这位同学明显不止42篇文章,请问如何优化我的正则
/http\:\/\/www\.cnblogs\.com\/'.$name.'\/[^\"]+.html/i然后匹配这位同学:http://www.cnblogs.com/hoojo/default.html?page=1发现只有42条数据,但是这位同学明显不止42篇文章,请问如何优化我的正则
然后匹配这位同学:http://www.cnblogs.com/hoojo/default.html?page=1发现只有42条数据,但是这位同学明显不止42篇文章,请问如何优化我的正则
发现只有42条数据,但是这位同学明显不止42篇文章,请问如何优化我的正则
相关分类