首页 > 推荐阅读 >JSP环境下如何对LESS自动预处理
资讯内容

相关词条:采集软件、赶集网、通用采集软件、解密、加密算法

JSP环境下如何对LESS自动预处理

最近有客户需要采集赶集网下的所有分类信息。他们之前使用了其它一些通用采集软件,除了使用非常不方便外,最主要的是都无法采集到赶集网下的电话号码。因为他们发现网页源代码中的电话号码和页面上显示的电话号码是不一样的。最后他们找到了我们,经过半天的研究,我发现赶集网为了防止被别人采集自己的信息,特意将所有电话号码都进行了加密,通过一定的算法将正确的电话号码转换成假的电话号码,放在页面源代码中,然后在页面中通过JS将假的电话号码再逆向生成正确的电话号码显示在页面中,这样用户在页面看到的就是正确的电话号码,而源代码中确是假的电话号码。这样别人就无法采集到正确的电话号码。本以为通过逆向解密加密算法就可以将假的电话号码生成正确的电话号码,可最后发现就连加密算法,每次打开页面都是不一样的,也就是说赶集网对加密算法也是经过了一定处理,让每次的算法都不一样,这样采集者也无法破解加密算法。最后经过一番努力,终于找到了一种完美的破解方法,可以将所有假的电话号码都转换成真的电话号码采集到。 
 

到此为止,我们还始终还保持着“没有不能破解的加密方法”的记录,所有客户提出的采集需求,我们都能一一破解并采集到。





有讯软件致力于为客户定制专业的数据采集软件及服务,主要包括:网页采集,网页信息采集,网页数据采集,网络数据采集,信息采集软件,数据采集软件,网页采集器,软件定制,爬虫采集,专业数据采集。