B2B网络软件

标题: 谷歌地图采集软件YYPOST软件专用脚本下载地址 [打印本页]

作者: 营销软件    时间: 2020-5-21 08:55
标题: 谷歌地图采集软件YYPOST软件专用脚本下载地址
本帖最后由 营销软件 于 2020-5-21 08:58 编辑

谷歌地图采集软件,这个软件脚本可以自动采集谷歌老人家的店铺名称,地址,还有网址地址,谷歌地图还是比较智能化的,技术也是比较成熟一些,只是他没有办法在国内打开,所以需要用到VPN翻墙去采,这个脚本主要是贡献给一些卖口罩或是一些防疫装备的客户需要的,他们当然是做外贸的多,能赚外国的钱还是很不错的,因为有网站就有了联系方式了,如果你有专门懂英语的人才,做起来还是比较简单的。因为现在防疫装备对于外国来说,是必需品了,大大咧咧的美国人现在也出门戴口罩,甚至面置了。为了全人家,我们把货宣传推广到国外去吧。


下图是这个谷歌地图的首页,我们想采集,就得打开这个网站进行网站或是电话号码的采集的,不过一般人家不会有电话号码呈现在这里,因为外国人特别注重隐私的权利呢。
虽然这个脚本比较简单,但也是有技术的结晶哈,我们可以先去下面这个网站买一个VPN,他网站支持支付宝付款,有香港的IP,有中国的IP,有外国的IP,而且比较便宜呢。不过你如果有门路也可以去淘宝买一买这类PPTP就可以。
如果您不懂英语可以去这个中文网站购买,不过也很搞笑的事,他这个网站也在国内打不开,需要外国IP才能访问?
代理IP或是VPN之类的东西,在国内是不允许被使用的,所以会有这样的问题了。
也有一个很坏的技巧呀,买一个外国的服务器或是香港的服务器,给你试用一个小时的,弄好VPN就不要试用的了,就这么简单的灵活的事,而且可以隐藏身份,你做事懂的吧?



这个脚本惟一要自己准备的是这个关键字,而且你要采集哪一个就关后加逗号区域名加关键字这样就可以定位美国之类的城市,再定位自己想采的关键字了,最好是这样带上哦,不这样带上会出来的少区域,这样带上还可以采不同的城市的店铺名称呢,这也是谷歌老人家先进的地方,他能自动定位移动全美国的城市名称。
上图采集的结果,会把公司名,和分类,还有网址给采集下来,有点奇怪的事,他这个分类居然是中文名的哈,估计他知道你在做啥事吧。


打开谷歌地图,再搜索我们刚才列表添加的关键字和城市名称,这样就不会有一堆的广告和扰民的信息弹出来,也不知道为什么,外国的网站特别多广告。
不过采集结果页倒是比较少,只有二个广告。
谷歌这个地图,输入关键字,他是模拟的,所以出错率是比较少的,输入关键字和时候,要点选这个键盘输入,不然他定位会不出来下拉,不出来下拉你就看不到他自动区域自动移,并且点不了那个搜索的放大镜按钮。



搜索的结果他有二种,一种是网址直接在这个地图的页面上,可以直接采集出结果来。这个第五步是否,判断的是有网站就执行这个后面的采集。
<% keyID=采集-9200
{万能采集}
<规则>
      <要采集的数据>[网页源码]</要采集的数据>
      <分割代码>.section-result-details"></分割代码>
      <结果中含有></结果中含有>
      <结果中不含有></结果中不含有>
      <开始部分></开始部分>
      <结束部分></</结束部分>
      <查找></查找>
      <替换为></替换为>
      <采集补全><采集结果></采集补全>
      <结果存入>列表</结果存入>
      <存入>采集|分类</存入>
  </规则><规则>
      <要采集的数据>[网页源码]</要采集的数据>
      <分割代码><h3 class="section-result-title"></分割代码>
      <结果中含有></结果中含有>
      <结果中不含有></结果中不含有>
      <开始部分>></开始部分>
      <结束部分></</结束部分>
      <查找></查找>
      <替换为></替换为>
      <采集补全><采集结果></采集补全>
      <结果存入>列表</结果存入>
      <存入>采集|公司名</存入>
  </规则>  <规则>
      <要采集的数据>[网页源码]</要采集的数据>
      <分割代码>style="display:none"></button> <a</分割代码>
      <结果中含有></结果中含有>
      <结果中不含有></结果中不含有>
      <开始部分>href="</开始部分>
      <结束部分>"</结束部分>
      <查找></查找>
      <替换为></替换为>
      <采集补全><采集结果></采集补全>
      <结果存入>列表</结果存入>
      <存入>采集|网址</存入>
  </规则>
<备注>采集-9200</备注>
{/万能采集}
%>
这个是直接能采集出来的规则。




还有一种是没有网址的,要点击去才能看到,这里的逻辑判断是判断没有网址,就执行数组循环,先采集这个网站的名称,保存到数组,再加数组循环执行,执行点击这个网站名称,再判断有网址的就采集下来,没有网址的就不采。
但这二个采集又有一个相似的地方,就是到了最后一样都一样显示,所以我们这里第八步,把二个到了最后一页都进行了判断。意思就是都到了最后一页,切换关键字,再进行重采集的逻辑循环。


这个谷歌地图网址和名称采集,二个采集都有一个问题,第一个采集包含的,会采集的快,一下子就可以采一页,但会把没有网址的网站也采回来;而数组循环的这个采集,会比较慢,要一个一个打开采,但他能把没有网址的屏蔽掉。


谷歌地图采集网址公司和店铺名称软件封面LOG图片:
谷歌地图采集软件YYPOST软件专用脚本下载地址 B2B网络软件



谷歌地图采集软件YYPOST软件专用脚本下载:
采集谷歌地图.rar (1.96 MB, 下载次数: 116, 售价: 7 金钱)




作者: testdemo    时间: 2020-5-26 15:48
可以看看这个帖子
作者: rich1893    时间: 2021-8-2 20:24
金币多多




欢迎光临 B2B网络软件 (http://bbs.niubt.cn/) Powered by Discuz! X3.2