经过数天的紧张开发,终于在QQWorld收藏家上实现了批量采集微信公众号、百度百家、今日头条以及淘宝头条。下面向大家介绍如何使用这款Wordpress采集插件来采集这几种比较麻烦的网站。

采集微信公众号

定时批量采集微信公众号(公众号数据库已停止更新)

因为需要采集的公众号越来越多导致我不堪重负,所以将采集任务分流出去,现在每一个旗舰版用户都可以在自己的电脑上建一个采集服务器,采集到的公众号文章直接推送到自己的网站。请看 批量采集微信公众号最近10次群发文章 以及 微信公众号本地服务器采集者

全自动采集微信公众号

自收藏家v2.2.2 RC10版发布以来,本站建立了一个微信公众号文章数据库为QQWorld收藏家旗舰版用户提供采集微信公众号服务。

建立微信公众号收藏项目

点击收藏项目列表页顶部的帮我创建收藏项目,输入qq.com关键词,即可搜索到微信公众号(注意,既不是历史文章也不是最近10条群发),导入即可。

输入公众号的名字

打开导入的微信公众号项目,在魔法采集处输入想要采集的微信公众号名称(注意要一字不差),然后点击检测是否能够采集,如果该公众号已经在采集序列中了,就可以直接进行采集了。如果不在采集序列中,系统会提示你是否将其添加到采集序列,点“是”按钮确定后,最迟在第二天就可以进行采集了。

采集搜狗微信搜索推荐文章

搜狗微信搜索有很多推荐文章目录,比如段子手、养生堂、私房话、八卦精等,都是质量非常高的文章,本视频将教大家如何用QQWorld收藏家采集。

建立搜狗微信推荐文章收藏项目

点击收藏项目列表页顶部的帮我创建收藏项目,输入sogou关键词,即可搜索到搜狗微信推荐文章,导入即可。

设置要采集的目录

在魔法采集处选择要采集的推荐文章目录即可开始自动采集。

采集微信公众号 历史文章(已失效)

附上百度经验作为参考。

该收藏项目规则可以一次性将指定的微信公众号的文章全部抓下来。因为微信公众号是服务端加密,因为不知道算法,无法自动解析出公众号的历史文章列表链接,所以必须手动获取,而且获取的链接是有时效的,大约一刻钟左右,如果采集文章过多,可能数分钟内即失效。

步骤1:准备

安装电脑版微信

步骤2:获取微信公众号历史文章链接

  1. 登录电脑版微信,在左边的列表里找到订阅号,进入想要采集的订阅号。
  2. 点击右边上方的订阅号名,弹出下拉菜单,点击查看历史消息
  3. 在打开的窗口里,点击左上角的转发给朋友图标,选择文件传输助手发送
  4. 文件传输助手里找到刚才发送的链接。点鼠标右键,复制链接地址,即可获得完整的长链接。

步骤3:建立收藏项目

  1. 进入QQWorld收藏家收藏项目菜单,导入微信公众号收藏项目(采集规则),编辑导入的项目,将刚才获取的链接粘贴到想抓取的页面链接输入框内。
  2. 确保来源地址采集中的魔法采集选择的是微信公众号,并且在选择框右边可以自定义自动采集的分页页数。
  3. 好了,万事俱备,只欠东风,点击抓取测试连接试试吧。

建立微信公众号采集项目

点击收藏项目列表页顶部的帮我创建收藏项目,输入qq.com关键词,即可搜索到微信公众号 历史文章,导入即可。

采集今日头条

本插件可以一次性将指定栏目、关键词或头条号的文章全部抓下来。头条号的采集比采集微信公众号要简单得多。

步骤1:获取今日头条的头条号链接、栏目链接或搜索链接

获取头条号的列表页链接,这个太简单了,去今日头条的网站找吧。

步骤2:建立收藏项目

  1. 打开QQWorld收藏家收藏项目菜单,点击顶部的帮我创建收藏项目,输入今日头条的链接,即可搜索到今日头条,导入头条号的采集规则,进入今日头条采集规则设置页,将头条号列表的链接粘贴到想抓取的页面链接输入框内。
  2. 确保来源地址采集中的魔法采集选择的是头条号,并且在选择框右边可以自定义自动采集的分页页数。
  3. 要注意的是,如果采集的速度太快,服务器的IP会被今日头条网站屏蔽4-5小时,所以要确保采集规则中的 自动采集设置 -> 下载时间间隔 设置为3秒甚至更多。
  4. OK,点击抓取测试连接试试吧。

采集百度百家

同采集头条号,可以直接搜索到百度百家的规则,随便搜索1个百度百家的地址即可。

采集淘宝头条号

同采集头条号,可以直接搜索到淘宝头条的规则,搜索地址是 headline.taobao.com。

喜欢这篇文章吗,不妨分享给朋友们吧!