首页 / 正文
广告·AD

蜜蜂采集-BeePress |现已支持采集规则配置,可实现大多数网站文章的导入功能

插件·有用功 2018年6月28日 Bee 4 6721

经常有用户问,蜜蜂采集能不能支持WordPress(WP) 网站的文章?能不能支持采集网易新闻、新浪、百家号、熊账号文章采集?

理论上,只要在代码里写好采集规则,都是可以支持的。但是,要实现这么多平台的采集规则,我实在没有精力去做,因为这个插件只是我业余时间在开发,但我也尽量保证一到两周进行更新一次,而且价格可以说是白菜价了,这么良心的开发者不多了吧,哈哈哈。

但是,我发现,采集文章无非就是识别文章的标题、文字内容、图片这三个主要的目标,如果针对每个目标网站设定好采集的规则,并且做成可配置的形式,那这样的工作量可以大大减轻,于是,便有了这个功能——采集规则配置,基本上,可以满足大多数用户的需求,但也会有例外,尤其是一些防爬做的好的网站,设定好规则也不一定能采集成功,但能够实现这样的功能,已经很不错了,不是吗?反正以后插件会继续更新,只会越来越完善,现在无法实现的功能也许以后就实现了。

当然,配置规则也有一定的门槛,就是你要懂一点 HTML 的规则,但主要有三点,标签、类、Id,关于这些知识,我不想在这里赘述,网上一堆的资料。

接下来就看看这个功能如何使用吧。

采集规则设置界面

上图是采集规则的设置界面,首先我们点击添加按钮,会显示一个表单,分别有网站地址、标题、内容、图片

其中,网站地址是指网站的域名,填写的时候记得带上http://或者https://

标题、内容、图片都是填写标签、类、id这三者之一,需要html的基本知识

填写好规则之后,点击保存即可,然后就可以导入该网站的文章内容了(理论上)。

如果你不会写这些规则,Bee 也可以接受付费代写,每条规则 15元。

更多服务

评论


全部评论

  • 许建华 2018-11-02 18:11

    很好用的工具,强大,希望后期可以批量修改采集的标题。支持!支持!

    回复
    • Bee 2018-11-03 11:06
      @许建华

      嗯,谢谢,有什么建议欢迎给我提,我会充分考虑

      回复
  • 大虾 2019-02-07 16:18

    蜜蜂采集是不是对采集频率有限制,我的站点貌似被限了,采集不了。

    回复
    • Bee 2019-03-16 16:12
      @大虾

      不是插件进行限制,是目标网站会限制你

      回复