经常有用户问,蜜蜂采集能不能支持WordPress(WP) 网站的文章?能不能支持采集网易新闻、新浪、百家号、熊账号文章采集?
理论上,只要在代码里写好采集规则,都是可以支持的。但是,要实现这么多平台的采集规则,我实在没有精力去做,因为这个插件只是我业余时间在开发,但我也尽量保证一到两周进行更新一次,而且价格可以说是白菜价了,这么良心的开发者不多了吧,哈哈哈。
但是,我发现,采集文章无非就是识别文章的标题、文字内容、图片这三个主要的目标,如果针对每个目标网站设定好采集的规则,并且做成可配置的形式,那这样的工作量可以大大减轻,于是,便有了这个功能——采集规则配置,基本上,可以满足大多数用户的需求,但也会有例外,尤其是一些防爬做的好的网站,设定好规则也不一定能采集成功,但能够实现这样的功能,已经很不错了,不是吗?反正以后插件会继续更新,只会越来越完善,现在无法实现的功能也许以后就实现了。
当然,配置规则也有一定的门槛,就是你要懂一点 HTML 的规则,但主要有三点,标签、类、Id,关于这些知识,我不想在这里赘述,网上一堆的资料。
接下来就看看这个功能如何使用吧。

上图是采集规则的设置界面,首先我们点击添加按钮,会显示一个表单,分别有网站地址、标题、内容、图片
其中,网站地址是指网站的域名,填写的时候记得带上http://或者https://
标题、内容、图片都是填写标签、类、id这三者之一,需要html的基本知识
填写好规则之后,点击保存即可,然后就可以导入该网站的文章内容了(理论上)。
如果你不会写这些规则,Bee 也可以接受付费代写,每条规则 15元。
更多服务
全部评论
许建华 2018-11-02 18:11
很好用的工具,强大,希望后期可以批量修改采集的标题。支持!支持!
Bee 2018-11-03 11:06
@许建华嗯,谢谢,有什么建议欢迎给我提,我会充分考虑
大虾 2019-02-07 16:18
蜜蜂采集是不是对采集频率有限制,我的站点貌似被限了,采集不了。
Bee 2019-03-16 16:12
@大虾不是插件进行限制,是目标网站会限制你