首页 / 正文

蜜蜂采集-BeePress |现已支持采集规则配置,可实现大多数网站文章的导入功能

插件·有用功 2018年6月28日 Bee 432

经常有用户问,蜜蜂采集能不能支持WordPress(WP) 网站的文章?能不能支持采集网易新闻、新浪、百家号、熊账号文章采集?

理论上,只要在代码里写好采集规则,都是可以支持的。但是,要实现这么多平台的采集规则,我实在没有精力去做,因为这个插件只是我业余时间在开发,但我也尽量保证一到两周进行更新一次,而且价格可以说是白菜价了,这么良心的开发者不多了吧,哈哈哈。

但是,我发现,采集文章无非就是识别文章的标题、文字内容、图片这三个主要的目标,如果针对每个目标网站设定好采集的规则,并且做成可配置的形式,那这样的工作量可以大大减轻,于是,便有了这个功能——采集规则配置,基本上,可以满足大多数用户的需求,但也会有例外,尤其是一些防爬做的好的网站,设定好规则也不一定能采集成功,但能够实现这样的功能,已经很不错了,不是吗?反正以后插件会继续更新,只会越来越完善,现在无法实现的功能也许以后就实现了。

当然,配置规则也有一定的门槛,就是你要懂一点 HTML 的规则,但主要有三点,标签、类、Id,关于这些知识,我不想在这里赘述,网上一堆的资料。

接下来就看看这个功能如何使用吧。

采集规则设置界面

上图是采集规则的设置界面,首先我们点击添加按钮,会显示一个表单,分别有网站地址、标题、内容、图片

其中,网站地址是指网站的域名,填写的时候记得带上http://或者https://

标题、内容、图片都是填写标签、类、id这三者之一,需要html的基本知识

填写好规则之后,点击保存即可,然后就可以导入该网站的文章内容了(理论上)。

如果你不会写这些规则,Bee 也可以接受付费代写,每条规则 15元。

更多服务

广告·AD

评论