首页 / 正文
广告·AD

蜜蜂采集(BeePress) FAQs

插件 2017年1月8日 Bee 106 61522

随着 BeePress 的用户越来越多,作为它的开发者,我欣慰的同时也感到压力越来越大,毕竟这个插件的维护者只有我一个人,用户在使用的过程中自然会遇到各种各样的问题,并且大多数人遇到的问题都是相同的,为此我不得不将同样的解决方案向每个提出问题的用户回答一遍,这让我耗费了大量的重复劳动时间。所以,为了减少这种不必要的时间浪费,也为了让开发者能够专注于解决问题,希望各位用户在此页面留言,提出你的问题,一方面方便我自己,另一方面,也方便后面遇到同样问题的用户。

基础版和专业版有什么区别?

目前不区分基础班和专业版了,同时我新开发了一款新插件叫 蜜蜂百宝箱,目前集成在 蜜蜂采集 中,希望各位购买支持我。

专业版绝对比基础版要好用,并且专业版包含了基础版的所有功能

  • 支持的自媒体平台数量不一样
    • 专业版目前支持微信公众号文章、知乎专栏文章、简书文章三个平台,并且在未来的开发过程中,会增加更多的自媒体平台
    • 基础版支持并且仅支持微信公众号文章的导入
  • 功能有什么不一样
    • 首先,使用都方式都很简单,只需要简单地粘贴文章链接,然后点击确定(开始采集)即可一键采集
    • 专业版增加了一个配置保存功能,而不必每次导入的时候,需要重新选择,比如,用户每次导入的时候,文章的发布时间选择的都是原文时间,而不是当前时间,如果保存了配置之后,就不必做这个重复操作,而这个在基础版是体验不到的
    • 专业版增加了一些有利于SEO的功能,比如图片的 ALT 和 TITLE 属性的设置,图片文件名的设置,并且未来会支持更多相关功能
专业版配置界面
  • 专业版支持设置和原文一致的封面图
  • 体验有什么不一样?
    • 专业版支持无刷新导入文章,可以看到采集进度,并且可以看到采集结果,采集完成后,可以选择查看文章以及编辑文章
    • 专业版支持同时导入上百篇甚至更多的文章而不会导致服务器不响应

为什么会导入失败?为什么图片无法显示?

  • 如果在使用的时候,提示导入失败,通常有几种情况
    • 提示失败,但是在文章列表中可以看到该文章
      • 这种情况是因为导入的时候,在下载图片的时候可能超时,导致链接断开,而下载过程还在进行,但此时文章是导入成功的了
    • 提示失败,并且可以看到文章列表中存改文章,但内容为空
      • 这种情况和前者类似,但因为下载图片出错(非超时),导致文章写入不成功
    • 提示失败,并且文章列表没有该文章
      • 这种情况可能是微信文章链接过期或者服务器!服务器!服务器的IP地址被微信屏蔽了
    • 图片显示为未经授权(防盗链),可能是上传目录的权限问题,可以尝试提高该目录的权限

如何写采集规则

规则编写

网站地址,填写需要采集的网站的域名即可,记住非文章链接

标题、内容、图片的规则和jquery选择器一样,我们以星月主题网站为例

通过查看网页源码可以看到,标题的标签是h1,并且是唯一的,于是我们的标题的规则就可以设置为h1

然后是内容,可以看到有一个 class 是 az-post-content,于是我们的内容规则可以写为 .az-post-content,注意前面有一个  .  符号,如果是id,则以#号开始

类似的,图片的标签通常是img,于是我们的图片规则可以写为img,但是还有一些特别的情况就是有些网站的图片是懒加载的,并没有src,而是data-src,这时候我们需要将规则写为img|data-src,本站即采用这种懒加载模式

评论


全部评论

  • kekexili 2018-01-09 10:50

    功能需求:公众号文章采集后能否清除空行?
    描述:公众号文章排版分段基本都有空行。空行不适合wordpress文章排版,手动删除空行太麻烦了。

    回复
    • Bee 2018-01-09 11:51
      @kekexili

      好的,收到,已经记下来了

      回复
  • GC 2018-01-16 22:10

    能不能采集今日头条的内容么?

    回复
    • Bee 2018-01-17 12:25
      @GC

      下一个版本就支持了,放心

      回复
      • Bee 2018-01-17 12:26
        @Bee

        下一个版本是4.0.0

        回复
  • zzz 2018-02-07 16:16

    现在采集之后,图片都变成“图片来自腾讯,未经授权不可引用”。如何解决这种出现防盗链图片的问题?

    回复
    • Bee 2018-02-07 21:44
      @zzz

      这个暂时不知道,有几个用户出现这种问题,方便的话可联系我,我帮你调试一下

      回复
    • Bee 2018-02-10 11:03
      @zzz

      可能是上传目录权限的问题,可以试试提高权限

      回复
    • AAAA 2018-04-16 10:46
      @zzz

      盗链的问题好不好?作者一看就不懂这个。
      不过估计这个回复也不会出来。

      回复
      • Bee 2018-04-17 17:25
        @AAAA

        不是的,如果目录没有写入权限的话,那么就会使用默认的链接,这样就会有防盗链的问题

        另外,这个盗链的问题我清楚得很,不要自作聪明

        回复
  • 根本有型 2018-03-24 00:38

    试用了专业版,发现采集头条的文章时,文章内的图片会采集2遍,有些蒙圈

    回复
    • Bee 2018-03-26 22:20
      @根本有型

      这么奇怪么,我会测试一下

      回复
  • 2018-03-26 10:36

    有無支持簡繁翻譯?

    回复
    • Bee 2018-03-26 22:20
      @凡

      WordPress 有其他插件支持,比如Chinese Conversion

      回复
  • 自媒体人 2018-04-02 10:34

    会有自动导入的支持吗?就是我填写一个专栏地址,可以自动抓取,不用每次自己去填写链接抓取

    回复
    • Bee 2018-04-03 12:16
      @自媒体人

      我会尽量去实现这样的功能,这也是小蜜蜂插件的目标

      回复
      • 粉丝 2019-06-15 06:28
        @Bee

        非常期待有这样的功能,看似实现起来不会太难?

        回复
  • 劳震宇 2018-04-04 00:22

    请问小蜜蜂-专业版导入微信公众号推文的时候,是否能按微信公众号推文的发布时间设定WordPress文章的发布时间呢?

    回复
    • Bee 2018-04-04 13:36
      @劳震宇

      我试了一下,按照原文的时间进行发布,是没有问题的

      回复
  • din 2018-04-11 21:26

    不能批量采集吗?就是直接搜索某个公众号,把历史文章全部采集过来。

    回复
    • Bee 2018-04-12 14:52
      @din

      这个不能通过插件采集,只能通过手机的协助采集,我这里提供这个服务

      回复
  • Chen 2018-05-07 09:52

    功能需求:
    豆瓣文章采集

    回复
    • Bee 2018-05-07 10:34
      @Chen

      好的,谢谢建议,我会考虑这个

      回复
  • easy2003 2018-05-07 17:12

    请问能采集今日头条里面的微头条么?

    回复
    • Bee 2018-05-17 19:17
      @easy2003

      微头条暂时不支持,仅支持文章采集

      回复
  • 谢雨枫 2018-05-16 09:32

    更新最新版后 基础版还是不能采集微信 提示“此条URL没有文章标题”
    能不能解决下 暂时只采集微信公众号文章

    回复
    • Bee 2018-05-17 19:18
      @谢雨枫

      联系我微信吧,基础版有些用户无法使用,我给您免费更换为专业版吧

      回复
  • 2018-05-23 17:40

    提问,能否自动删除指定的段落
    比如,第一段和第二段,倒数第一段和第二段

    回复
    • Bee 2018-05-24 11:06
      @陈

      暂时没有这样的功能

      回复
  • kekexili 2018-06-29 09:50

    问题反馈:
    采集公众号文章时,部分图片丢失,部分图片会重复显示。重复显示的图片位置就是丢失图片的位置。
    猜测是采集图片命名规则的问题:现在的规则是按数字顺序123,124…,这样容易导致图片名称重复,然后就被覆盖了…

    回复
    • kekexili 2018-07-03 12:17
      @kekexili

      补充:可能是图片名称重复后不支持自动重命名导致的。

      回复
  • Jasmin 2018-07-10 11:50

    同样遇到采集微信公众号文章之后,图片在wordpress博客变成“图片来自腾讯,未经授权不可引用”。ps.上传目录权限没问题,都是777可读可写。

    回复
    • Bee 2018-07-11 17:14
      @Jasmin

      还有一种可能就是你的临时目录

      回复
  • kekejgkks 2018-08-19 19:48

    提示 采集失败 什么原因 ,加客服也没成功

    回复
    • Bee 2018-08-20 14:28
      @kekejgkks

      请加我微信:always-bee,采集失败的原因有很多,通常是采集超时

      回复
  • 2018-08-26 09:38

    提个建议,加个直接将图片保存到远程服务器的功能…图片保存在本地的话一个是网站服务器以后调整起来挺麻烦的而且会影响访问速度,一个是一张图片会占用一个ID,会很烦…

    回复
  • 2018-08-26 09:51

    嘿嘿嘿,或者想个办法,能上传到图片微博图床,那就更好了。

    回复
    • Bee 2018-08-26 21:07
      @宅

      有相关的图床插件,比如七牛和阿里云oss

      回复
      • 2018-08-27 08:42
        @Bee

        七牛和阿里云oss都太贵了…单独建一个图片服务器比用这些服务划算太多

        回复
      • 老幾 2018-10-11 13:48
        @Bee

        绑定七牛和阿里云的图床还得需要备案的域名,这对于使用海外服务器的人来说实在是不方便。
        建议可以将图片上传到指定的FTP服务器。因为FTP服务器的搭建很简单,容量无限的

        回复
        • Bee 2018-10-12 15:39
          @老幾

          以前是不需要的,他们最近改政策了

          回复
  • 2018-08-28 13:58

    对了,还想问一下,看到文中有说服务器的IP地址被微信屏蔽这种情况,这种屏蔽会经常出现吗?被屏蔽是屏蔽多久?

    回复
    • Bee 2018-09-09 21:37
      @宅

      屏蔽通常是会在频繁采集的情况下出现,但大多数用户不会遇到,屏蔽时间我这里也不清楚,我是通过更换IP解决的

      回复
  • Sun 2018-12-25 16:11

    感觉还是借鉴以前的采集模式吧,规则里配置列表页,配置文章页,然后点击开始按钮就自动采集文章内容和图片到站点上~

    回复
    • Bee 2018-12-28 11:26
      @Sun

      嗯,列表模式后续支持

      回复
  • 瑞卡 2019-01-03 22:15

    和第一天评论的感觉一样,现在有一个公众号采集去除空行的选项,但是默认是关闭的,所以经常性忘记删空行,采集了还得去一条一条编辑。能不能默认开启去除空行?或者在全局配置页加个开关?

    回复
    • Bee 2019-01-04 22:39
      @瑞卡

      嗯,空行这个到时候默认去除确实好一点

      回复
  • IT搭档 2019-01-06 17:12

    采集微信公众号文章没有问题
    采集今日头条和简书一直导入失败

    回复
    • Bee 2019-01-06 23:04
      @IT搭档

      头条和简书容易屏蔽IP,到时候我再看看有什么解决方案

      回复
      • IT搭档 2019-01-09 22:07
        @Bee

        今天收到插件更新,但是头条简书还是失败

        回复
  • hello word 2019-01-09 04:07

    ng switch is equivalent to “break”. Did you mean to use “continue 2”? wp-content/plugins/beepress/beepress-pro.php on line 927 请启动出现这个问题怎么解决阿?

    回复
    • Bee 2019-01-09 15:07
      @hello word

      谢谢反馈,已经修复,请更新 6.1.6 版本

      回复
  • 蜜蜂大大 2019-01-18 16:23

    为什么只能替换,而不能直接去除?例如,文章开头——请关注公众号“xxxx”,这段话我想直接去掉不显示,不需要替换成任何东西。

    回复
    • Bee 2019-01-19 22:00
      @蜜蜂大大

      等号右边为空就行了

      回复
  • 吴亮 2019-02-04 14:49

    能不能把,wp博客的文章,同步到自己的微信公众号上面? 有很多自媒体,都是wp博客写的,同时也有自己的公众号。如果自己在wp博客上面写完了发布了,就点击同步,自动发布到公众号上了。

    回复
    • Bee 2019-03-16 16:12
      @吴亮

      这个还不能做到

      回复
  • 彼铭 2019-02-15 19:48

    大佬,采集规则可以加个过滤工具吗?不然总要去删掉一部分无用内容,有点麻烦。

    回复
    • Bee 2019-03-16 16:11
      @彼铭

      嗯,后续会加上

      回复
  • Jumper 2019-03-06 02:54

    这个插件会在文章最后加上一个“相关文章”的块,貌似我在不同网站发的帖子会出现在这里。找了好久才发现是这个插件生成的。请问这个怎么可以去掉?

    回复
    • Bee 2019-03-16 16:11
      @Jumper

      可以到配置中进行选择是否可以开启这个推荐功能

      回复
  • Amoy厦门 2019-03-27 17:49

    一直采集失败,之前都是正常的。这两个月都不行了。 找不到原因

    回复
    • Bee 2019-04-14 11:44
      @Amoy厦门

      已解决

      回复
  • 臾凉 2019-03-28 13:37

    小蜜蜂专业版和基础版,是收费的么

    回复
    • Bee 2019-03-28 19:04
      @臾凉

      现在都是免费的

      回复
  • ojbk 2019-03-31 14:21

    需要登陆 才能 采集的 内容 要设置 cookies 什么加上就好了

    回复
    • Bee 2019-03-31 21:09
      @ojbk

      嗯,这个到时候会考虑

      回复
  • Lintvo 2019-05-14 14:59

    什么时候支持阿里云OSS的图片上传?我现在一直是手动下载图片然后传到OSS。这个功能愿意付费,捐助也行

    回复
    • Bee 2019-05-15 09:43
      @Lintvo

      这个应该有现成的官方插件

      回复
      • Lintvo 2019-05-17 14:24
        @Bee

        我装了OSS upload插件,正常编辑文章的图片是上传OSS的,但是用蜜蜂采集不行。还是说我什么地方设置不对?

        回复
  • qwerty1 2019-06-08 19:43

    支持打乱顺序和自定义关键词随机吗?

    回复
    • Bee 2019-06-09 19:52
      @qwerty1

      不太明白你的具体需求

      回复
  • k 2019-06-09 14:40

    请使用wp_enqueue_scripts 替换 init . 因为插件使用init 加载css 和 js. 前台的 embed页面也加载了beepress的无用css和js

    回复
    • Bee 2019-06-09 19:52
      @k

      嗯,好的,谢谢你的建议,目前插件已经在重构了,将会更新

      回复
  • keziy 2019-07-19 13:28

    采集后能否支持古藤堡区块,现在采集后编辑,使用的是古藤堡里的经典,这样排版实在很麻烦。有办法支持分开的区块嘛?

    回复
    • Bee 2019-08-02 18:15
      @keziy

      古腾堡可以一键转换区块的

      回复
  • Amoy 2019-08-04 10:42

    现在今日头条已经不能采集了

    回复
  • 巨蟹 2019-08-06 13:57

    采集头条的时,图片全是乱码

    回复
    • Bee 2019-08-09 15:54
      @巨蟹

      了解,我会找时间修复

      回复
  • 壹涂 2019-12-08 00:19

    简书采集不了

    回复
    • Bee 2019-12-10 15:39
      @壹涂

      等有空我会尝试修复

      回复
  • caomu55 2019-12-14 23:10

    现在添加新的采集规则,已经显示OK,但保存后找不到它?怎么使用新的采集规则呢?

    回复
    • Bee 2019-12-20 22:52
      @caomu55

      是不是没有填写完整规则

      回复
      • caomu55 2019-12-29 10:56
        @Bee

        现在可以了,以为每保存一个规则,就会在采集页面出现选项,原来楼主是集合型的采集,自动识别不同域名使用相应的采集规则,楼主真是太厉害了!如果能在保存的时候提示一下这个,就更好了

        回复
  • caom55 2019-12-29 10:53

    您好,微信文章如果开头有语音,就只采集到语音,后面的文本内容是不采集的,如何避免这种情况呢?

    回复
  • sem 2020-01-22 10:32

    可以支持采集woo商城的数据吗

    回复
  • Sun 2020-02-01 04:34

    有个bug很久了,文章采集失败以后会留下保存的图片,数据库会保留标题,这样子如果时间久了媒体库里会有大量垃圾图片存在,但因为数据库标记是存在这篇文章的无法定位删除这些图片,另外下次再采集这篇文章的时候也会因为存在同样文章无法采集,因为数据库里已经有这篇文章,而实际上你的网站并不存在这篇文章,前台后台搜索这些文章标题也无法查找;一次采集失败手动进入媒体库找到这篇采集失败的文章保存下来的图片,可以进入到这篇文章,只有标题没有内容,希望作者跟进处理做个BUG~

    回复
  • XX 2020-02-13 06:43

    功能需求:日志功能
    描述:在自定义添加采集网站中,失败无法查看原因,可以添加日志,进行分析失败原因进行有效修改。

    回复
    • Bee 2020-02-15 16:33
      @XX

      嗯,有日志是最好的,不过由于个人的精力原因,短时间内不会有这样的功能,常见的错误原因我在插件上已经注明了,可以先排查一下

      回复
  • xunjing 2020-02-17 14:26

    怎么更换用户头像?

    回复
    • Bee 2020-03-07 20:59
      @xunjing

      这个,WP 后台可以设置,具体的网上搜搜吧,不属于采集插件的范畴

      回复
  • 流年 2020-03-13 11:19

    公众号图片采集不到,都是微信未引用,怎么解决

    回复
  • BONBON 2020-03-20 20:39

    今日头条采集到的只有标题,下面内容空白。

    回复
  • Lintvo 2020-03-26 10:10

    文章太长会导致没法抓取吗?遇到长篇公众号文章会出现错误。
    提示错误信息:SyntaxError: Unexpected end of JSON input.

    谢谢,辛苦!

    回复
    • Bee 2020-03-29 20:44
      @Lintvo

      升级插件试试

      回复
  • 邓华德 2020-04-03 19:57

    微信公众号文章采集提示:无法文章获取标题
    这是什么原因

    回复
    • Bee 2020-04-15 07:59
      @邓华德

      检查一下是否需要升级

      回复
  • fireplay 2020-05-25 03:27

    您好,非常感谢您的插件。能不能解释下“自定义图片 Title 和 Alt 属性值”是什么意思?是不是图片的ALT(替代文本)?我尝试采集后,图片的ALT(替代文本)是空的。有什么方法能加上这个替代文本吗(便于SEO)?

    回复
  • 小景 2020-08-28 01:12

    启用时报错:Parse error: syntax error, unexpected T_STRING in /data/home/hyu7900140001/htdocs/wp-content/plugins/beepress/beebox/beebox.php on line 2

    第2行是:namespace Bee\Beebox;

    回复
    • Bee 2020-09-03 13:35
      @小景

      检查你的php版本,需要 5.3 以上

      回复
  • 2020-09-14 01:01

    不能删除?提示:您不能删除主站点正在使用的插件。

    回复
    • Bee 2020-10-23 17:29
      @五

      删除插件需要先暂停插件

      回复
  • dxm 2021-03-02 23:40

    公众号文章链接不能复制到插件的文章链接框内

    回复
  • Xidorn 2021-04-29 15:24

    请问怎么能发布到自定义类型的文章。
    谢谢!

    回复
    • Lintvo 2022-04-28 10:48
      @Xidorn

      百宝箱里采集,下面的基本配置里可以选择。

      回复