打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
图书盘点定位,只靠计算机视觉可行吗?


PPT能造的东西可多了

在人工智能技术应用里面,发展比较好的有语音识别、图像识别、智能推荐、自动翻译以及一些专有应用。
计算机图像识别技术应用场景很多,最为人所知的就是人脸识别,无论是道闸识别还是手机上的人脸识别;文字识别,OCR。其他还有:视频和监控分析;图片识别分析;驾驶辅助;三维图像视觉;工业视觉检测,机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域;医疗影像诊断;图像及视频编辑。
自从图书馆利用RFID技术管理图书以来,图书馆对纸本资源的管理上了一个台阶,当然有不好解决的痛点存在,就是图书的盘点和定位。高频RFID率先使用,配套的盘点设备和技术(主要是识别算法)的工作效率和精度还不能令人满意。
陈力军老师团队一直深耕于以RFID为基础的物联网研究,有一次在邵馆带我们去陈老师实验室,经过思想的火花碰撞,产生了做图书盘点定位这件事的念头,起始是以超高频RFID开始研发的。图书智能盘点机器人研发出来之后,经过几年的攻关,目前第五代非常成熟了,不管是硬件设计还是软件构建。第三代的时候,盘点机器人就已经可以商用了。从那时起,市场上看到这一块有利可图,不少公司开始做这块,当然缺少了坐冷板凳研发的一帮科研人员,大多数公司的盘点机器人并不具备技术上的突破。
在市场开拓的过程中,图客发现图书馆行业高频RFID市场占有率远远高于超高频RFID,这是因为公共图书馆最早用起了高频RFID,并且不少图书馆就采用了。高频RFID由于天然的缺陷,图客盘点机器人盘点定位准确率一直上不去。后来想出了计算机图形识别这个辅助办法,陈老师团队有几个博士和硕士一直在做这方面研究,他们的视觉识别在国内可以算作第一梯队里面的。
团队当时也想过,如果只用计算机视觉识别,能不能做到盘点定位图书。这个识别主要是拍摄书脊的图像和书名,具体的工作模式可以看看我写的几篇机器人推文《进击的图客机器人》、《机器人,终极目标是简单高效》、《盘点机器人准确率达到98%的秘密》,里面提到过,但是不能写技术细节,那样的文章看的人不会多。后来加入和分类号索书号识别,这样就提高了识别精度,多途径识别,最后汇聚。
回到题目,图书盘点定位,只靠计算机视觉可行吗?视觉盘点定位图书,做法一般有这么几个。
1、充分利用书脊的图像、图形、文字、索书号,图客做过大量测试,这种识别精度能达到85%,很难再突破。这种方法优势就是特别节省经费,只要机器人视觉识别即可;缺点也很明显,还是要用磁条防盗图书。薄书的书脊就看不见的,难以识别。破旧的书,也比较难识别。索书号贴得再牢,时间久了也会脱落。所以只靠这种办法,不可行。
2、书脊贴二维码、一维码、三维码、彩码,当然,书脊上只能贴那种很小很小的二维码和一种日本的彩码(国内没有案例)。这种方式还是不错的,据湖州师范同行反馈,应用效果不错。优点是成本低,识别效率和精度不错。缺点依然明显:二维码的脱落、薄书如何处理、防盗依然需要磁条。这种方式市场上的案例不多,我没用过,所以不能信口胡说。这确实是一种方式,实际上就是读二维码。识别精确度不知道是多少。
3、还有利用安装在馆内各处的高清摄像头,来拍摄书架识别之类的。这种有一些公司提过,但没有产品或者解决方案出来。
4、给书架装很多以摄像头为核心的一个识别系统,来扫描书架,当然是扫的对面书架上的书,如果是单侧书架,就得想办法装这些摄像头到墙上或其他物品上。这种方式的原理其实和第一种有些类似,但是是用固定的很多摄像头代替了机器人跑来跑去。
这种方式,要说优点,很难找,就是实现了盘点定位这个需求;缺点不少:造价高,要装很多摄像头,摄像头数量取决于它拍摄清晰的范围;不安全,要改造书架,要供电;同样存在薄书旧书烂书的问题;需用磁条防盗。精确度一定不会高,有厂家号称能达到95%以上,这个就有些吹牛了。
计算机视觉识别技术没那么容易,陈老师团队的视觉识别,用了很多方法和算法在里面,比如每个位置拍5张照片,做融合等。感兴趣的话,可以看我前面写的盘点机器人和RFID技术普及的专题文章。
真正能撑住一片天的盘点定位图书方法,就要算这两种方式:超高频RFID芯片,图客盘点机器人;高频RFID芯片+视觉识别辅助,图客盘点机器人。RFID芯片既能存储信息,也能防盗(省去再贴磁条的成本);这样的话,就不管书的具体形态了(脏、乱、旧、缺书脊信息、缺索书号),只要RFID芯片在里面,都可以读到,唯一的缺点就是太薄的书摆在一起,给单本书的精准识别带来了困难,因为离得太近了,机器人有可能会混淆两本书。这个精准识别图书,就是算法的功劳了。这个精准度的提高,一方面依赖于RFID芯片自身的设计制造,希望远望谷能解决一些需求,毕竟国内能国产造RFID芯片的就他们了,另一方面就是陈老师团队不断根据芯片技术来提升和优化机器人定位算法。
如果有人拿着PPT给你演示他们的视觉识别盘点技术能达到95%及以上,你就要警惕了,以防PPT造系统;毕竟,国内那么多资本大佬用PPT造车的例子并不少见。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
天星风水二十四天星盘及运用
林烽-壬学思维导图
2023年九宫飞星图及风水方位吉凶与化解
倪海厦《天纪》笔记21-2:四柱命卦水天需,天水讼,地水师,水地比
以气数的辨别定家族大势,风水吉凶的本源思考(二)
中国谋略大师《诸葛亮兵法》卷三·文集-45-【与参军掾属教】
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服