打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
分布式数据标注DAPP郭成淦:我们比BAT在去中心化、时效性有优势

随着区块链技术的普及与人们对它的关注,越来越多的行业开始涉足区块链技术,用区块链天然的去中心化、防篡改、高透明、可追溯等特性去改造现有行业。


那么无人驾驶领域的数据采集标注遇上区块链会有什么样的奇妙反应?

 

响链财经有幸采访到中国第一批涉足无人驾驶领域的先行者郭成淦先生。



郭成淦



他在多年从事无人驾驶领域数据采集标注过程中,发现了传统数据采集大平台中心化程度高、时效性差、成本高、多样性不足等一些痛点后,发现了区块链这一剂良药。果断自己创业,用区块链技术去解决传统数据标注行业的诸多痛点。

 

那么什么是数据标注,他做的项目又是如何解决这些痛点的呢?我们一起倾听他的声音了解这个行业以及未来的发展趋势。

 

1、什么是数据标注?

 

当一个物体出现在我们面前时,我们会根据这个物体本身以及它的特征去识别它,为了让人工智能去识别它,我们首先需要把该物体用算法表示出来 ,先标记原始数据,然后通过几百万张原始数据去训练AI算法,当AI算法遇到这个事物时就可以识别它。比如我们把粉红色的衬衫标注成粉红色,把袖长标注成短袖,把领口标注为圆领。

 



2、为什么做数据标注?而且必须用区块链做数据标注?

 

人工智能领域的专家李开复曾说:“做好人工智能的先决条件是要有数据量和标注学习的能力”,所以我们做数据标注最终是为了后期的数据识别。

 

现在传统中心化数据标注存在人为分配造成供需资源不能充分匹配的问题,中心化平台人员规模限制、效率低下,标注方和审核方是同一利益方,额外沟通成本高、时效慢,此外还有需求方数据泄漏等问题。


数据标注扁平化

 

而使用区块链这样去中心化的技术,解决了分属不同利益的需求方、标注方和审核方这样的信任问题,去掉了数据标注的中间平台,通过数据标注的扁平化,解决了传统数据标注的一些问题,也提高了AI算法研发的迭代速度。

 

3、如何想到做分布式数据标注DAPP呢?

 

我本身之前在自动驾驶领域,我们需要对很多驾驶周边环境事物做很多标注,过程中发现了这一块的市场需求,传统的数据标注都是中心化的机构,费时间、高成本,像百度众包、京东众包都是类似的中心化平台,用户体验非常不好。

 

面对这样的市场需求,我们利用了区块链技术这样去中心化的功能。分布式数据标注DAPP是一个去中心化的AI数据标注与模型输出平台。



它通过加密算法、分布式账本和智能合约技术将数据标注供需双方直接对接,实现AI数据标注的扁平化和AI民主化。

 

4、项目目前处于什么发展阶段?

 

Demo开发阶段,目前还是APP的形式,未来我们会将积分激励功能加上去,这一功能正在开发,未来将会以DAPP的形式与大家见面。我们我们项目是今年5月份开始做的,各项功能都在陆续推进中。


标注任务界面

分类标注界面


 

5、当前团队组成是什么样的?

 

我本人之前在无人驾驶领域工作,我们发现了数据标注的一些痛点之后,团队里一些看好区块链技术解决传统标注痛点的同事出来一起做了这个项目,比如我们的研发中心的核心团队是我们之前做数据标注的研发团队。另外我们也引进了外部的一些合伙人,大家看好区块链,价值观也趋同,此外我们还聘请了一些技术大牛和外部顾问。

 

6、听说您未来还打算做一条垂直公链?这方面是怎么规划的?


是的,传统数据标注行业很大,像零售、无人驾驶、智能安防、金融领域等。


等我们现在的项目开发起来之后,我们可以给传统企业提供一整套的区块链技术服务,可以帮它们做链改、币改。像融资困难、负债等一些问题,很多大企业也希望通过链改来解决供应链的资金短缺问题。区块链市场相较于其他行业市场来说规模还是比较小的,后期会有很多这方面的市场需求。我们做公链是适应未来市场的需求。



 7、具体1-2年内的计划是什么?

 

我们将会从标注入手,这一块是最容易商业化的。这方面做大做强后,我们就有了稳定的现金流,如果能拿到外部融资,我们就可以做自己的公链。可以说我是第一批做无人驾驶的,无人驾驶早在2014、2015年之前还只存在于MIT等高校实验室以及一些像百度、谷歌这样的大企业,后来才走出一些专业人员做这个初创企业。所以等我们将标注做起来之后,会做像人工智能和无人驾驶这些领域的标注。等积累了一定的数据后,我们就可以做数据赋能、算法赋能。

 

8、在这个领域有没有和您类似的竞品?

 

传统做标注的有很多,像百度众包和京东微工,但是这些中心化的APP体验都不好。这个领域全球做的最好的是印度的Playment,我们现在就是想要做成像Playment这样全球知名的项目。

 

9、如果BAT也开发这样的项目,您有什么技术壁垒吗?

 

BAT分两个方面来做,第一,它本身是个众包平台,其次是一个中心化的平台,缺点就是评判标注质量是由需求方来评判的。作为中心化平台商业运作就需要抽成,加上很多初创公司不一定会信任它,更不会把很多数据放在BAT上,因为中心化的平台可能会把数据拿走。第二,BAT 有很大的数据量,它会开源,但是时效性不强,对于初创公司没有优势。此外关键还是算法的迅速迭代,像我们去中心化的平台数据及时,算法迭代更快,及时而且效率高,总结一句来说:我们的项目是去中心化的,时效性更强。

 

 

10、您现在和哪些科技公司展开了合作,除了科技公司,数据标注这样的模型输出还可以与哪些传统行业相结合?

 

人脸识别、图片搜索等领域我们也合作了一些企业。

 

很多传统行业可以利用我们的算法在图片识别、人脸识别、监控等细分的场景中使用。传统房地产行业,比如智能门禁、智能安防;淘宝购物行业的图片识别;甚至语音识别,语音客服这样的功能。将语音转换成文字,但是难点在于机器还无法了解语意的理解。 AI需要先识别,然后理解,这方面需要提供海量的数据去训练AI算法。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
和数传媒:区块链技术重塑全球数字经济信任机制
NFT是什么?NFT与区块链和IPFS有什么关系?
谈谈未来移动互联网的三大趋势
区块链+AI,恰似双剑合璧?
三分钟读懂THINKIUM
DAPP智能合约开发
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服