打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
阿里巴巴:建立集数据科学,机器学习和云计算的零售生态系统

数据科学和机器学习领域具体见解是阿里巴巴全球扩张战略的核心。

零售战争早已走向科技。亚马逊是这个转型的一份子,首先通过在线业务铺路,然后拥抱云计算,并通过Amazon Web Services(AWS)为计算和存储提供更先进的计算和存储服务。

亚马逊在零售及其云计算产品的市场份额方面可能是无可争议的领导者,但这并不意味着竞争仅在于此。有些人认为是亚马逊对手是中国的阿里巴巴,是受到亚马逊成功的启发。然而,阿里巴巴在零售和云计算方面的战略是多样化的,但两者融合在一个焦点:数据科学和机器学习(ML)。

阿里巴巴首席数据科学家万立民是设计和实施阿里巴巴战略的关键人物。ZDNet有机会与Min谈谈云中的零售以及数据科学,数据管道和ML。

零售商

阿里巴巴在美国并不是一个家喻户晓的名字,因为电子零售市场由亚马逊和沃尔玛与其他人一起主导。亚马逊近期的扩张动向,以及沃尔玛对其员工随之而来的迁移应用程序的需求,达到顶峰。

阿里巴巴在中国是巨大的,中国市场也是巨大的。这使阿里巴巴成为一个力量。甚至更多,因为在零售和云计算方面,增长仍然在持续。很显然,阿里巴巴在那里有主场优势。

尽管如此,阿里巴巴也瞄准扩大到国外市场。除了亚洲,阿里巴巴在中东,美国和欧洲也在扩张。这使的它得到了巴黎调查伙伴关系,并倡导阿里巴巴云参与了Viva技术。

阿里巴巴2014年创纪录的IPO恰逢阿里巴巴云的推出。阿里巴巴向亚马逊寻求灵感,但其云策略多元化,反映了其整体战略。阿里巴巴作为零售商的生态系统,包括所谓的经济形态。

这意味着阿里巴巴希望成为其零售客户的服务提供商,而不是拥有像亚马逊或沃尔玛这样的整个交易平台。现在,阿里巴巴希望利用其云,数据和专业知识,成为其生态系统合作伙伴的数字转型(DT)机构。

“云已经被接受了,但问题是 - 下一步是什么?”Min说,“你能用这种计算能力做什么?我们的答案是数据智能,提供实时可行的见解。我们将云,我们的数据和我们的专业知识结合在一起,通过数据科学促进发展。“

垂直,价值 - 大脑

阿里巴巴最近推出的“大脑”:阿里巴巴针对医疗保健,运输和制造等领域的域名智能解决方案。这与AWS形成鲜明的对比,AWS提供通用的基础架构和工具,并允许客户端构建应用程序。

Min解释说,理由是通过提供一个增值主张而不是追赶他们来从AWS多元化。“说服客户走云是很容易的,但我们需要说服他们去阿里巴巴云,我们做出了不同的选择:垂直,垂直,垂直,价值,价值,价值。

这可能听起来像是阿里巴巴的合理策略,但并不容易实现。

首先,您如何才能在一个地方获得这么多领域的专业知识?对于制造和运输领域,阿里巴巴通过寻找和雇用合适的人才来利用专业知识。但是Min表示,他们不能为每一个领域做到这一点,所以目标是建立战略伙伴关系。

Min我们开发了一些可行的工具,如1.0版本,我们的合作伙伴可以从中开始,然后与他们一起构建版本2.0,3.0等。那里只有一个问题:“可行的东西”如何与现在由多个领域开发的专门解决方案进行竞争?

“我们有疑问,”闵承认。“这样做意味着要对抗专业的竞争对手。” 阿里巴巴可以提供的云的优势,如弹性和跨地域的扩展,这些解决方案也是给予的。在(AWS,Microsoft,Google等)云中运行,SaaS意味着这不是一个区别因素。

那为什么要去阿里巴巴?总是有生态系统的方面,闵敏的答案依赖于数据科学:“我们可以支持客户进入未知的领域,我们的大脑可以支持你,你不会自己打架 - 你会有一个数据科学家团队在你身边。“

什么是数据科学团队?

那里的数字是数量。阿里巴巴拥有约3.7万名员工,其中2万名是技术人员。Min是跨职能团队300人的领导者,其中包括约50位数据科学家,200位数据工程师和50位业务专家。中国也感受到数据科学技能的短缺,但闵表示,他们已经设法从日本,欧洲和美国等地招募人才。

那么所有这些人如何工作,什么让他们忙?Min说当接近一个新的领域或问题时,他们以探索的方式这样做,但总是以面向企业的心态。例如,选择运输和物流的潜在影响力。即使阿里巴巴合作伙伴的单位数字改善也可以节省大量成本。

“有不同的阶段,”闵说。“最初,没有人知道我们能做多少,我们调查可行性和边界 - 哪里可以突破目前的障碍,然后我们试图加速,找到更好的方法,并邀请我们的合作伙伴共同创新。

这听起来很紧密,但也是劳动和时间密集。阿里巴巴是否认为这是自动化过程的一部分,或者为此使用某种框架?“我们的方法是半自动化的,我不相信全自动数据科学。” “那里有一个巨大的风险:你可能想出一些在现实世界中没有意义的东西。

例如,如果你在物理学方面做探索性的工作,你必须确保你的结果符合物理学规律。在业务中,您的结果必须符合业务流程。否则,你可能会最终得到纸上看起来不错的结果,但没有意义。

Min有许多虚假的相关例子。但是,生产力的提升并不是自动化任务,如尝试大量的ML模型和功能诱人的?阿里巴巴做什么来确保ML结果在现实世界中有意义?

“我们做健康检查”闵小姐说。“这是专家,而不是数据科学家,我不想要数据科学家参与,我希望有批判性观点的人这样做,他们不知道技术,但他们知道领域,可以告诉你是否有意义。

是的,可以想象,你可能会遇到类似Go的情况,一个算法可能会给出没有任何意义的结果,因为你没有想到一些可能的事情,但是我们不是在说这个。我们正在谈论检查你的举动是否在董事会中,可以这么说。如果结果符合规定,罚款,否则您有问题。我看到很多,这就是为什么我坚持。

黑匣子和数据管道

而ML的黑匣子问题呢?使用ML可能会给出很好的结果,解释这些结果是如何得出并不总是容易的。“这是一个很大的问题,”闵小姐说。“预测是伟大的,但最终都是关于可行的见解,我们的客户想知道如何改进,哪个因素要改变,为什么,所以我们需要有可说明的模型,我不喜欢大量的数据智能,而不注意我们的客户也经常告诉我们。“

闵的处理方式是建立两个模型 - 一个快速的一个和一个可解释的模型。“我们使用黑盒子模型来获得结果,然后我们尝试使用具有可解释结构的传统模型来近似我们的结果,只要我们有一个可解释的模型,可以近似无穷小差异的结果, d去找一个可以解释的模型。

我们经常很难向客户解释结果。如果我们使用近似模型,那么销售更容易:这是负面影响,这是积极的影响...这与专家的世界经验相匹配。他们可能无法量化它,但它们可能与正面和负面影响有关。“

他表示,他们建立这样的模型,看起来像逐步逐步回归,尝试模拟和近似黑盒子模型。但是,当您拥有成千上万的功能时,总是可以做到这一点吗?哇,难吗?对于Min,“你需要运行它们的计算能力,但构建它们是最难的部分。

每个新产品需要一段时间,因为它是一个试错过程。甚至难以定义问题:我们需要考虑所有的输入,找出我们应该期待什么样的输出,等等。我们需要在一些较小的问题中解决问题,这需要技术和业务专长。

例如,我的团队曾经提出了他们认为是一个很好的解决方案来解决某个问题。但是,仔细看看,该解决方案在很大程度上取决于一个易受攻击的参数,因为它的值来自一个传感器并不是100%可靠。所以这个模型是不可行的。如果缺少这个值,还是错误的话会发生什么?

最后,阿里巴巴在数据管道上使用什么样的架构和基础设施?其流水线是经典的Lambda架构,具有流层和批次层。事实上,阿里巴巴使用Flink和Storm进行实时数据处理相当复杂,在这两种情况下都有自己的分支。

闵说,原因与遗产有关。这也是为什么公司没有立即计划将其架构压扁到一个纯粹的流媒体Kappa,因为它必须支持使用Storm的现有合作伙伴。

他强调,伙伴关系是阿里巴巴扩张战略的关键,所以在这方面,这是有道理的。Min还声称“Brain”解决方案经过测试和可靠,并且将针对点解决方案具有竞争力。阿尔巴巴这个战略有多好,而且可以获得多大的牵引力还有待观察。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
生态系统的全面发力,阿里“帝国”的未来边界在哪?
解密阿里 AI 战略:从日常的应用场景而来,智能语音产品呼之欲出
重磅!阿里云重要人事变动:离职科学家创立VC基金,LP来自中东某主权基金
亚马逊式创新
先有AlphaGo战胜李世石,后有阿里交易额赶超沃尔玛,时代真的变了!
许一力:阿里上市后的国际野心
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服