打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
一文了解SAP Data Hub

SAP Data Hub是一种数据共享,数据流和业务流程解决方案,可帮助公司加速和扩展其现代多样化数据环境中的数据流。

SAP Data Hub提供对各种数据系统和资产的可见性;允许轻松快速地创建功能强大的跨组织数据流水线;并通过每个步骤的“下推”分布式处理方法,优化数据管道执行速度。

SAP Data Hub满足企业的治理和安全需求,确保采取适当的策略措施,以满足合规和公司要求。

1

概览

当需要了解一个产品的时候,首先最应该看的就是它的营销介绍,因为这里最核心、最直观、最易于理解。

接着就是SAP Data Hub的架构组成,在这里你能看出它能干什么,想干什么,以及集成关系。

然后产品的发展路线图也非常重要,了解当前阶段以及产品的预期发展方向,对于自己是否选择这个产品,或者是否需要了解这个产品非常有必要。

总而言之, SAP Data Hub是一个数据目录,其中包括流程(管道和工作流)建模,执行和报表,并增加了自助数据准备。

它利用SAP VORA进行大数据访问,并通过敏捷数据准备,利用智能数据集成,来实现ETL功能,以及保障和提升数据质量。

2

有比以往更多的数据和更多的存储和使用方法。虽然这些数据具有商业机会,但企业数据格局,正变得越来越复杂,组织越来越难以理解他们拥有的数据,而是在需要使用它的所有不同系统中工作,并应用端到端治理,以捕获最大价值。

关键痛点:

  • 数据保存在整个企业的孤岛(文件,Hadoop,数据仓库等)中。用户无法在存储它的孤岛中访问和使用所需的数据。特别是,将大数据与企业数据和业务流程连接起来以获得洞察力和价值是非常复杂,耗时且成本高昂的。

  • 复杂环境中需要的端到端数据治理:很好地理解跨越环境管理和管理数据的需求。确保数据沿袭和变更影响分析,管理安全性和隐私要求等都是受信任的企业环境的关键方面。随着企业环境的复杂性增加,现在可以包括Hadoop数据池,EDW,云存储,企业应用程序等,适当提供有效治理的能力更加困难。如果没有跨所有数据源的端到端治理,组织就无法信任并依赖数据的准确性,从而为使用分析的任何人或使用数据的运营应用程序创造风险。

  • 大数据技术缺乏企业准备:企业通常无法通过将所有数据存储在Hadoop数据池中来解决其环境的复杂性。Hadoop解决方案虽然功能强大,但通常没有企业所需的治理和安全措施。数据池通常对大数据计划的治理有限,在自然环境中安排处理的自动化程度很低,各个技术的监控和跟踪能力分散,缺乏通用的安全和访问管理。

  • 当前可用的工具需要很大的努力来产生整个企业的数据场景。如今,许多集成工具都是点对点的,需要经过严格培训的资源才能执行,而且手动性很强。这使得快速连接和实现所需数据结果具有挑战性。

  • 通常需要专业技能来实现,扩展和创造大数据计划的价值。这些专门资源往往难以找到并难以保留。

SAP Data Hub与其他产品有何不同?

SAP Data Hub为数据管理提供了一种更简单,更具可扩展性的方法。

借助企业跨越式数据集成,处理和治理,SAP数据中心可在现代企业中,提供对复杂数据网络的可视性和访问。通过提供广泛、详细且易于理解的整个数据环境视图,从Hadoop和Amazon S3到SAP HANA和ERP,SAP数据中心可帮助组织深入了解数据源,使用,互连,质量和影响。这使企业能够从数据中看到新的机会,解决新出现的数据问题,并确保数据流向需要的地方。

SAP Data Hub通过在单一可视化设计,可轻松快速地创建功能强大的数据管道,从而加速和扩展您的数据项目

在单一环境中,数据管理员可以轻松快速地创建功能强大的数据管道,以便从整个组织的各种来源访问,协调,转换,处理和移动信息。例如,管道创建者可以轻松激活强大的库,以进行计算或机器学习;快速连接各种类型的数据,例如社交媒体,客户和产品信息;并利用现有的处理投资,例如SAP HANA,Apache Hadoop,SAP Vora或Apache Spark中的功能。可以轻松复制,修改和重新使用管道模型,以加速管道部署并利用最佳实践。

SAP Data Hub通过创新的“下推”处理加速业务成果,为更灵活,更全面的数据驱动应用程序提供支持。

SAP Data Hub不仅可以加速跨越不同数据源的数据管道的创建和管理,还可以通过将计算任务,分发到数据所在的本机环境来快速执行管道活动。这种联合的“下推式”分布式处理可确保管道的活动尽快完成,从而为业务有效的支撑。这种数据处理方法允许客户利用云计算,可能降低数据流水线和数据管理的总体成本。

其他解决方案通常要求您集中数据。一些公司提供数据流和业务流程解决方案,但仅针对其解决方案中保存的数据。他们希望您将所有数据移动到一个位置以创建和执行高级数据管道。

SAP数据中心的目标客群是谁?

  • 组织寻求更简单的方法来理解,管理并从其复杂的数据环境中获得更大的价值,包括在内部和云中,数据池,数据仓库和数据集市中保存的数据

  • 希望能够快速创建利用整个组织数据的数据驱动应用程序和分析的组织

  • 通过将大数据(例如物联网,社交媒体,Web日志或流数据)集成到企业环境中以提高运营效率和或分析洞察力,组织面临挑战。

  • 寻求有效控制和管理大数据池的解决方案的组织(数据转换,治理,运营,协调,流整合,编码,脚本,整合)

  • 尝试将基于SAP HANA的环境(数据仓库,BW等)与大数据池结合并集成的组织

什么时候可用?

截至2017年9月1日,SAP数据中心已经普遍可用。

数据是否存储在SAP Data Hub中?

不可以。SAP数据中心不提供数据存储。它是一个在现有数据存储之间编排和管理数据的平台,但它本身不是数据仓库、数据集或Data Lake。

SAP Data Hub是另一个ETL或Streaming工具吗?

SAP数据中心超越了传统的批量ETL或实时流。它使这些功能现代化,并专注于在分布式环境(例如Hadoop集群或公共云存储)中运行的新技术的集成。主要范例是将逻辑放在数据所在的位置,并利用集群计算能力。因此,它拥有卓越的处理和集成能力。

SAP Data Hub与SAP Vora之间的关系是什么?

SAP Vora功能包含在SAP Data Hub中,但SAP Data Hub和SAP Vora旨在根据客户的特定需求处理不同的用例。

SAP Data Hub简化了复杂数据流程的编排,同时提供跨现代和多样化环境的治理,包括大数据存储,企业数据存储,企业应用程序和云解决方案。

SAP Vora是一款企业级,易于使用的内存分布式计算引擎,可帮助组织发现大数据的可操作见解,通常存储在Hadoop和NoSQL解决方案中。它适用于数据科学家,也可作为Hadoop多层数据战略的一部分。

与SAP数据服务,SAP HANA智能数据集成(SDI)和SAP HANA智能数据质量(SDQ)的关系是什么?

SAP Data Hub将利用客户现有的SAP HANA中运行的SAP HANA SDI/SDQ流程图,以及利用在现有Data Services作业服务器上运行的SAP Data Services作业。它不会取代现有的用例。

SAP数据中心被设计为协调,监控和建模集成流程的中心位置,其中SAP数据服务作业,SAP HANA SDI和SDQ任务以及大数据流可以汇集在一起 。这些SAP EIM产品将继续与SAP Data Hub分开开发和提供。

与SAP Agile Data Preparation(ADP)有什么关系?

SAP Data Hub具有一些内置的分析功能,但可以使用SAP ADP作为补充。

自助数据准备工具。对于此用例,SAP ADP为业务用户提供了支持。

搜索和访问其数据源的功能,可视化操作数据以使其为报告做好准备并发布。它将与SAP数据中心密切合作,将此自助服务引入大数据场景。在以后的版本中,SAP ADP将利用SAP Data Hub的元数据存储库。

SAP Analytics的关系是什么?

SAP Data Hub通过优化数据管道的速度和安全性来帮助提高分析价值,使组织能够在当下采取正确的信息。SAP是市场上唯一可以提供跨数据,分析和业务应用程序的端到端软件组合的供应商。SAP Analytics Cloud,一种基于云的解决方案,适用于所有分析(基于SAP Cloud Platform构建);将利用SAP Data Hub强大的数据编排功能,允许组织通过控制,管理和优化其数据环境来增强功能强大的分析用例。

SAP Leonardo的这部分怎么样?

SAP Leonardo是一个数字创新系统,使客户能够快速创新,然后迅速扩展创新,为数字世界重新定义业务。SAP的大数据解决方案,SAP数据中心,SAP Vora和SAP云平台大数据服务与Leonardo产品相关,因为它们是扩展和创新的关键。因此,它们在Leonardo大数据包中提供。

SAP Data Hub促进了Leonardo的核心功能,因为:

1. 它最大限度地降低了风险和中断。它适用于您现有的数据环境,不需要您集中数据。

2. 它可以最大限度地利用您现有的技术投资,并使您能够充分利用它们,它可以处理它所放置的数据,并利用最接近数据的处理能力,从而尽可能快地完成数据传输。

3. 它允许您快速扩展创新,因为它使数据流水线功能可供组织内更广泛的用户使用,并且它允许您轻松地在现有基础上进行构建。

4. 它允许您对未来开放。由于其开放式架构,您不仅可以利用当今的大部分数据,无论是在云端,内部部署,SAP解决方案还是非SAP解决方案中,您还可以快速轻松地采用新的改进,例如在机器中学习和下一个数据分析或处理创新。

3

功能概要

跨Data Lakes(基于Hadoop),对象存储(Amazon S3),云/本地数据库和数据仓库的数据管道。从一开始,该解决方案就可以跨越数据领域,利用“下推式”分布式数据处理来:

  • 通过图形用户界面执行数据转换,数据质量和数据准备过程

  • 定义数据管道和流

  • 嵌入并制作数据科学家的脚本,程序和算法

  • 在一个框架中生成开放库或ML算法

跨系统边界协调复杂流程和工作流程

  • 通过监控和分析功能在整个环境中创建操作和流程的工作流程

  • 执行端到端数据流程,从将数据提取到环境(例如数据池)开始,包括数据处理,并导致将结果数据交付或集成到企业流程和应用程序中

  • 远程流程调度:SAP Business Warehouse流程链,SAP Data Services数据流和SAP HANA智能数据集成流程图

Data Lakes的数据提取和处理,支持非结构化和结构化数据/文件或流

  • 提供用于数据集成,清理,丰富,屏蔽和匿名化的预构建功能

  • 没有编码或脚本来准备和转换Data Lakes中的数据

  • Kafka流集成在端到端数据管道中

  • 企业数据质量和数据治理功能使用可由开源组件或云微服务扩展的内置服务在Data Lake中执行。

  • 利用和集成SAP HANA智能数据集成,SAP数据服务,SAP BW

控制,管理,操作和生产复杂的数据环境

  • 使用交付的适配器处理系统之间的连接以进行连接

  • 统一监控和调度环境提供了一个中心入口点,数据管理员可以在其中查看所有连接组件中数据进程的状态

  • 用于连接的预定义适配器框架

  • 建立和管理景观中的区域(例如实验室环境,生产等)以及附加的策略和服务级别

  • 安全和访问控制功能

元数据生命周期与谱系和影响分析

  • 使用存储库集成创作的元数据模型内容(基于GitHub)

数据发现可直观地了解Data Lake数据中的值

  • 大数据集的数据配置文件显示质量和综合结构信息

  • 能够抓取,发现和标记数据元素

  • 公开发现的数据以供进一步使用

4

特色解析

Hub中的数据

Hub in Hub是一种基于现代HANA的最先进的(提取,转换和加载,又称ETL)数据仓库方法。为此,它似乎利用Landscape Transformation工具进行数据访问以及ETL功能和数据质量的数据服务,而HANA似乎提供了存储和转换功能。

敏捷数据准备

敏捷数据准备是面向最终用户的自助服务解决方案。它似乎主要利用HANA规则框架,智能数据集成和智能数据质量的现有功能。

示例:https://blogs.sap.com/2017/02/03/sap-agile-data-preparation-tutorial/

智能数据集成和智能数据质量

智能数据集成和智能数据质量是HANA重新实现数据服务的开始。如果它们的特性和功能足够,它们的效果会很好。

数据服务

Data Services是一种传统的ETL工具,存在于两个版本中,即内部部署数据服务和用于数据服务的SAP云平台集成。

LANDSCAPE TRANSFORMATION(LT)

LANDSCAPE TRANSFORMATION是一套技术支持以下领域的商业交易的工具和技术程序:

  • 销售,采购和重组

  • 整合并降低IT成本

  • 统一和转换数据

  • 分析

高级数据迁移

高级数据迁移是一种面向流程的数据迁移工具,尤其是在SAP S/4HANA领域。其目的是让数据所有者参与迁移过程,为他们提供面向业务的迁移过程见解以及提高数据质量的工具。

信息管家

信息Steward是一种用于监控,分析和改进数据完整性的被动数据治理工具。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
大数据就是生产力
20个顶级大数据软件应用程序
什么是 SAP ABAP FDA - Fast Data Access 技术?
诸神之战:计算机领域的固步自封与跨界战争
SAP大数据处理能力 延伸实时数据平台
砸 20 亿欧元,欧洲最大软件商 SAP 全面进军物联网!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服