打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
译言网 | 语义网12

各种创新在计算机世界里不停发生。语义网,一种新的网页形式,正在互联网的世界里起到革命性作用。通过语义网我们可以更加智能地控制我们的设备。通过它,我们还能更好的理解和处理数据内容。我们也可以通过它,增加我们和网页的互动性,使网页更好被浏览。 现今,开发语义网两种最重要的技术已经出现:可扩展标记语言(XML)和资源描述框架(RDF)。使语义网的开发称为可能。不久将来,我们就可以在现实生活中利用语义网来实现各种服务,使我们的家庭生活更加智能。 另一方面,语义网也可以帮助人类的语言进步。在社区活动中,人与人之间更加和谐。


语义网

一种新的网页内容,可能对计算机世界起到革命意义

当电话响时,娱乐系统正热情播放披头四的“我们要尽欢”。在皮特回答之前,他传送一个信息给他的音响设备,把它们的音量关小。他的姐姐路西从她医生那里打电话给他,说:“妈妈需要看一位专家,需要一系列的物理治疗。大概两个星期或者多些。我打算让我的代理约个时间。“皮特立即答应开车送她们。

在医生的办公室里,路西指令她的语义网的代理商用手持设备浏览网页。代理商尝试重新从医生那里获取她妈妈药物治疗信息,找寻几个供应商,在她家二十里范围内检查她妈妈最好和最可信的保险计划。同时开始尝试从路西和皮特的行程中,找到最好的 预约时间(几个供应商通过他们的网页提供这些资料)。(语义网通 过主要的关键字来表明语义,意思 ,还是指定的代理)。

几分钟之前,代理商给皮特和路西看了他的计划,但是皮特不喜欢它。大学附属医院是从他妈妈家穿过城镇,他将在交通不是高峰期开车回家。他要求代理根据时间和地点重新查找。路西的代理完全信任皮特的代理计划,在存取验证和快捷键的帮助下任务自动 被排序。

没多久新的计划就给出了:一个离医务所更近和更早时间。但是有两封警告信。第一个是皮特更改了他的几个次重要的预约,缺席他们没有问题。其他包括保险公司名单, 没有包括物理治疗的提供者:“服务类型和保险计划已经被其他方法安全验证。”代理商将确认他 。

路西登记了,但是皮特有点不满:“给我些详细资料”, 这是我所有资料。(当然,皮特不能拒绝计划,尽管它不在名单中, 在晚上他让他的代理解释。)

表达方式

皮特和路西能让他们的代理处理这些任务,不但要感谢今天的互联网,还要感谢明天将会出现语义网。今天大部分网页内容是设计给普通人读的,不是专给程序来操作。通常计算机能敏捷分隔网页和常规地处理主题,并可以把它连接到另一个网页,但是计算机并没有一种可靠的方法处理语义:这是Hartman和Strauss医务所的主页,连接可以带到Hartman医生的简历的网页。

语义网可以对不同内容进行分类,当软件代理商浏览网页时候,能够为用户预先处理复杂的任务。当病人来到医务所的网页不只是能够看到“治疗,药,物理治疗”等关键字(可能今天已经被加密),而且告诉Hartman医生在星期一,星期三,星期五工作时间和预约时间。在2001‘s Hal 或者StarWare's C-3PO 不需要人工智能就可以知道这些。利用物理治疗联盟的资源,医务所的经理用现成的软件写语义网。

语义网不是一个分开的网页,而是一个括展,通过语义网信息能够很好被定义,更好使计算机和人一起合作。语义网商业化已经正在进行中。在不久的将来,开发者能够使计算机能够更好处理和明白数据。

互联网的基本特性是普遍性。超文本的强大之处在于“可以互相连接”。网页技术不必区分草本和优美的效果,商业和学术,或者不同文化,语言和媒体等等。讯息变化多端,最大不同是讯息处理是为人还是机器。在讯息的一端有从五妙的广告到诗歌。在另一端我们有数据库,程序和感应输出。对於数据,网页作为一种文档而不是作为数据和讯息已经发展很快,但是欠缺讯息自动处理。语义网目的就是弥补这些。

像互联网,语义网将尽可能分散。这种网页系统在每个层次上产生许多惊喜,从主要企业到个人用户,提供的效益很难预知。分散需要妥协:网页必须丢掉所有互连一致性的想法,例如显示出信息:错误404: 没有发现”,而不去检查潜力增长。 

知识代表

对於语义网功能,计算机必须存取结构性的讯息和互相影响,使得我们能用来执行自动答问。从网页开始发展,人工智能专家已经开始研究这种系统。在网页发展之前,知识代表,作为这种技术,可以比较超文本:很清楚 ,这是一个好主意,已经有一些好的演示存在,但是它们并没有改变这个世界。它包含了重要的应用,但是它的最大的潜力是连接到单一全球系统。

传统的知识代表系统已经被中心化了,要求每个人分享他们对基本概念的定义如“父母”,或者“车辆”等等。但是增加这种中心系统变的不可管理。

而且,这些系统为了回答更可靠,限制了这些问题。问题是从Gidel's数学理论来的:任何足够复杂的系统包含着没有答案的问题,好像这句话自相矛盾。为了避免这类问题,传统的知识代表系统对数据的推论有他们自己的狭窄和特殊的规则。例如,一个家谱系统,扮演家族的数据库,可能包括叔叔的妻子是阿姨的简单规则。即使数据可以从一个系统传送到另一个系统,不同规则存在不同系统是不可能。

语义网的研究者,接受模糊和不可回答的问题,但是必须付钱取得灵活性。我们规则设计语言,根据我们的需要允许网页和我们想要一样。它的原理和常规的网页一样:在网页发展的早期,批评者指出它从来不可能成为组织很好的库;我们不可能找到任何东西,没有中心数据库和树型结构。他们是对的。系统表现能力使的巨大的信息可用,搜索引擎(10年前看上去不可行),但是现在产生很有意义。语义网的挑战就是提供一种语言,表达数据和规则,使得存在的知识代表系统能够输出到网页上去。

语义网大行其道之前 , 增加逻辑到网页,使其更有互动性。数学和工程的决定将复杂化这项任务。逻辑思维必须足够强,才能描述复杂的特性。如果不足够强,代理可能认为是自相矛盾。幸运的是,主要的信息都是由16制组成,它是一种机器语言,它被用一种已存在的语言,加些额外的词汇。

开发语义网两种最重要的技术已经出现:可扩展标记语言(XML)和资源描述框架(RDF)。XML让每个人都他们自己的隐含标记,诸如加注网页或者页面上的章节。脚本或者程序能够用更高级的方法用这些标记,但是脚本的作者必须知道页面的作者用每个标记。简单地说,XML允许用户增加任意的结构到他们的文档中,但是没说这种结构意味着什么。  


语义网能够机器复杂语义文件和数据,而不是用人声和写作。 


RDF表达的意思就是加密三次,每次都使其不像标题,字和单个句子。这种加密被XML标签写成。在RDF中,文件有其特性,如“姐妹”,“作者”,还有些一定的意思(如另一个人,另一个网页)。这种结构很容易描述被机器处理的大量主要的数据。标题和目标被一个资源标志符定义,用在网页的连接 。(URLs,统一资源定位器是最普通类型)动词被URIs定义,使的每个人都可以定义新的概念,新的词汇,不只是定义URI。

当用同一个俗语表达不同事情时,人类语言开始昌盛,但是不能自动翻译 。想象一下,如果雇用一个小丑信息传递者在客户生日的时候送气球给他们。当我把地址从我的数据库传到他的数据库时,不幸的事情发生了,因为我们不知道帐单寄到那和邮局在那。我雇佣的小丑结束和邮局的工作人员的纠缠,但是我们的目的没达到。但是针对每个指定内容用不同的URI可以解决那个问题。一个邮寄的地址可以不同于街名和语音街名。

关于讯息网页的RDF增长了三倍。因为在文件中RDF用URFs去加密这些讯息,URIs确信内容对应的单一定义每个人都可以在网上找到。例如,想象我们可以有权访问数据库中每个人的资料,包括他的地址。但是如果我们要找一个人住在指定的区域,我们需要知道数据库中,资料代表他的名字和邮编。RDF能定义,如”在数据库A中段5)(它是个邮编段)”用URI好过用每个词组。

实用分类系统

当然,这不是这个故事的结束,尽管内容相同,但是两个数据库用不同的标示,例如邮编。一个程序要比较位于不同数据库的两个相同事情。理解的话,程序必须有个方法去发现数据库面对的相同的东西。

这个问题被语义网的第三个基本原件解决,讯息集称为实用分类系统。从哲学角度,实用分类是关于自然和那种事物存在的理论;实用主义作为一种科目被学习。人工智能和网页的研究者一起选择它作为他们自己的行话,对於他们来说,文件定义他们的关系。最典型的实用分类系统是有一个分类和一套理论规则。

分类法定义目标类和他们的相关性。例如,地址可以定义位置类型,城市代码可以定义只是位置,等等。类,子类和相关关系对网页使用者是非常有用的工具。我们可以通过分配特性给类和子类继承子类来表达他们之间的关系。如果城市代码必须是城市和城市的网址,即使没有数据库把城市代码直接连接到网页,我们也可以讨论有城市代码的网站。 

在分类法中,推理规则进一步流行。一个分类法可以表示一个规则:“如果一个城市的代码和一个州的代码相连,一个地址用城市代码,那么地址就和州代码相连。”一个程序可以很容易推理这个规则,例如,康奈尔大学的地址,是伊萨卡,那它必须在纽约州。 

随着分类网页出现,俗语问题解决办法也开始出现。定义在网页的XML代码的意思可以被网页的指针定义。当然,如果我们用分类法来定义地址作为一个邮编,相同的问题也可以出现。如果分类法提供一个相关的关系,混淆可以被避免:一个或者两个分类可能包含邮编代码等於邮编区号的信息。

如果两个数据库指向不同定义的地址,我们计划送小丑去娱乐客户只是部分解决问题。对於不同地址,程序用不同的URIs将混淆他们,事实上,我们需要发现内容之间的根本相关。通过认识和移除邮件和不适合的地址程序能有服务来列出一系列的邮编地址(可以定义为第一分类),然后转换它成为物理地址(第二分类)。被分类法提供的结构和语义可以容易使得一个企业家提供一种服务和使他们更能大众化使用。

分类法可以在许多方面加强网页功能。他们被用在简单的时尚去提高网页搜寻的准确度。代替使用含糊不清的字眼,搜寻程序可以根据精确的页面搜寻网页。更高级的应用将用分类法把相关的讯息连接到知识结构和推理规则。一个在线例子是: http://www.cs.umd.edu/~hendler.如果你浏览那个网页你将看到网页的标题是“Dr. James A. Hendler."你也将发现它连接一个短个人介绍,你可以知道Hendler从布朗大学拿到一个博士学位。计算机正在寻找这里信息,但是它太复杂,以至於不能猜这信息是否个人介绍和使用英语。

对於计算机,网页被连接的一个被计算机科学部门定义的分类网页上。例如,大学教授通常他们都有博士学位。进一步的标记在网页上(没有显示在普通网页浏览器)使用了分类学的概念去定义Hendler从布朗大学http://www.brown.edu得到博士学位。但是计算机能发现Hendler是特别研究项目的成员。所有信息被计算机处理,能够用来回答各种询问(例如Hendler在那里获得博士学位),但是这种询问要人手用搜索引擎找寻。

此外,这一标记使得开放程式变得更容易,可以解决一些复杂的但是不是发生在单一网页上。 假设你想找去年贸易会议时遇见的Ms. Cook。你不记得她的名,但是你记得她工作的公司和她儿子是你母校的学生。一个智能的网页可以找到所有姓“Cook"。(避开有关厨师,烹饪,库克群岛所有网页,等等),找到那些提到公司是你朋友的公司,根据连接结找到她小孩的网页,学校正是你的母校 。

代理

语义网真正强大的地方是从不同的地方搜集网页资料产生程序,能够和这些不同程序处理和交换结果。这些软件能够增加机器可读性和自动服务(包括其他代理)变成可能。语义网促进这种协同性:当数据带有语义,即使代理没有设计一起工作,也能在他们中间传输数据。

一个重要代理功能将是在语义网页统一语言中交换“证明”(语言是用规则和=讯息来表达逻辑推理,例如分类定义)。例如,假设Ms. Cook的联系讯息已经存在在线服务中,和使你吃惊的是,它把她放在 Johannesburg。自然的,你要检查这些,所以你的计算机要问服务去校对答案,它尽力把它内部的原因翻译为语义网的统一预言。一个在计算机内的推理引擎将校验Ms. Cook实际上符合你找寻的那个,也可以告诉你相关的你怀疑的网页。尽管他们始终没有太大意愿去研究语义网的潜力,但是已经有些程序用统一语言用这种方法去交换证明。

另一个主要的功能是数字签名,它被计算机和代理数据块加密,去校验所附資料是否被可靠来源所提供。你要确信声明发送到你的会计程序,你欠的钱在线零售商不是住在你隔壁的伪造的电脑高手做的。(我们希望更多人能够学会在网页上做这个)。

许多没有语义的自动网页服务已经存在,但是其他程序例如代理,没有方法去放置他们去表现定义的功能。这个过程叫作服务发现,当有个共同语言去描述一种服务,让其他代理去明白它的功能和怎么去利用它。服务和代理能够对他们的功能做广告,例如,存放这种描述的目录类似于黄页。

一些低层的服务发现计划现在也可用,例如微软的统一即插即用,侧重于不同类型的连接装置,側重於不同類型的連接裝置,和Sun Microsystems's Jini,目的去连接服务。这些举措,然而,对结构或者语法错误严重依赖预先定义的标准化功能说明。因为我们不能预测将来发生的所有可能,标准化不能走太远。


正确的设计,语义网能够帮助人类知识作为一个整体来发展。


作为比较,语义网更灵活。消费者和生产商通过交换分类来达到一个共识,提供词汇需要讨论。代理能够启动新的推理能力,当他们发现新的分类法。即使只有部分符合服务,语义也使它更容易利用服务。

一个典型的进程将涉及一个“价值链”的建成,组件的信息从一个代理传到另一个代理,每个“增加值”,都可以建成终端用户要求的产品。不能有错:根据需要自动产生复杂的价值链,一些代理研究人工智能技术应用到语义网中。但是语义网提供的基本结构确信这种技术更可行。

把这些所有功能集合在一起,在皮特和露西代理的情况下打开此文章。他们的代理将任务分成几个部分提供给他们的服务商,代理商通过服务商的广告去发现。例如,他们能用一个可信的服务去列出提供商和决定他们那个在指定的保险和服务计划中。提供商的列表将被另一个搜索服务提供。这些行为形成一个链,大量的数据通过网页分配渐渐减少数据的皮特和露西预约时间去配合他们的时间表和要求(在那种形式下,几乎没有价值) 。

下一步,语义网将走出虚拟世界,走到现实中。统一资源标示符将指向任何东西,包括物理输入,意味着我们能用资源描述框架语言去描述设备例如手提电话和电视。这些设备能广告他们的功能,他们怎样被软件代理控制。和低层次计划做比较,它比较灵活,例如即插即用功能,这个语义方法打开一个激动人心的世界。

例如,今天我们称的家居自动化要求电器配置一起工作。在很少人干预下,这些设备能力和功能的语义描述能使我们取得这些自动化。当皮特关小音响,回答电话时,一个很小的例子发生。代替对每个电器编程,他只编程一次,覆盖所有的本地设备,对电视,DVD的音量,手提电脑的媒体播放器作广告,晚上他将把工作带回家。

在这领域内,第一步骤已经采取了,对设备的描述功能和用户选项已经成为一个标准(例如屏幕的大小)。建立在资源描述框架中,这个标准称为符合能力和偏好简介(CC/PP)。最初,可以让手机和其他非标准的网页去描述他们的特性,让网页定制他们去执行。以后,我们增加语言的灵活性去处理语义和逻辑时,对增加的讯息或者功能设备能自动找到和应用到服务中。这不难想像带有网页功能的微波炉能够获得冷冻食品制造商的最佳烹饪参数。

知识的发展

讨论至今,语义网不只是一个工具去实现个人任务。附加,它能被正确设计,整体上,语义网能够协助人类语言的进步。

人类的行为陷入小组有效性永恒的紧张中。需要更大社区参与。小组能够迅速而有效的。,但是产生一个次文化,它的内容不被其他人理解。和一群人一起协同工作,进步缓慢,而且需要大量的沟通。世界大范围工作,产生一种趋势,从个人意见开始,向更广泛的互相理解前进。

当一种更广泛的共同语言需要时,一个基本的过程把这些亚文化联系起来。经常两组互相独立的组发展非常相似的概念,去描述他们之间的互相关系带来更多的利益。像芬兰-英语词典,或者重量-测量兑换表,当共同概念没有导致共同术语时,它们的关系也允许沟通和协助。

语义网,通过简单统一资源标示符来命名每个概念,让每个人来表达他们发明新的概念。它的统一逻辑语言将使这些概念渐渐联系成为一个通用的网页。这些结构将通过软件供应商来打开知识和人类的工作,提供新的工具,使我们能够一起生活,工作和学习。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
语义网概述
SKOS:简单知识组织系统 - 编目精灵II -- On the Fly - 博客大巴
语义网系列(1)--什么是语义网
语义Web中的本体建立技术
国内语义网研究综述
语义Web和语义网格概述 - 飘无痕的java天地 - BlogJava
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服