XML与Web数据集成及技术实现
时间:2025-04-15
时间:2025-04-15
html解析
第!"卷第#期西南师范大学学报(自然科学版)!$$%年"月
&’()!"*’)#+’,-./(’01’,234562738./*’-9/(:.8;5-682<(*/2,-/(1=85.=5)+,.)!$$%!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
文章编号:%$$$>?@A%(!$$%)$#>$!??>$?
!"#与$%&数据集成及技术实现
周彦晖,邹显春,张为群
(西南师范大学计算机与信息科学学院,重庆@$$A%?)
!
摘要:由于BCDE缺乏规范的数据表达能力,基于F5G的数据集成往往很困难)要使存在于F5G上的数量巨大的数据易于共享、处理,利用HDE(5H25.68G(5D/-I,JE/.K,/K5)技术可以很好地实现)现有的HDE技术包括HDE解析器、文档对象模型、H1E等都可以很好地应用到各种平台下的F5G应用程序中,从而实现异构数据集成)关
键
词:数据集成;可扩展标注语言;万维网;文档对象模型
文献标识码:/
中图分类号:’()*+;’()**,*)-,.
*$%&数据环境的现状
数据集成就是从大量的数据中将有用的数据针对不同的应用进行整和、封装、处理的过程,以解决数
[%]据的应用质量问题)充分利用有用的数据,废弃虚伪无用的数据,是数据集成技术的最重要的应用)F5G上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点)
*,*
$%&是异构的数据库环境
从数据库的基本内涵来说,F5G网站上的信息也可以看作一个数据库,一个更大、更复杂的数据库)
一个F5G站点就是一个使用BCDE描述的数据源,不同站点之间的信息和组织都不一样,这就构成了一个巨大的异构数据库环境)如果想要利用这些数据进行数据集成,需要把各站点之间的异构数据统一起来)在现有的F5G环境下,由于数据的异构性,BCDE语言又缺乏对数据模式的描述,所以即使进行数据收集和处理,也将产生很多冗余信息和大量不确切的信息,正如现在的F5G搜索引擎所表现出来的一样)*,+
非结构化的数据模型
F5G上的数据与传统的数据库中的数据不同,传统的数据库都有一定的数据模型,可以根据模型来具体描述特定的数据)而F5G上的数据形式多样,没有特定的模型描述,每一站点的数据都各自独立设计,从而是一种非结构化的数据)F5G数据集成技术首先要解决非结构化数据模型的查询与集成问题,就需要寻找一种非结构化数据模型转化为结构化的数据模型的描述和转化技术,HDE(5H25.68G(5D/-I,JE/.K,/K5)
[!]及一系列标准提供了这种数据模型描述和转化技术)
+!"#简介
以HDE为基础的新一代FFF环境不仅可以很好地兼容原有的F5G应用,而且可以更好地实现F5G中的信息共享与交换)HDE可看作一种结构化的数据模型,可以很容易地将HDE的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取)
与BCDE一样,HDE也是网络上的一种通用语言(E8.K,/L-/.=))但是BCDE更像一个易用的阅读显示
收稿日期:!$$%>$!>%!
!
万方数据作者简介:周彦晖(%MA!N),男,重庆市人,助教,硕士研究生)
html解析
卷
器,表现文档的外观和格局是它的强项!"#$则不同,它的产生就是要通过标记来精确地表现信息的各种含义!"#$包含了大量”自我解释”型的标识文本,每个标识文本又由若干规则组成,这些规则可用于创建标识,并能用一种常常称作解析程序(%&’()’)的简明程序处理所有新创建的标识!
(*&+)是没有预先定义的,使用者必须要自定义需要的标志,"#$使用,*,(,-./0123"#$中的标志
来显示这些数据,使用"($(1"312879:1(34:1(;113$<2=/<=1)或>(((><8.<?72=*451,1672737-2文档类型定义)
[B]
来描述这些文档如何显示!使用,@#(,-./0123@9A1.3#-?1:)文档对象模型来处理数据(34:1(;113)!
[C]
,"#$可以从存在的数据中产生出来!使用"#$结构化的数据可以从"#$使用可升级的三层模型
商业规范和表现形式中分离出来!下面是"#$的基本处理过程:
!数据发送由于"#$是开放的、基于文本的格式,它可以通过D**%像D*#$一样传送!(5<E81E)能够读入一串"#$数据,经过处理,产生一棵结构树,并且为,@#!解析"#$"#$解析器
提供数据对象!解析器用>((或"($样式表显示数据,或者用脚本霍应用程序对数据进行进一步的处理!(,@#)处理和编辑数据,@#实际上是一个应用编程接口(&%F),用来定义一种!使用文档对象模型
标准方法!通过这种方法,开发人员能够处理"#$结构树的元素!
!用D*#$显示"#$数据"#$文档自身不能决定如何显示信息,"#$数据只包含事实!可以使用"($来描述"#$文档如何显示,最后把结果呈现在浏览器中!以上过程如图G所示
!
万方数据
html解析
第Y期周彦晖,等:"#$与S7:数据集成及技术实现W,Z
行传递!在这类应用中,"#$解决了数据的统一接口问题!与其他的数据传递标准不同的是,"#$并没有定义数据文件中数据出现的具体规范,而是在数据中附加%&’来表达数据的逻辑结构和含义!这使"#$成为一种程序能自动理解的规范!!"#
使用$%&为相同数据提供不同的显示形式
利用"#$,用户 …… 此处隐藏:6258字,全部文档内容请下载后查看。喜欢就下载吧 ……
上一篇:关于大三找实习的建议
下一篇:单管放大电路实验报告