面向Web3_0的分众分类研究_核心(2)
时间:2025-04-20
时间:2025-04-20
公益组织相关
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. >>
第54卷第3期 2010年2月
息带来的搜索疲劳[2]。
113 搜索引擎的智能化
W eb3.0时代的网络是智能网络,这是一个以整个互联网为基础,聚合了所有知识的智能平台[1]。在这样的平台上,用户可用自然语言表达自己的查询意图,搜索引擎能够对查询进行解析,提取相关概念,组合查询表达式,从而返回准确的结果;甚至,用户可以提出完整的问题,通过搜索获得一些问题的解决方案。114 多种终端平台、跨网站和跨语言信息交互
W eb3.0不仅能够实现不同网站间的信息交互,而且还能实现不同终端的兼容。通过互联网与通信的融合,用户可以用所有智能终端(固定电话、移动电话、PC、I PT V以及其他智能终端)轻松享受看得见、听得到、用得好、即时交互的信息服务[3]。另外,W eb3.0的智能翻译引擎突破了国家、语言的限制,使用户用自己的母语可以与全世界所有人进行交流[4],实现了更大范围内的信息交流与共享。
2 分众分类及其特征
分众分类(Folks onomy)是随着W eb2.0而产生的新型网络信息分类法,也叫大众分类、社会分类、自由分类等,它就是由网络信息用户自发地为某类信息定义一组标签(Tag)进行描述,并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法。其实质就是以词为类,但其类目却是平面的、非等级的[5],它是用户用标签对感兴趣的资料进行分类,并与他人共享标签的过程和结果。
2.1 分众分类的优势
与传统网络信息分类方法相比,分众分类最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。分众分类的主要机制基于“开放性元数据标准”和“自然语言社群聚类”[6]。其优势主要表现在:首先,分众分类的标签形成过程充分体现了其自由性,任何用户都可以自由选择自然语言语词来对感兴趣的资源进行标注,从而可以从多个维度来揭示信息内容[7];其次,分众分类具备实时性与适应性,用户可以随时对其阅读或创建的内容和主题创建标签,并立即保存下来,并被允许即时快速的进行标签用语的修改[8];第三,分众分类为用户提供了共享标签的功能,任何人对内容进行标注后,他人可立刻看到这些标签,也可以点击这些标签,进而看到更多使用这个标签的信息内容,或是与此相近的内容[9]。
2.2 分众分类的局限
作为使用非控词汇的分众分类目前还存在一定的局限性,具体表现如下:
21211 标签的多样性 由于用户认知程度不同,对同一事物的揭示程度也存在很大的差异,导致不同用户在标注同一信息时使用了不同的标签,但是系统却无法创建这些标签之间的联系。标签的多样性极大的影响系统的检全率。
21212 标签的模糊性 分众分类是一种基于标签语法层次的简单聚合分类,因此,同一标签可能映射出不同语义的资源,而系统却不能识别出各个语义的不同。标签的模糊性使用户不得不花更多的时间和精力找到与检索标签相关的记录,因而影响到系统的检准率。21213 标签的扁平化组织 分众分类的组织方式与传统的等级体系分类法组织方式不同,它是扁平化的,没有等级层次的划分。因此,系统无法识别各个标签之间的等级层次联系。一方面,这种由于标签缺乏等级控制造成的信息分散也必然影响了信息的检全率;另一方面,类目的平面非等级显示同样会隐藏一些有价值的信息。同时,信息越多利用标签直接找到相关信息就越困难。
21214 系统间的交互性很低 很多网络系统都具有标注资源和分享标签的能力,但是目前各个分众分类系统在语义表达和格式规范上并不一致,这不仅阻碍了各个系统之间的信息交互和代理软件的自动化处理,同时也引发了一系列检索方面的问题。另外,受语言、文化背景等因素的影响,跨国界、跨文化的分众分类系统之间的交互性更低[10]。
21215 标签间语义关系缺乏 分众分类是以高频标签作为类目的一种信息分类方法,其分类结构是平面的,标签间是平等关系,缺乏对标签间的层次体系关系、属性关系和其他的复杂语义关系的描述,而标签间语义关系的缺乏不仅影响到检索的精准度,更重要的是对智能化搜索带来诸多障碍。
3 W eb3.0对分众分类的需求
W eb3.0的基础是W eb2.0,因而,分众分类也是W eb3.0的一种主要的信息组织方式。但是目前分众分类所具有的上述局限性显然阻碍了W eb3.0的核心理念———“精准、个性和智能”的真正实现,W eb3.0的发展需求决定了分众分类的发展方向,因而,未来的分
501
公益组织相关
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. <<信息技术
・L I BRARY AND I N FORM A TI ON SERV ICE ・众分类还需要在以下几个方面进一步拓展。
3.1 微内容的自由整合与过滤研究
微内容是W eb3.0的基本信息单元,由于W eb3.0同样具有草根性,其内容良莠不齐,有价值的专业分析讨论与各种杂谈闲聊掺杂在一起,因而首先需要对微内容进行筛选性的过滤研究。这部分的研究主要包括:研究分析用户的行为特征,寻找可信度高的微内容发布源;对 …… 此处隐藏:4414字,全部文档内容请下载后查看。喜欢就下载吧 ……
上一篇:高中数学思维导图1(文科)