基于相关性和语义相似度融合的查询扩展方法

时间:2025-05-11

第 20

201年 9月 0

计算机技术与发展COM|UTER P TECHN0L GY D AND DEVELOPM ENT

Vo . O No 9 I2 . S p. 2 0 e 01

基于相关性和语义相似度融合的查询扩展方法李泽军,曾利军,刘文华(南工学院计算机科学系,南衡阳 4 1 0 )湖湖 2 0 2摘要:针对局部共现查询扩展算法查准率不高、能差的缺点,出了一种基于相关性和语义相似度的查询扩展算法性提

R IE rav y n mli o u t qe pni ) SQ ( lit d iiryi s l e ur e as n。该方法首先用局部共现查询扩展算法扩展出 r个相关扩展词, e t i a s at n c a y x o 1 继而利用知网资源计算查询的相似度和扩展词的相关性,在此基础上融合扩展的相关度来得到 N个扩展词的排序,通过对扩展词序列赋权来重新计算新查询中各词的权重,由新查询词赋权迭代得到检索结果。实验表明,扩展方法比传统该局部共现查询扩展算法不仅具有更优的检索性能,而且检索精度进一步提高。关键词:询扩展;关性;似度;查相相检索性能中图分类号: F 9 T 31文献标识码: A文章编号:6 3 6 9 ( 0 0 0— 0 6 0 1 7— 2 X 2 1 )9 0 6— 3

Qur x a s nMeh dB sdo lt i n i lrt n suae eyE p n i to ae nReai t a dSmi i I oc lt o vy a yL e u,E iu, I We—u I - n Z NG L- n L U nh a Z j j( et o o ue S i, nnIstt o cn l y Hega g4 10, hn ) D p. f mp t c Hu a tue f h o g, nyn 2 0 2 C i C r . n i Te o a

Ab ta t Astel( c sr c: h ) ( o—o cre c fq eye p n inag r h p eiinr t o ih,as t h rc migo o rp ro ma c, c urn eo u r x a so lo i m rcs aein thg t o s l wihs t o o o n fp o efr n e

an w loi ae ncre t na dsma t i l i mp ̄da

u r p n ina o t S QE h to i t sdi e a r h b sdo orl i n g t m ao e ni s a t i p o c mi r y s q eye a s l r h R I .T e S x o gim meh df sl u e r y nl c lc c c r e c fq e x a s n ag rt ms t x e d t er lv n x e so s o fK r s h n u e c mp tr t a c l t h o a o—o u r n e o u r e p n i lo i y o h o e tn h ee a t e t n i n ut wo d .t e s o u e o c lu ae t e o

tr f i lrt ewenN xtn e r dq ey。a dt e ne rt no ee a c dsm irt o h r ogiea x e— emso mi i b t e e e d dwod a u r n h n i itg ai frlv ea i li y ft ewo d t v ne tn s a y s n n o n n a s noftef a re。e tn hssq e c fe o rn to fcluai h a iu emsi h u r ih,a d e trte i h i l d r xe d ti e u n eo mp we ig ameh do aclt o n o g n tev r str teq e weg t n ne h 0 n y

rt ea y tm og ttesac eut.Ex e me t h w h tt se p n in ag rt a te ere a p r ma c n s m— er vls se t e h r h rs l i e s p r n ss o ta hi x aso lo h h sb trrt vle f i im e i or n ea da o i lpo e c ua yta h rdt n lmeh do u r xpns nag rt r v da c rc h nt eta ii a to fq e e a i lo h o y o imKe r s q e x a s n;c r ea in;s i rt y wo d: u r e p n i y o o r lt o i l iy;r t e a e f r n e m a e r v l ro ma c i p

0引言 用户在使用现有的搜索引擎【2,常使用较 1通,时 J小的几个关键字进行查询,这样使得语义

的相关性不强,使得信息检索性能产生严重的负面影响。怎样使得语义相关性和词的相似度匹配是当前检索领域一个重要的研究热点。

此基础上融合扩展的相关度来得到 N个扩展词的排

序,通过对扩展词序列赋权来重新计算新查询中各词的权重,由新查询词赋权迭代得到检索结果。该扩展方法不仅具有更优的检索性能,而且检索精度进一步提高。

文中通过加入语义的相关性和相似度的词等技术手段,来解决不匹配的问题,能较好地判断查询文档相关性信息。该文利用扩展词赋值计算方法对词或词语

1基于局部扩展查询算法1 1问题定义 .

假设待检索的语义文档集为 R,有 x篇文档共数_]则 R的词典为 V={,,, }用 W 3。 训1w2…硼,来表示词项或词。设查询初始条件 Q={ lq,, q,2… q, V(≤ i}q∈ 1≤ z, )一定情况下,在基于语义相关性扩展新查询 Q时,一理论上,文档集中任意一个

问的语义相似度进行文本的扩展查询,即基于相关性的查询扩展算法( SQ ) R I E。该方法首先用局部共现查询扩展算法扩展出,个具有相关性的扩展词,而利 z继

用知网资源计算查询的相似度和扩展词的相关性,在

词或词项都可能成为新扩展词,局部扩展查询算法在收稿日期: 0 9 1 2 0— 2—2;回日期: 0 0 3—1 1修 2 1—0 7

中,根据评估策略模型对词或词项进行评分,来作为查询的关联程度,因此,在局部扩展查询算法中,据评根价函数 f 7, C, ) (0 Q I S来表示词或词项与 Q一的关 . 联性强度,评分越高则表示词或词项对 Q一的关联度

基金项目:南省教育科学研究基金项目(8 2 80 C 9 )湖 0 C 4,9 2 7

作者简介:李泽军 (9 2,, 17一)男湖南常宁人,讲师,硕士研究生,研究方向为数据挖掘、本检索、式识别。文模

第 9期

李泽军等:基于相关性和语义相似度融合的查询扩展方法

6 7

越高。 1 2扩展词的选取 .

为检索得到的词项,则在词项和查询词关联度不同的情况下得到的检索结果的精度具有不确定性,检索的

在局部查询扩展方法[], 6中由于自然语义具有

精度也不高。该文在语义相关度约束的基础

上采用慨率统计查询扩展算法来检索和过滤查询不相关的词。这里,用 U数据集的测试数据进行分析和实采 DI验。在表 1,过对原始数据的分词及局部扩展查中通

数据离散的特点,利用原有的词或词项出现的信息次数来进行扩展词的选取,在不同词项的较大差异,存为

减少不同词项的差异,采用共现频度 co( q l ol硼, D) 来区分不同的词或词项的强度,其平 …… 此处隐藏:8675字,全部文档内容请下载后查看。喜欢就下载吧 ……

基于相关性和语义相似度融合的查询扩展方法.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219