网络化学习问答系统关键技术研究-瘦身版

时间:2025-07-11

网络化学习问答系统关键技术研究

徐立臻

(东南大学计算机科学与工程系 210096)

摘要:本文提出了基于本体的开放式网络化学习问答系统模型,将领域本体引入问答系统中,并以此为基础构建课程的知识结构体系,利用领域本体中的概念以及概念之间的关系来提取以及扩展用户问句语义,有效提高用户提问与FAQ库问句的匹配率。当FAQ库中的问句与用户提问语义相差较大时,系统能够通过Web搜索并提取答案返回给用户。 关键词:领域本体,概念语义相似度,问句相似度,段落检索

Research of Key Technologies in Network

Learning Question-Answer System

Xu Lizhen

Department of Computer Science and Engineering

Southeast University, Nanjing 210096

Abstract: This paper proposes a model of the ontology-based Network Learning Question and answer system. It introduces domain ontology into the question and answer system, and builds the structure and system of the course knowledge. Use the concepts and the relationship between the concepts in domain ontology to expand semantic of the question can effectively improve the match ratio between the user’s question and the questions in the FAQ database. And the system can extract the content of the pages from Web as the answer when the user’s question is very difference from the questions in the FAQ database in semantic.

Key words: Domain Ontology; Concept Semantic Similarity; Question Similarity; Paragraph Retrieval

1 引言

随着互联网的迅速发展,远程教育正逐渐成为计算机网络应用的热点之一。随之应运而生的是网络问答系统,它的出现弥补了远程教育在答疑时,时间和空间上的缺陷,提高了用户与教育资源的交互。但目前,多数问答系统对问题的理解仍然局限在关键词匹配的模式,在实用性和智能性完全不能满足用户需求。

2 研究现状

目前国外知名的问答系统有麻省理工大学人工智能实验室的Start[1]、密歇根大学的AnswerBus[2]等。Start是第一个基于Web的自动问答系统,其特点是向用户提供准确的信息,而不是提供一堆相关信息。它采用基于知识库和信息检索的混合模式,如果用户查询在它的知识库中可以找到,则直接反馈;如果没有,则通过搜索引擎检索并处理后反馈给用户。而AnswerBus是一个基于搜索引擎的答疑系统,它接受自然语言的提问,从WEB中提取问题可能的答案,其特点是能支持多语言的提问方式。

国外的问答系统都是独立运行的系统[3,4,5,6],它不包含任何的教育或者教学平台。这类系统在问题处理部件都增加了问题判断类型,以及增加了答案处理和解释部件,保证了系统对问题的更准确理解和呈现答案的简明扼要。国内智能答疑系统研究起步较晚,使得无论在答案准确性还是实时性上来说都比较差。相对于国外现存的智能答疑系统,国内的系统在基于自然语言的提问方面,其准确性和人性化方面还有一定的差距。国内比较典型的是上海交通大学的远程智能答疑系统。它采用FAQ库存储了用户可能提出的问题答案对。系统根据用户输入的自然语言问句,自动抽取其中的关键词和库中问题进行关键词匹配,并将最匹配的问题的答案从库中返回给用户。这类系统采用简单的基于关键词的匹配技术,并没有涉及用户问句语义理解方面的技术,导致搜索的结果与用户意图偏差,用户体验较差。 3 SwiftQAS系统模型设计

针对目前国内问答系统的不足,SwiftQAS系统结合本体应用以及用户需求,具有以下特点:1)利用本体作为领域知识库来描述领域概念及概念间的关系,能有效提取用户问句中的关键词并进行语义扩展,帮助用户更好理解领域内容。2)从问句中的关键词以及问句本身结构等多方面分析影响问句相似度计算的因素,能更准确地将用户问句与FAQ库问句快速匹配。3)当FAQ库中不存在与用户问句相似的问句时,借助互联网搜索问句关键词,并从相关网页中提取问句答案返回给用户,同时补充FAQ库并更新领域本体以方便下次问答。

图1 SwiftQAS系统模型

图1描述的是基于领域本体的SwiftQAS系统处理用户问句的过程:首先用户在系统界面输入自然语言问句或关键词提问。若用户提问为自然语言问句,则经过问句分析后得到问句关键词序列;若用户提问为领域关键词,则通过用户交互确定关键词。然后将关键词序列根据问句相似度计算完成基于FAQ库的问句匹配。当FAQ库中不存在与用户问句相似度较高的问句时,系统将对问句中的关键词进行网络搜索并利用段落检索算法提取网页中的相关段落作为答案返回给用户。

4 关键技术

4.1 构建领域本体

本文构建领域本体的主要思想是:首先,限于数据库领域问答系统的条件约束,该领域本体的局限性较好,因此可以根据《数据库系统教程(上、下册)》手工构建初始的领域核心本体——包含领域中比较重要的概念和关系。然后,以引入的初始核心本体为基础,通过对文档中的数据抽取、概念挖掘的方式来抽取领域中的概念及关系。最后,由于领域本体是对特定领域内的概念及其术语的精确性描述,因此要对新生成的领域本体再次进行确认。引入的领域本体可以是已有的、通用的本体,也可以利用本体构建工具手工构建而成。本文使用Protégé工具手工构建数据库领域本体 …… 此处隐藏:5219字,全部文档内容请下载后查看。喜欢就下载吧 ……

网络化学习问答系统关键技术研究-瘦身版.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219