QA系统中问题答案置信度评分方法研究.doc
约32页DOC格式手机打开展开
QA系统中问题答案置信度评分方法研究,置信度指的是一个问题回答系统(qa 系统)对其所作回答的自信程度。描述了一种基于最大熵模型的算法。首先,从训练语料中提取若干因素来训练最大熵模型;然后应用训练好的模型在测试集上计算置信度。在 2002 年度的文本检索会议(trec)中,qa 系统用该算法计算每个问题答案的置信度,并依此排序,获得了显著的成绩。 最大...
内容介绍
此文档由会员 ningxiang00 发布
置信度指的是一个问题回答系统(QA 系统)对其所作回答的自信程度。描述了一种基于最大熵模型的算法。首先,从训练语料中提取若干因素来训练最大熵模型;然后应用训练好的模型在测试集上计算置信度。在 2002 年度的文本检索会议(TREC)中,QA 系统用该算法计算每个问题答案的置信度,并依此排序,获得了显著的成绩。
最大熵方法是建立统计语言模型的有效方法,具有较强的知识表达能力。但是,在用现有的最大熵方法建立统计模型时存在计算量大的问题,针对这一问题,提出了一种改进的最大熵方法。该方法采用互信息的概念,通过Z-测试进行特征选择,将该方法将该方法应用于汉语的义项排歧中,实验表明,该算法具有较高的的计算效率和正确率。
本系统认为,答案抽取问答(QA)系统作为一个分类问题,分类答案候选句成正面或负面影响,为了证实可行性,这种新方法,本系统首先提取特征有关的句子,利用最大熵模型对其进行置信度评估取的了良好的效果。
32页,17000字
最大熵方法是建立统计语言模型的有效方法,具有较强的知识表达能力。但是,在用现有的最大熵方法建立统计模型时存在计算量大的问题,针对这一问题,提出了一种改进的最大熵方法。该方法采用互信息的概念,通过Z-测试进行特征选择,将该方法将该方法应用于汉语的义项排歧中,实验表明,该算法具有较高的的计算效率和正确率。
本系统认为,答案抽取问答(QA)系统作为一个分类问题,分类答案候选句成正面或负面影响,为了证实可行性,这种新方法,本系统首先提取特征有关的句子,利用最大熵模型对其进行置信度评估取的了良好的效果。
32页,17000字