• 首页
  • 期刊简介
  • 编委会
  • 投稿指南
  • 收录情况
  • 杂志订阅
  • 联系我们
引用本文:王雅蓉,李 亮,吴胜利.联邦搜索中基于词向量的多样化信息源选择算法[J].软件工程,2018,21(11):1-6.【点击复制】
【打印本页】   【下载PDF全文】   【查看/发表评论】  【下载PDF阅读器】  
←前一篇|后一篇→ 过刊浏览
分享到: 微信 更多
联邦搜索中基于词向量的多样化信息源选择算法
王雅蓉,李 亮,吴胜利
(江苏大学,江苏 镇江 212013)
摘 要: 对支持检索结果多样化任务的信息源选择进行了研究。分析了现有研究的不足,提出利用词向量提取文 本的语义特征,在此基础上实现文档建模和信息源选择。采用ClueWeb12b-13数据集构建实验平台和进行实验,基于R 方法的评价结果表明,所提出的方法优于现有的方法GLS和MnStD,且在不同条件下性能稳定。
关键词: 联邦搜索;信息源选择;检索结果多样化;词向量
中图分类号: TP391.3    文献标识码: A
Word Representation-Based Resource Selection for Search Result Diversification in Federated Search
WANG Yarong,LI Liang,WU Shengli
(Jiangsu University, Zhenjiang 212013, China)
Abstract: This article studies the resource selection in supporting of search result diversification,analyzes the shortcomings of the existing researches and proposes to use the distributed word representation to extract the semantic features of the text.Based on this,document modeling and resource selection are achieved.The experimental platform is constructed by using the ClueWeb12b-13 dataset.The evaluation results based on the R-method show that the proposed algorithm is superior to the existing GLS and MnStD and it is stable in various kinds of situations.
Keywords: federated search;resource selection;search result diversification;distributed word representation


版权所有:软件工程杂志社
地址:辽宁省沈阳市浑南区新秀街2号 邮政编码:110179
电话:0411-84767887 传真:0411-84835089 Email:semagazine@neusoft.edu.cn
备案号:辽ICP备17007376号-1
技术支持:北京勤云科技发展有限公司

用微信扫一扫

用微信扫一扫