基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
首先用DF方法对文本进行特征选择,然后使用LDA建模的方法获取文本主题分布;用降维后的文本主题分布计算文本相似度。这种DF和LDA结合的文本相似度计算方法,在考虑到词频信息特征的同时,也考虑了语义信息特征。两次降维不仅降低了算法时间复杂度,而且在文本相似度计算过程中消除了低价值词项的干扰,提高了计算的精度。实验结果表明,DF-LDA算法在Tancrop数据集上F值较LDA方法有了7%的提高。
推荐文章
一种PST_LDA中文文本相似度计算方法
词性标注
LDA模型
PST_LDA模型
文本相似度计算
一种PST_LDA中文文本相似度计算方法
词性标注
LDA模型
PST_LDA模型
文本相似度计算
基于 LDA 的中文文本相似度计算
向量空间模型
文本相似度
自然语言处理
潜在狄里克雷分配
主题模型
基于LDA模型的文本相似度研究
文本挖掘
LDA模型
Gibbs抽样
文本相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种DF—LDA的文本相似度计算方法
来源期刊 汉口学院学报 学科 工学
关键词 特征选择 LDA模型 DF—LDA方法 降维 文本相似度计算
年,卷(期) 2014,(4) 所属期刊栏目
研究方向 页码范围 1-3
页数 3页 分类号 TP391.1
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
特征选择
LDA模型
DF—LDA方法
降维
文本相似度计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
汉口学院学报
季刊
湖北省武汉市江夏区文化大道299号
出版文献量(篇)
733
总下载数(次)
4
总被引数(次)
0
论文1v1指导