作者:
原文服务方: 湖南大学学报(自然科学版)       
摘要:
分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善.
推荐文章
文本分类器性能评估指标
文本分类
性能评估
BEP值
ROC曲线
几种省长信箱文本分类算法的实验与比较
省长信箱
短文本分类
特征选择
朴素贝叶斯算法在文本分类中的应用
有监督学习
文本分类
朴素贝叶斯算法
一种可靠信任推荐文本分类特征权重算法
文本分类
特征权重
可信计算
概率确定性密度
自然语言处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 几种常用文本分类算法性能比较与分析
来源期刊 湖南大学学报(自认科学版) 学科
关键词 文本分类 支持向量机 k 近邻 贝叶斯算法 TFIDF 算法
年,卷(期) 2007,(6) 所属期刊栏目 计算机科学与工程
研究方向 页码范围 67-69
页数 3页 分类号 TP183
字数 语种 中文
DOI 10.3321/j.issn:1000-2472.2007.06.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 卢苇 北京交通大学软件学院 37 310 9.0 16.0
2 彭雅 湖南大学计算机与通信学院 8 141 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (10)
参考文献  (2)
节点文献
引证文献  (76)
同被引文献  (120)
二级引证文献  (151)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(4)
  • 引证文献(4)
  • 二级引证文献(0)
2009(7)
  • 引证文献(6)
  • 二级引证文献(1)
2010(8)
  • 引证文献(1)
  • 二级引证文献(7)
2011(11)
  • 引证文献(8)
  • 二级引证文献(3)
2012(24)
  • 引证文献(8)
  • 二级引证文献(16)
2013(24)
  • 引证文献(10)
  • 二级引证文献(14)
2014(14)
  • 引证文献(4)
  • 二级引证文献(10)
2015(22)
  • 引证文献(7)
  • 二级引证文献(15)
2016(23)
  • 引证文献(10)
  • 二级引证文献(13)
2017(20)
  • 引证文献(5)
  • 二级引证文献(15)
2018(22)
  • 引证文献(6)
  • 二级引证文献(16)
2019(33)
  • 引证文献(6)
  • 二级引证文献(27)
2020(15)
  • 引证文献(1)
  • 二级引证文献(14)
研究主题发展历程
节点文献
文本分类
支持向量机
k 近邻
贝叶斯算法
TFIDF 算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南大学学报(自然科学版)
月刊
1674-2974
43-1061/N
16开
1956-01-01
chi
出版文献量(篇)
4654
总下载数(次)
0
总被引数(次)
41941
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导