基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据归一化是训练支持向量机(SVM)必须的数据预处理过程.常用的归一化方法有[-1,+1]、N(0,1)等方法,但现有文献尚未发现关于这些常用归一化方法科学依据方面的研究.本文以经验性的实验对数据归一化的理由、归一化与不归一化对训练效率和模型预测能力影响等方面开展研究.论文选择标准数据集,对原始未归一化、不同方法归一化、人工逆归一化、任选数据属性列等情况下的数据分别进行了SVM训练,并记录目标函数值随迭代次数的变化、训练时间、模型测试及k-CV性能等信息.实验结果表明,将数据值限制在常规范围内的归一化方法,如[-0.5,+0.5] ~[-5,+5]、N(0,1)~N(0,5)等均能在训练时间最短的情况下获得最佳的预测模型.本文工作为SVM以及一般机器学习算法的数据归一化提供了科学依据.
推荐文章
特征向量的归一化比较性研究
归一化
特征向量
参数优化
支持向量机
基于类内方差归一化和SVM的说话人识别方法
支持向量机
广义线性序列核
类内方差归一化
实时定量PCR的数据归一化方法
实时定量PCR
归一化
管家基因
内参基因
基于归一化水体指数的水域面积估算研究
水体
遥感
监督分类
NDWI
ETM+
清江流域
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 SVM训练数据归一化研究
来源期刊 山东师范大学学报(自然科学版) 学科 工学
关键词 支持向量机 数据归一化 数据预处理 交叉验证
年,卷(期) 2016,(4) 所属期刊栏目
研究方向 页码范围 60-65
页数 6页 分类号 TP391.41
字数 5015字 语种 中文
DOI 10.3969/j.issn.1001-4748.2016.04.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 段会川 山东师范大学信息科学与工程学院 71 1293 15.0 34.0
5 孙海涛 山东师范大学实验室与设备管理处 13 94 4.0 9.0
6 汤荣志 山东师范大学信息科学与工程学院 1 62 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (4)
参考文献  (6)
节点文献
引证文献  (62)
同被引文献  (159)
二级引证文献  (22)
1948(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(8)
  • 引证文献(8)
  • 二级引证文献(0)
2018(29)
  • 引证文献(26)
  • 二级引证文献(3)
2019(35)
  • 引证文献(21)
  • 二级引证文献(14)
2020(12)
  • 引证文献(7)
  • 二级引证文献(5)
研究主题发展历程
节点文献
支持向量机
数据归一化
数据预处理
交叉验证
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山东师范大学学报(自然科学版)
季刊
1001-4748
37-1166/N
大16开
山东省济南文化东路88号山东师范大学院内
1956
chi
出版文献量(篇)
3655
总下载数(次)
12
总被引数(次)
15144
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导