数据挖掘中分类技术应用(8)
发布时间:2021-06-05
发布时间:2021-06-05
西安电子科技大学数据挖掘课程课件,关于分类聚部分的
行时还是很快的。
第四,建立神经网络需要做的数据准备工作量很大。一个很有误导性的神话就是不管用什么数据神经网络都能很好的工作并做出准确的预测。这是不确切的,要想得到准确度高的模型必须认真的进行数据清洗、整理、转换、选择等工作,对任何数据挖掘技术都是这样,神经网络尤其注重这一点。比如神经网络要求所有的输入变量都必须是0-1(或-1 -- +1)之间的实数,因此像“地区”之类文本数据必须先做必要的处理之后才能用作神经网络的输入。
神经网络是基于经验风险最小化原则的学习算法,有一些固有的缺陷,比如层数和神经元个数难以确定,容易陷入局部极小,还有过学习现象,这些本身的缺陷在SVM算法、进化算法中可以得到很好的解决。
在计算机科学中,进化算法实质上是一种优化处理过程;但这种过程与传统的优化方法不同,传统的优化方法都是用代价函数来衡量动作的行为,从而通过选择一个好的动作使操作的对象得到优化;绝大多数典型的优化方法是通过计算代价函数的梯度或高阶统计值进行优化的,一般情况下,这类方法只能得到局部极优值,并且容易受到随机干扰的影响。而进化的方法符合达尔文“适者生存”和随机信息交换思想,既消除解中不适应因素,又利用了原有解中的知识,且不需要微分等高阶信息,从而使优化过程加快,最终获得全局极优解。
上一篇:中考不等式阅读理解新题型探究
下一篇:为中小企业融资服务谋划