本文首先通对分类模型进行分析,由于分类规则容易理解、简单,因此分类问题拟采用分类规则表示,而社会情感优化算法是一种新的群智能优化算法,模拟了人类群体的决策过程,因此将社会情感算法应用于分类问题,针对连续属性建立分类模型.
【关 键 词 】社会情感优化算法 分类规则 模型
分类是数据挖掘的主要研究内容之一,是反映同类事务共同性质的特征型知识和不同事务之间的差异型特征知识.分类的目的是能够根据已正确分类的数据构造出一个分类模型,并用该模型预测未知数据所属类别.
社会情感优化算法(SEOA)是通过模拟人类情感、情绪对行为的影响而构造的一种群智能优化算法,该算法具有广阔的社会学和生物学背景.传统的群智能算法提供的作用规则有限,因此个体进行自组织、自学习能力受到了限制.而社会情感优化算法具有更优越的性能,由于个体有情感因素的加入,能够利用每个人的情绪作为控制策略,从而提高了算法的性能,改善了算法的多样性和灵活性,它已被成功应用于团簇结构优化、电力系统无功优化等实际问题中.但未见到在分类问题方面的应用,本文将把社会情感算法应用于分类问题,针对连续属性建立模型.
1.分类
分类是构造一个分类模型,该模型能够把数据库中未分类的数据项映射到给定类别的某个.分类主要需要两个步骤.
第一步、建立一个模型,即从已经给定的数据类集抽取一部分作为训练集来建立模型;
第二步、评估该模型的分类准确率,即用已经建立好的模型对于数据集中剩下未分类的数据进行分类,若该模型的准确率能够接受,则采用该模型进行分类.
用下列叙述描述分类:给定一组训练数据集,它是由一条条记录组成的.每条记录包含若干个特征属性,并且还包含该条记录所属的类别属性.该记录的属性集合用矢量表示为X等于(X1,X2,等Xn),其中Xi(1
2.社会情感优化算法
2.1 算法的提出
社会情感优化算法是一种基于社会活动中人的情感对行为的影响的群智能优化算法,模拟了理智情况下的人在参与某种社会活动时,感知其周围环境对他的评价,通过情绪的反馈采取相应决策和效应,从而对下一步活动进行指导,重复此过程,直到满足条件为止.
2.2 算法的介绍
在社会情感优化算法中,每个个体代表一个虚拟的人,在每次的迭代过程中,它将根据自己的情绪指数来选择相应的行为,随后社会给出该个体的评价值,从评价值就可以反映出该个体本次行为的正确与错误.如果正确,则情绪指数上升,否则就降低.
此时个体情绪高昂,学习的渴望非常强烈,而忽略群体历史较差评价的负面影响,只考虑外界环境的最好评价.
3.基于社会情感算法的分类模型
分类模型有很多表示方法,如决策树、数学公式、神经网络、框架和规则等.由于分类规则易于理解,表示形式简单,因此宜采用规则来描述分类问题.
构造分类规则时,需要一组训练样本数据集作为输入,该数据集用关系模式R(a1,a2,等am,am+1)表示,其中ai(i等于1,2,等m,m+1)为属性,在分类问题中,将所有属性分为特征属性和类别属性.对于连续属性而言,分类规则的一般形式如If (x14 小结
本文首先提出分类问题及分类模型,然后引进一种基于社会活动中人的情感对行为的影响的群智能优化算法――社会情感算法,并且将社会情感算法应用于分类问题来建立分类模型.