【机器学习】粗糙集属性约简算法与mRMR算法的本质区别

粗糙集属性约简算法(Rough Set Attribute Reduction Algorithm)和最大相关系数最小冗余算法(Minimum Redundancy Maximum Relevance Algorithm,简称mRMR算法)是两种常用的特征选择算法,它们都可以用来从原始特征集中选择出一部分最具代表性和重要性的特征。尽管它们都属于特征选择的范畴,但它们的本质和算法思想存在一些区别。

粗糙集属性约简算法是由Z. Pawlak在粗糙集理论的基础上发展而来的一种特征选择算法。粗糙集理论是一种基于近似推理的数学方法,它通过对数据进行粗糙分割,将数据划分为等价类,并利用这些等价类的属性间关系来进行特征选择。粗糙集属性约简算法的基本思想是通过消去冗余和保留关键属性来实现特征的约简。该算法根据属性的重要性程度进行排序,并逐步去除冗余属性,直到找到一个最小的属性子集,该子集具有最少的冗余特征并保持其表示能力。

与粗糙集属性约简算法相比,mRMR算法是一种基于信息论的特征选择方法。它通过计算特征之间的相关性和冗余性来评估特征的重要性。mRMR算法的核心思想是选择具有最大相关性并且最小冗余的特征。具体地说,该算法通过计算每个特征与目标变量之间的相关性,并计算特征之间的互信息来度量特征的相关性和冗余性。然后,它根据这些度量值进行特征选择,选择具有最大相关性并且最小冗余的特征子集。

从算法思想上来看,粗糙集属性约简算法更加侧重于数据的粗糙性和不确定性,通过消除冗余和保留关键属性来实现特征的约简。它主要利用粗糙集理论的等价类和属性间关系来进行特征选择。而mRMR算法则更注重特征与目标变量之间的相关性和特征之间的冗余性,通过计算相关性和互信息来评估特征的重要性。它的目标是选择具有最大相关性并且最小冗余的特征子集。

此外,粗糙集属性约简算法和mRMR算法在计算和实现上也有一些区别。粗糙集属性约简算法通常需要构建决策表和等价类矩阵,并进行属性的割约和约简计算。而mRMR算法则需要计算特征之间的相关性和互信息,并进行特征选择和排序。

总之,粗糙集属性约简算法和mRMR算法作为两种常用的特征选择算法,在本质和算法思想上存在一些区别。粗糙集属性约简算法注重数据的粗糙性和不确定性,通过消除冗余和保留关键属性来进行特征约简;而mRMR算法更注重特征与目标变量之间的相关性和特征之间的冗余性,通过计算相关性和互信息来评估特征的重要性。此外,它们在计算和实现上也有一些差异。对于具体的应用场景和数据集,选择合适的特征选择算法是非常重要的。


点赞(66) 打赏
如果你喜欢我们的文章,欢迎您分享或收藏为众码农的文章! 我们网站的目标是帮助每一个对编程和网站建设以及各类acg,galgame,SLG游戏感兴趣的人,无论他们的水平和经验如何。我们相信,只要有热情和毅力,任何人都可以成为一个优秀的程序员。欢迎你加入我们,开始你的美妙旅程!www.weizhongchou.cn

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部