对于机器学习从业者而言,有自己最喜欢的算法是很常见的。可能这有点不太合乎常理,因为没有一个算法能够完全地主导所有的应用,而且机器学习算法的性能很大程度上依赖于应用程序和数据集的维度。甚至对于一个给定的问题和数据集,由不同算法训练而得到的一个组合模型往往会优于单个模型。尽管如此,人们还是有自己最喜欢的算法。有些人喜欢SVM,因为它们有着优美的公式或者是可直接使用的高质量算法实现;也有些人喜欢决策规则,因为它们的简单性和可解释性;还有些人则因为神经网络的灵活性而痴迷于它。 我所喜欢的算法就是(你可能已经猜到了)Random Forest(随机森林),而且它属于第二种常用的建模技术(首选项是线性模型),我通常会在所有给定的数据集上都尝试一下。 这里有几个原因
这个来自scikit-learn美观的可视化结果证实了决策森林的建模能力。
缺点?
一些参考资料:
Leo Breiman发表的一篇论文,他是随机森林算法描述的发明者。
这里还有Rich Caruana等人发表的另一篇论文,内容讲的是在各种不同的数据集上评估不同的监督学习算法。
原文链接:The Unreasonable Effectiveness of Random Forests(译者/刘帝伟 审校/赵屹华、朱正贵、李子健 责编/周建丁)
译者简介: 刘帝伟,中南大学软件学院在读研究生,关注机器学习、数据挖掘及生物信息领域。
【分享预告】9月29日20:30-21:30,ImapBox人工智能用户群安排技术专家深度分享“世纪佳缘推荐和机器学习算法实践”。
本文为ImapBox编译整理,未经允许不得转载,如需转载请联系market#csdn.net(#换成@)
本网页所有文字内容由 imapbox邮箱云存储,邮箱网盘, iurlBox网页地址收藏管理器 下载并得到。
ImapBox 邮箱网盘 工具地址: https://www.imapbox.com/download/ImapBox.5.5.1_Build20141205_CHS_Bit32.exe
PC6下载站地址:PC6下载站分流下载
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox 网页视频 工具地址: https://www.imapbox.com/download/ImovieBox4.7.0_Build20141115_CHS.exe
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算