这项研究是基于这样的思考:人类往往会倾向于根据自己的经验和看到的例子去思考并做出决定。例如,儿童也许能从他父母谈话的几个单词就知道他们正在谈论夏令营,因为他们去年去过,并且他们知道“month,” “lake” 和“counselors”这样的单词只会在这种情况下一起使用。
然而,如果我们在某一个特定的领域经验有限或者也许没有经验,一点点的帮助可能都是必要的——这正是Bayesian Case Model发挥作用的地方。给定一组数据,如食谱,模型会基于他们最突出的成分和给定食谱集中的代表实例或原型比较分类,这个给定的食谱也是计算机选的。
例如,尽管我不知道啤酒、辣椒粉和番茄酱中有相同的成分辣椒,但当我发现该模型被视为典型的辣椒食谱,我就可以断定该食谱中包含辣椒。事实上,麻省理工学院的研究人员Been Kim 、Cynthia Rudin 和Julie Shah发现,不仅他们的模型执行比以前的技术更准确,而且人类测试人员使用Bayesian Case Model技术的输出比以前技术能显著提高分类食谱的速度。
Julie Shah (左)和 Been Kim
这种技术在某些特定领域应该使用更加复杂类型的数据。
即使不是这种模式本身,随着数据集超过人们的分析能力,这种类型的工作也可以非常有用。非监督机器学习和人工智能模型,例如,从软件方面的Ayasdi以及谷歌著名猫脸识别深度学习系统已经可以通过大量的数据和识别类似的事情,但任何工具只有准确和简单的帮助人类辨识它所发现的才会有用。完整的论文点击这里。
原文链接: Researchers build pattern-recognition model that acts like a human (责编/魏伟)
2014中国大数据技术大会(Big Data Technology Conference 2014,BDTC 2014)将于2014年12月12日-14日在北京新云南皇冠假日酒店召开。传承自2008年,历经七届沉淀,“中国大数据技术大会”是目前国内最具影响、规模最大的大数据领域技术盛会。本届会议,你不仅可以了解到Apache Hadoop提交者Uma Maheswara Rao G(兼项目管理委员会成员)、Yi Liu,以及Apache Hadoop和Tez项目管理委员会成员Bikas Saha等分享的通用大数据开源项目的最新成果和发展趋势,还将斩获来自腾讯、阿里、Cloudera、LinkedIn、网易等机构的数十场干货分享。 当下门票团购还有些许优惠, 预购从速。
免费订阅“ImapBox大数据”微信公众号,实时了解最新的大数据进展!
ImapBox大数据,专注大数据资讯、技术和经验的分享和讨论,提供Hadoop、Spark、Impala、Storm、HBase、MongoDB、Solr、机器学习、智能算法等相关大数据观点,大数据技术,大数据平台,大数据实践,大数据产业资讯等服务。
阅读和此文章类似的: 全球云计算