首页 > 大数据 > 正文

数据挖掘师角逐大奖

2011-08-10 15:06:19  来源:中国商业智能网

摘要:Brierley先生仅利用一台有最新处理器和大容量内存的现成电脑,用名为R的开源软件和他自己的软件工具,已经开发了十年以上的数据挖掘。
关键词: 数据挖掘
    足智多谋的数据挖掘师很认真地为300万美元大奖竞标。

    澳大利亚的三个团队进入一场竞赛,去为努力帮助医生积极治疗病人并节省数千万的美元而去获得加利福尼亚医疗保健机构提供的近323万美元的奖金。

    他们是400多支传统健康奖争夺者队伍中的三支,该奖项是列于墨尔本Kaggle网站上的一项数据挖掘创新方面的竞赛,它使用互联网信息源聚集的现象来解决问题。

    美国国宇航局(NASA)、福特、Deloitte、斯坦福大学、莫纳什大学和墨尔本大学在Kaggle数据分析市场举行了以前的竞赛,提倡算法在真实环境下的数据集中测试以提高业务规划。

    现在,来自几十个国家好奇的数据分析师正分析三年以来洛杉矶地区的医疗记录以找出如何预测哪些患者会在第四年住院的方法。根据预测算法的准确性,参赛者将在2013年2月比赛结束时赢得规模高达300万美元的奖金。

    “赢家至少保证有美元的奖金,” 墨尔本数据挖掘师Phil Brierley说,Brierley用Tiberius v Sali Mali这个结合了他自己的数据挖掘软件的名称Tiberius和威尔士儿童书里的人物合起来的用户名,参加了对大奖的角逐。

    “两年后,我希望仍在认真参与的每个人能朝同样的得分上汇聚,” Brierley先生预测说。“最终,你将会弄清每个人都在做什么。”

    做为辅助,会有不断升级的奖金每六个月奖给领先的选手。两个八月得分最高的队伍将分别获得30000美元和20000美元的奖励,但他们必须对其他参赛者显示他们的方法。

    Brierley先生正在思考如果在下一个名列第一或第二名时,他该做什么。他已经在博客和Kaggle健康奖论坛上分享了一些技术,但不能确定他是否还会分享他现在的方法。

    上周,Brierley先生与另两位澳大利亚的队伍,Planet Melbourne 和 Tom & Jerry, 一起进入了前十位。

    Brierley先生仅利用一台有最新处理器和大容量内存的现成电脑,用名为R的开源软件和他自己的软件工具,已经开发了十年以上的数据挖掘。

    有英国教育背景的工程师Brierley,是在IBM公司工作的数据挖掘顾问和为澳大利亚四大银行做过多年的信用卡风险分析。

    但他为追逐大奖的探索不仅仅是一种爱好。上个星期,他对比赛做了67次提交,并有几次的排名第一。

    Kaggle的创始人Anthony Goldbloom认为最好的数据分析师应该得到更好的回报。

    “顶级的对冲基金经理赚1亿美元一年,” Goldbloom先生说。“我们希望在未来,最好的预测建模师能赚2500万美元到3000万美元一年,Kaggle就是他们赢钱的市场。”

    300万美元的Kaggle健康奖目前由佛罗里达州的男子David Vogel领先。

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。