首页 > 大数据 > 正文

大牛数据分析师养成日记

2016-05-12 16:52:38  来源:36大数据

摘要:在耀眼的职业光环下,数据分析师自身的成长,几乎是与孤寂相伴,在高级打杂中,锻造而成。
关键词: 分析师 大数据

       在耀眼的职业光环下,数据分析师自身的成长,几乎是与孤寂相伴,在高级打杂中,锻造而成。

  最近接到一个职业访谈的邀请,要给对数据分析感兴趣的新人Y(目前在知名电商从事系统开发和维护)一些建议,才突然发现自己在这个领域打滚了一段时间,一阵感叹后,写下自己的一些体会,尽管不全面,但或许能够给新人一些借鉴。如有不妥地方,请各位数据大牛轻拍。
 
  一、数据分析师有哪些要求?
 
  1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。
 
  2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等。
 
  3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为数据分析的出发点就是要解决商业的问题,只有理解了商业问题,才能转换成数据分析的问题,从而满足部门的要求。
 
  4、汇报和图表展现能力。这是临门一脚,做得再好的分析模型,如果不能很好地展示给领导和客户,成效就大打折扣,也会影响到数据分析师的职业晋升。
 
  二、请把数据分析作为一种能力来培养
 
  从广义来说,现在大多数的工作都需要用到分析能力,特别是数据化运营理念深入的今天,像BAT这样的公司强调全员参与数据化运营,所以,把它作为一种能力培训,将会让你终生受益。
 
  三、从数据分析的四个步骤来看清数据分析师需具备的能力和知识:
 
  数据分析的四个步骤(这有别于数据挖掘流程:商业理解、数据理解、数据准备、模型搭建、模型评估、模型部署),是从更宏观地展示数据分析的过程:获取数据、处理数据、分析数据、呈现数据。
 
  (一) 获取数据
 
  获取数据的前提是对商业问题的理解,把商业问题转化成数据问题,要通过现象发现本质,确定从哪些纬度来分析问题,界定问题后,进行数据的采集。此环节,需要数据分析师具备结构化的思维和对商业问题的理解能力。
 
  推荐书籍:《金字塔原理》、麦肯锡三部曲:《麦肯锡意识》、《麦肯锡工具》、《麦肯锡方法》
 
  工具:思维导图、mindmanager软件
 
  (二) 处理数据
 
  一个数据分析项目,通常数据处理时间占70%以上,使用先进的工具有利于提升效率,所以尽量学习最新最有效的处理工具,以下介绍的是最传统的,但却很有效率的工具:
 
  
 
  Excel:日常在做通报、报告和抽样分析中经常用到,其图表功能很强大,处理10万级别的数据很轻松。
 
  UltraEdit:文本工具,比TXT工具好用,打开和运行速度都比较快。
 
  ACCESS:桌面数据库,主要是用于日常的抽样分析(做全量统计分析,消耗资源和时间较多,通常分析师会随机抽取部分数据进行分析),使用SQL语言,处理100万级别的数据还是很快捷。
 
  Orcle、SQL sever:处理千万级别的数据需要用到这两类数据库。
 
  当然,在自己能力和时间允许的情况下,学习新流行的分布式数据库及提升自身的编程能力,对未来的职业发展也有很大帮助。
 
  分析软件主要推荐:
 
  SPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。
 
  SAS:老牌经典挖掘软件,需要编程。
 
  R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。
 
  随着文本挖掘技术进一步发展,对非结构化数据的分析需求也越来越大,需要进一步关注文本挖掘工具的使用。
 
  (三) 分析数据
 
  分析数据,需要用到各类的模型,包括关联规则、聚类、分类、预测模型等,其中一个最重要的思想是对比,任何的数据需要在参照系下进行对比,结论才有意义。
 
  推荐的书籍:
 
  1、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,卢辉着,机械出版社。这本书是近年国内写得最好的,务必把它当作圣经一样来读。
 
  2、《谁说菜鸟不会数据分析(入门篇)》和《谁说菜鸟不会数据分析(工具篇)》,张文霖等编着。属于入门级的书,适合初学者。
 
  3、《统计学》第五版,贾俊平等编着,中国人民大学出版社。比较好的一本统计学的书。
 
  4、《数据挖掘导论》完整版,[美]Pang-Ning Tan等着,范明等翻译,人民邮电出版社。
 
  5、《数据挖掘概念与技术》,Jiawei Han等着,范明等翻译,机械工业出版社。这本书相对难一些。
 
  6、《市场研究定量分析方法与应用》,简明等编着,中国人民大学出版社。
 
  7、《问卷统计分析实务—SPSS操作与应用》,吴明隆着,重庆大学出版社。在市场调查领域比较出名的一本书,对问卷调查数据分析讲解比较详细。
 
  (四) 呈现数据
 
  该部分需要把数据结果进行有效的呈现和演讲汇报,需要用到金字塔原理、图表及PPT、word的呈现,培养良好的演讲能力。
 
  推荐书籍:
 
  1、《说服力让你的PPT会说话》,张志等编着,人民邮电出版社。
 
  2、《别告诉我你懂ppt》加强版,李治着,北京大学出版社。
 
  3、《用图表说话》,基恩。泽拉兹尼着,马晓路等翻译,清华大学出版社。
 
  (五) 其他的知识结构
 
  数据分析师除了具备数学知识外,还要具备市场研究、营销管理、心理学、行为学、产品运营、互联网、大数据等方面的知识,需要构建完整广泛的知识体系,才能支撑解决日常遇到的不同类型的商业问题。
 
  推荐书籍:
 
  1、《消费者行为学》第10版,希夫曼等人着,江林等翻译,中国人民大学出版社,现在应该更新到更高的版本。
 
  2、《怪诞行为学》升级版,艾瑞里着,赵德亮等翻译,中信出版社
 
  3、《营销管理》,科特勒等着,梅清豪翻译,格致出版社和上海人民出版社联合出版
 
  4、《互联网思维—独孤九剑》,赵大伟主编,机械出版社
 

  5、《大数据时代—生活、工作与思维的大变革》,舍恩伯格等着,周涛等翻译,浙江人民出版社
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训

责编:pingxiaoli

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。