数据分析师适合看什么书

2024-04-27

1. 数据分析师适合看什么书

      数据分析是一门专业且跨越多个领域的学科,我整理了数据分析师看的书,希望对你有所帮助:
         数据分析师的必读书单:Excel 
          《谁说菜鸟不会数据分析》
        知名度比较高的一套书,适合新手,优点是它和数据分析结合,而不是单纯地学习函数。学会函数适用的场景和过程比它本身更重要。
        是否需要学习VBA是仁者见仁的答案。我个人不建议。Excel VBA的最大优势是适用性广,哪怕去其他行业其他职位,都离不开Excel,这时候它就是一个工作加分的亮点。但是在互联网行业,对数据分析师,VBA的性价比就不高了。
        这里只推荐一本,因为我就翻过上面这本,还没全看…
         数据分析师的必读书单:数据可视化 
        数据可视化的书不多。市面上多以编程为主,面向新手和设计的教程寥寥无几。 如果只是了解图表,看Excel的书籍也管用。
        内容很丰富,涉及可视化的方方面面,也囊括更类编程语言和设计软件:Python+JS+R+Excel。作者还有另外一本书《数据之美》。
        可视化是一门侧重灵感的学科,有一种入门技巧是从他人设计中学习,从模仿开始,了解他人是如何设计的,这个网络上有大量的信息图可以参考。当然数据分析师更需要的是如何发现,别只学习展示。
        英文足够好,可以看Edward Tufte的著作:《The Visual Display of Quantitative Information》、《Envisioning Information》、《Beautiful Evidence》。他是数据可视化的领军人物,他的理念是反对为艺术效果而混淆或者简化数据。暂时没有中文版。
         数据分析师的必读书单:分析思维 
        《金字塔原理》
        分析思维首推《金字塔原理》,金字塔原理有些人说它晦涩难懂,我认为是芭芭拉这个老太有骗稿费之嫌,本书包含了报告、写文、演讲等诸多内容。可以细看可以快看。另外还有一本同名案例集,有兴趣可以买。
        另外麦肯锡相关的书籍还有《麦肯锡意识》《麦肯锡工具》《麦肯锡方法》等。
        《深入浅出数据分析》
        深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。
        《精益数据分析》
        国外的精益系列一直以互联网创业作内容导向,本书也属于此类。如果是互联网行业相关,可以看看。它介绍了不同领域的指标,以及产品不同时期的侧重点。案例都是欧美,这部分做参考用。
        接下来的几本,是兴趣向读物。《黑天鹅》能拓展思维,讲叙了不确定性。《思考的技术》,大前研一的著作,也是咨询类经典。如果对咨询向的分析感兴趣,还可以看BCG系列,或者刷CaseBook。《批判性思维》,则是教你如何形成理性思维。
         数据分析师的必读书单:SQL 
        数据库有很多种,常见有Oracle,MySQL,SQL Server等。我推荐学习MySQL,这是互联网公司的主流数据库。以后学习Hadoop生态时,MySQL也是最接近Hive语法的语言。
        MySQL不需要专门看书学习,因为数据分析师以查询为主,不需要考虑数据性能、数据安全和架构的问题。使用搜索引擎能解决90%的问题,我就是w3cschool学的。
        《MySQL必知必会》
        如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的'。
        如果想深入,可以看《高性能MySQL》,对分析师没啥用。至于另外一个方向NoSQL,对入门者还是小众了些。
        如果有余力,就学习正则表达式吧,清洗数据的工作就靠它了。
         数据分析师的必读书单:统计学 
        统计学是比较大的范围,分析师往后还需要学线性代数和矩阵、关系代数等。初学者不需要掌握所有公式定理的数学推导,懂得如何应用就行用。
        《深入浅出统计学》
        大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。书本注重应用和趣味性,数学推理一般。
        《商务与经济统计》
        国外的经典教材,已经出到第十二版了。国外教材都有丰富有趣的案例,所以读起来会比国内的轻松不少。如果你还在读书,不妨买这本看一看。
        名字既然有商务与经济,所以书中辅以了大量的相关案例。书内容很多,看起来不会快,适合细读。
        《The Elements of Statistical Learning》
        稍微有一些难度的英文书籍,属于进阶版统计学,国外很推崇。如果要往机器学习发展,这本书可以打下很好的基础。
        以上书籍的难度是逐步递增的。统计学是机器学习的基础,是概率、矩阵等实际应用。现在已经有很多统计工具,Excel的分析工具库、传统行业的SPSS、SAS以及R、Python等,使用过程都不用计算推导,大学考试才会考,现在都是计算机解决,轻松不少。
         数据分析师的必读书单:业务知识 
        不同领域的业务知识都不一样,这里以互联网举例。
        《增长黑客》
        增长黑客的概念就是随着这本书的畅销传播开来。增长黑客在国内即是数据分析+运营/产品的复合型人才。这本书好的地方在于拓展思路,告诉我们数据能够做什么,尤其是连AB测试都不清楚的新人。
        实际涉及的业务知识不多,我推荐,是希望新人能够了解数据驱动的概念,这本算是我走上数据化运营的启蒙读物了。
        《从零开始做运营》
        知乎亮哥的书籍,互联网所有的数据都是和运营相关的,如果是新手,就以此学习业务知识。如果已经工作很多,就略过吧。

数据分析师适合看什么书

2. 数据分析师考试教材有哪些?

数据分析师考试教材一共有三本,分别是《供应链优化与投资分析》、《数据分析基础》、《营销数据分析》。


这三本考试教材以数据分析方法和模型为主要内容,以产品、客户、营销、供应链和投资为主要应用场景,既有完整场景数据分析的全流程,又有各个模块的分析算法和实例,理论结合实际,突出方法和实际操作,是专门从事数据分析事务和企业数据分析不可多得的专业系列参考书,也是各行业涉及数据分析教学、业务提升及数据化转型人员的参考图书。

3. 数据分析师面试要准备什么?

什么是数据分析师证书?

数据分析师面试要准备什么?

4. 数据分析师考哪些内容?

Level Ⅰ:业务数据分析师。专指政府、金融、电信、零售等行业前端业务人员;从事市场、管理、财务、供应、咨询等职位业务人员;非统计、计算机专业背景零基础入行和转行就业人员。


Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过 Level Ⅰ认证半年以上。专指政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。


Level Ⅲ:大数据分析师。两年以上数据分析岗位工作经验,或通过LevelⅠ认证半年以上。专指政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与云端大数据的人员。《投资数据分析实务》、《市场调研与预测》是项目数据分析专业考生必修必考教材。 《经济学原理》、《统计学原理》、《财务管理》是本课程的先修课程。考试内容涉及项目前期市场研究、项目相关数据采集、数据处理、数据预测、投资数据编制与估算、现金流量估算、投资数据分析、资本限量决策、不确定性分析、公司价值评估等。

5. 数据分析师考试内容有哪些?

考试考察内容:理论考试+实操考试。理论考试内容包括数据分析基本原理、概念及简单计算,题型分为填空、判断、单选题、多选题,此考试为上机考试。实操考试为实际案例分析,一共三科。


Level Ⅰ:业务数据分析师。专指政府、金融、电信、零售等行业前端业务人员;从事市场、管理、财务、供应、咨询等职位业务人员;非统计、计算机专业背景零基础入行和转行就业人员。


Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过 Level Ⅰ认证半年以上。专指政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。


Level Ⅱ:大数据分析师。两年以上数据分析岗位工作经验,或通过LevelⅠ认证半年以上。专指政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与云端大数据的人员。《投资数据分析实务》、《市场调研与预测》是项目数据分析专业考生必修必考教材。 《经济学原理》、《统计学原理》、《财务管理》是本课程的先修课程。考试内容涉及项目前期市场研究、项目相关数据采集、数据处理、数据预测、投资数据编制与估算、现金流量估算、投资数据分析、资本限量决策、不确定性分析、公司价值评估等。

数据分析师考试内容有哪些?

6. 数据分析师面试经验

 数据分析师面试经验
                      经常被问到一个问题,数据分析师或者数据挖掘工程师面试都问什么问题啊?特别是以下几类人群:
    
    1、想转行做数据分析工作的朋友。
    2、之前在比较小的公司做数据分析师,去大公司面试。
    3、在校大学生。
    在回答这些问题之前,先谈我的一个面试经历,记得之前我在一家小公司做数据分析师的时候,有朋友推荐我去一家大公司去面试数据分析师。当时我也在想,在面试大公司的数据分析师一定会问:
    1、你做过哪些模型?
    2、用什么工具做的啊?
    3、你会或者知道哪些算法啊?
    4、数据量有多大?
    .......
    但是当我去沟通下来的时候,问关于数据挖掘模型算法原理、使用什么工具的东西不多。更多是问一些关于项目背景、怎么思考这些项目、如何使用这些模型结果、怎么推动业务方去使用数据结果。【坦白说当时觉得不可思议,怎么问这些问题呢?】
    所以大家在面试数据分析岗位的时候,基础知识是必须的。但是更多要关注数据实现数据价值,特别是从事一段时间数据分析同学,但如果仅仅是刚准备从事数据分析同学,基础的专业知识与技能肯定是面试必问的话题。如果这家公司希望未来培养或者招的真的做数据分析的,那就会像我面试碰到的,一定也会很关注面试之外的问题。
    回到具体面试的问题,PS:这里我仅仅谈谈我的几点看法和我面试中会问到的几个问题,以及我为什么会为这些问题。
    一、了解你面试岗位的工作性质
    1、你对于你面试岗位价值的理解。
    2、你觉得这个岗位大概的工作内容。
    3、对于公司的理解。
    二、沟通表达/逻辑思维
    1、说一下你过往做的一些项目/说说你以前的工作经历。
    2、你之前做过的一些专业分析。
    3、你之前做过的模型。
    4、之前是如何与业务方打交道的。
    三、对于数据与商业的理解
    1、如何理解数据敏感性?
    2、你觉得数据怎么体现其商业价值?能否举个例子。
    四、专业技能
    1、基础的统计学知识。
    2、数据挖掘基本的算法。
    3、怎么评估模型好坏。
    4、使用的工具。
    5、数据挖掘流程。
    6、怎么清洗变量【例如:指标定义、缺失值处理】。
    7、怎么解决建模中会碰到一些技术问题【例如:共线性、不同模型针对的.数据类型】。
    五、学习能力
    1、是怎么学习专业知识。
    2、怎么学习业务知识。
    六、职业发展
    1、未来3年的职业规划。
    2、要实现这些规划计划是怎么样。
    我把面试过程可以会问几类问题,不同的面试官可以侧重点不一样。我想和所有面试数据分析师的朋友说的:
    1、面试过程中大家是平等的。不要太弱势也不要太强势。
    2、把你之前的工作有条理的表达出来。
    3、面试一些问题的时候,可以想一想。我个人觉得,并不是所有的问题必须别人一问完,立即回答。
    4、把面试当作一种学习与经历。关键是从一些面试中你能发现自己不足。
    另外一些小tips:
    1、面试之前了解这个岗位。了解一下这个公司。花点时间在面试公司和岗位,了解了解人家公司是干什么,如果你对这家公司特别感兴趣,去网站上看看,去体验体验人家公司的产品和服务。会让面试的人感觉到尊重。当然太贵就算了。
    2、如果有认识的人或者通过一些渠道先了解一下你面试的公司,部门情况到底是怎么样的。到底要招什么样的人。
    3、很多企业的招聘与实际需要的人之间有很大的出入。
    4、投递简历前:花点时间在简历上:要看到一份没有错别字且能把之前工作写清楚在一张纸上真的很少。
    5、机会是留给有准备的人。你准备好了吗?每次面试结束看,看看自己的不足,然后一定立即去学起来。
    
  ;

7. 数据分析师考试科目有哪些?

考试科目包括数据分析理论知识、数据分析算法与模型、数据分析应用,考试方式分为理论机考和实操机考,满分都为100分。


数据分析师分为CDA数据分析师和CPDA考试。CDA数据分析师考试科目为理论+实操考核;CPDA考试科目为供应链优化与投资分析、数据分析基础、营销数据分析。


数据分析师考试教材共有三本,分别是《供应链优化与投资分析》、《数据分析基础》、《营销数据分析》。

数据分析师考试科目有哪些?

8. 数据分析师面试常见问题有哪些?

1、如何理解过拟合?
过拟合和欠拟合一样,都是数据挖掘的基本概念。过拟合指的就是数据训练得太好,在实际的测试环境中可能会产生错误,所以适当的剪枝对数据挖掘算法来说也是很重要的。
欠拟合则是指机器学习得不充分,数据样本太少,不足以让机器形成自我认知。
2、为什么说朴素贝叶斯是“朴素”的?
朴素贝叶斯是一种简单但极为强大的预测建模算法。之所以称为朴素贝叶斯,是因为它假设每个输入变量是独立的。这是一个强硬的假设,实际情况并不一定,但是这项技术对于绝大部分的复杂问题仍然非常有效。
3、SVM 最重要的思想是什么?
SVM 计算的过程就是帮我们找到超平面的过程,它有个核心的概念叫:分类间隔。SVM 的目标就是找出所有分类间隔中最大的那个值对应的超平面。在数学上,这是一个凸优化问题。同样我们根据数据是否线性可分,把 SVM 分成硬间隔 SVM、软间隔 SVM 和非线性 SVM。
4、K-Means 和 KNN 算法的区别是什么?
首先,这两个算法解决的是数据挖掘中的两类问题。K-Means 是聚类算法,KNN 是分类算法。其次,这两个算法分别是两种不同的学习方式。K-Means 是非监督学习,也就是不需要事先给出分类标签,而 KNN 是有监督学习,需要我们给出训练数据的分类标识。最后,K 值的含义不同。K-Means 中的 K 值代表 K 类。KNN 中的 K 值代表 K 个最接近的邻居。