未加星标

如何成为一个数据分析师--必备技能清单(中文版)

字体大小 | |
[大数据技术 所属分类 大数据技术 | 发布者 店小二05 | 时间 2017 | 作者 红领巾 ] 0人收藏点击收藏

因为有同学反映英文版看得太心累,所以翻译了一下,如果有任何错误,欢迎指正。英文版可以戳这里,后期可能会加上每个技能要求背后学习地址的链接。

总目录
编程
统计学
数学
机器学习
数据整理
数据可视化
数据直觉
编程
python
numpy
pandas
matplotlib
scipy
scikit-learn

R语言
ggplot2
dplyr
ggally
reshape2

可选
ipython
ipython notebook
anaconda
ggplot
seaborn
电子表格工具 (比如Excel)

额外的技能
javascript 和 HTML
D3.js
AJAX
jQuery

C/C++ 或者 Java

统计学
描述性和推理性统计
平均数,中位数,众数
数据分布
正态分布
指数/泊松
二项式分布
卡方分布

标准偏差和方差
假设检验
P-values

显著性检验
z检验, t检验, 曼-惠特尼秩和检验
卡方检验和方差分析


实验设计
A/B 测试
控制变量并选择良好的控制和测试组
采样大小和幂次现象
假设测试,测试假设
置信水平
SMART实验:具体,可衡量,可行,现实,及时

数学
将数字和概念转换为数学表达式
求解代数方程中的缺失值
线性代数和微积分
矩阵, 向量点积是理解的关键。
特征值和特征向量 - 了解这两个概念的意义
多变量导数和积分在微积分
机器学习
监督学习
决策树
朴素贝叶斯分类
普通最小二乘回法
逻辑回归
神经网络
支持向量机
集合方法

无监督学习
集群算法
主成分分析(PCA)
奇异值分解(SVD)
独立成分分析(ICA)
增强学习
Qlearning
TD-学习
增强学习


数据整理
Python
了解Python字符串库的字符串操作
解析常见的文件格式,如csv和xml文件
正则表达式
数学变换
比如,使用log-10变换将非正态分布转换为正态分布

数据库系统(基于SQL和基于SQL) - 数据库充当存储信息的中心枢纽
关系数据库,如PostgreSQL,mysql,Netezza,Oracle等。
可选:hadoop,Spark,MongoDB
SQL

交流和数据可视化
了解可视化编码并传达您希望受众从可视化中移除的内容
编程
matplotlib
ggplot
d3.js

显示数据并说服用户与您的数据
了解手头业务数据情况的背景
思考五个步骤,预测听众的的问题将会在哪里,你的观众将挑战你的假设和结论
提供(报告)预读,并在实际会议之前与感兴趣的各方进行预先协调会议


如何成为一个数据分析师--必备技能清单(中文版)
tags: 数据,学习,可视化,检验,正态分布,编程,假设,SQL,Python,卡方,向量,数学,技能,英文版
分页:12
转载请注明
本文标题:如何成为一个数据分析师--必备技能清单(中文版)
本站链接:https://www.codesec.net/view/554766.html


1.凡CodeSecTeam转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
登录后可拥有收藏文章、关注作者等权限...
技术大类 技术大类 | 大数据技术 | 评论(0) | 阅读(126)