数据分析师

手机号

验证码

30天自动登录

数据分析师

今年数据分析师需要的技能

来源:CPDA数据分析师网 / 时间:2021-05-07

从分析中得到您想要的-很明显
从Web抓取工作发布中收集的见解与实际上需要的数据科学技能没有提供的关联,但是这很好地表明了您应该更侧重于哪些常规技能,并且同样会偏离这些常规技能,话虽如此,我希望您喜欢它,让我们深入研究它!为了进行此分析,在尝试抓取时遇到了Captcha问题。

检查以查看我搜索的每个术语包含多少个职位发布
我在搜索的术语列表如下(如果您想了解其他技能,请在评论中提及,以便我可以将其添加到下一年的分析中!):

Python,SQL,R,Java,Git,C,MATLAB,Excel,C ++,JavaScript,C#,Julia,Scala,SAS
Scikit学习,熊猫,NumPy,SciPy
Matplotlib,Looker,Tableau
TensorFlow,PyTorch,Keras
Spark,Hadoop,AWS,GCP,Hive,Azure,Google Cloud,MongoDB,BigQuery
Docker,Kubernetes,Airflow
NoSQL,MySQL,PostgreSQL
Caffe,Alteryx,Perl,Cassandra,Linux

从每个来源获得计数后,将其求和然后将其除以数据科学家职位的总数即可得出一个百分比,例如Python的值为0.77意味着77%的职位发布中都包含Python,我将结果与2019年所做的分析进行了比较,以得出2019年至2021年的百分比变化。

支持您应该了解Python或R以及SQL的事实
从Python开始可能会坚持使用Python,就开源贡献而言,它到目前为止是遥遥领先的,而且很容易学习。 无论您是数据科学家,数据工程师,数据分析师,业务分析师,SQL无疑是在任何类型的与数据相关的行业中学习的重要技能。

顶级Python库
TensorFlow排名,因为它是的深度学习Python库之一。PyTorch是一个有力的选择,因此其排名也不太落后。

Scikit-learn可以说是Python中用于机器学习的重要的库,在使用Pandas和/或NumPy清理并处理了数据之后,scikit-learn用于构建机器学习模型,因为它具有用于预测建模和分析的大量工具。

Pandas,NumPy和SciPy对于数据科学家来说也是必不可少的,尽管它们在上面具有代表性。

快的成长和衰落技能
1、与云相关的技能(例如AWS和GCP)有了巨大的增长。
2、同样,与深度学习相关的技能也大量增加,例如PyTorch和TensorFlow。
3、SQL和Python的重要性继续增长,而R则停滞不前。

4、Hadoop,Hive和Spark等Apache产品的重要性持续下降。



返回列表