本文重点列出了很多与核心技能相关的的优秀学习资源。
1
数据工程入门
《数据工程入门指南》(第1部分):
《数据工程入门指南》(第2部分):
《数据工程入门指南》(第3部分):
2
基本语言要求:Python
在Scratch平台上使用Python学习数据科学的完整教程:
使用Python的数据科学导论:
Codeacademy上学习Python课程:
Allen Downey的《思考Python》:
Python 3的非程序员教程:
3
操作系统知识
Linux服务器管理和安全:
CS401-操作系统:
Raspberry Pi平台和Raspberry Pi的python编程:
4
数据库知识-SQL和NoSQL
免费学习SQL:
快速查找SQL命令的备忘录:
MYSQL教程:
学习Microsoft SQL Server:
PostgreSQL教程:
Oracle Live SQL:
NoSQL数据库
MongoDB来自MongoDB:
MongoDB简介:
学习Cassandra:
Redis Enterprise:
Google Bigtable:
Couchbase:
5
Hadoop、Hive、Pig、Spark、Kafka...
Hadoop基础知识:
Hadoop入门包:
HortonWorks教程:
MapReduce简介:
Hadoop超越了传统的MapReduce-简版:
《Hadoop详解》:
《Hadoop-你应该了解的》:
《使用MapReduce进行数据密集型文本处理》:
Hadoop LinkedIn小组:
Apache Spark、RDD和Dataframes(使用PySpark)的综合指南:
初学者学习Spark R的详细指南:
Spark的基础知识:
ApacheSpark和AWS简介:
涵盖Hadoop、Spark、Hive和Spark SQL的综合教程
大数据基础知识-HDF、MapReduce和Spark RDD:
大数据分析-Hive、Spark SQL、DataFrames 和GraphFrames:
大数据应用-实时流:
使用Apache Kafka简化数据管道:
Kafka官方文档:
用Kafka给数据科学家赋能:
6
基本的机器学习知识
学习机器学习基础知识的新手指南:
机器学习算法基本知识:
新手必读的机器学习和人工智能书籍:
提升你知识和技能的24个终极数据科学项目: