微软 Azure 云推广团队很高兴推出一个为期 10 周、共 20 课的完整数据科学课程。每节课包含课前和课后测验、完成课程的书面说明、解决方案以及作业。我们的项目驱动教学法让你在构建项目的过程中学习,这是帮助新技能“落地”的有效方法。
衷心感谢我们的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison。
🙏 特别感谢 🙏 我们的 Microsoft 学生大使作者、审稿人及内容贡献者, 尤其是 Aaryan Arora、Aditya Garg、Alondra Sanchez、Ankita Singh、Anupam Mishra、Arpita Das、ChhailBihari Dubey、Dibri Nsofor、Dishita Bhasin、Majd Safi、Max Blum、Miguel Correa、Mohamma Iftekher (Iftu) Ebne Jalal、Nawrin Tabassum、Raymond Wangsa Putra、Rohit Yadav、Samridhi Sharma、Sanya Sinha, Sheena Narula、Tauqeer Ahmad、Yogendrasingh Pawar 、Vidushi Gupta、Jasleen Sondhi
![]() |
|---|
| 初学者数据科学 - 手绘笔记由 @nitya |
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
想要本地克隆?
本库包含超过 50 种语言的翻译,显著增加了下载大小。若想不包含翻译文件可使用稀疏检出:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD (Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"这样你可以更快下载,获得完成课程所需的全部内容。
如需支持更多语言,查看此处支持列表:here
我们正在举办 Discord 上的“与 AI 一起学习”系列,时间为 2025 年 9 月 18 日至 30 日。了解详情并加入请见与 AI 一起学习系列。你将获得使用 GitHub Copilot 进行数据科学的技巧和窍门。
请使用以下资源开始:
- 学生中心页面 在此页面你能找到初学者资源、学生包甚至获得免费认证券的方式。我们会至少每月更新内容,建议收藏并定期查看。
- Microsoft Learn 学生大使 加入全球学生大使社区,这可能是你进入微软的机会。
完全零基础:数据科学新人?请先看我们的初学者示例!这些简单且注释详尽的示例能帮助你了解基础知识,再深入全套课程。 学生:若想自行使用本课程,请 fork 整个仓库并独立完成练习,从课前测验开始。阅读课程内容并完成剩余活动。尽量理解课程后自行构建项目,而非直接复制解决方案代码;不过每个项目导向课程的 /solutions 文件夹都有参考代码。你也可以和朋友组建学习小组一起学习。想深入学习,推荐访问 Microsoft Learn。
快速开始:
- 查看安装指南,配置环境
- 研读使用指导,了解课程操作流程
- 从第一课开始,按顺序学习
- 加入我们的Discord 社区获得支持
动图作者 Mohit Jaisal
🎥 点击上方图片观看项目和创作者介绍视频!
我们在构建本课程时选择了两个教学原则:确保课程以项目为基础,并且包含频繁的测验。在本系列课程结束时,学生将掌握数据科学的基本原理,包括伦理概念、数据准备、处理数据的不同方法、数据可视化、数据分析、数据科学的实际应用案例等等。
此外,课前的低风险测验可以帮助学生确立学习主题的意向,而课后的第二次测验则有助于进一步巩固知识。本课程设计灵活且有趣,可整体学习也可部分学习。项目从简单开始,随着10周周期的推进逐渐变得复杂。
- 可选的草图笔记
- 可选的补充视频
- 课前热身测验
- 书面课程内容
- 针对项目型课程的逐步项目构建指导
- 知识检查
- 挑战任务
- 补充阅读
- 作业
- 课后测验
关于测验的说明:所有测验都包含在 Quiz-App 文件夹中,共40个测验,每个测验包含3个问题。它们在课程中有链接,但测验应用可在本地运行或部署到 Azure;请按照
quiz-app文件夹中的说明操作。测验正在逐步实现本地化。
刚开始学数据科学? 我们创建了一个专门的示例目录,其中包含简单且注释详细的代码,帮助您入门:
- 🌟 Hello World - 你的第一个数据科学程序
- 📂 加载数据 - 学习读取和探索数据集
- 📊 简单分析 - 计算统计数据并发现模式
- 📈 基础可视化 - 创建图表和曲线图
- 🔬 真实项目 - 从头到尾完成完整工作流程
每个示例都包含详细注释,解释每一步骤,非常适合绝对初学者!
👉 从示例开始 👈
![]() |
|---|
| 数据科学初学者路线图 - 草图笔记作者 @nitya |
| 课程编号 | 主题 | 课程分组 | 学习目标 | 相关课程 | 作者 |
|---|---|---|---|---|---|
| 01 | 定义数据科学 | 介绍 | 了解数据科学的基本概念及其与人工智能、机器学习和大数据的关系。 | 课程 视频 | Dmitry |
| 02 | 数据科学伦理 | 介绍 | 数据伦理的概念、挑战及框架。 | 课程 | Nitya |
| 03 | 定义数据 | 介绍 | 数据的分类及常见来源。 | 课程 | Jasmine |
| 04 | 统计学和概率入门 | 介绍 | 运用概率与统计的数学方法理解数据。 | 课程 视频 | Dmitry |
| 05 | 使用关系型数据 | 数据操作 | 介绍关系型数据,及使用结构化查询语言(SQL,发音为“see-quell”)进行数据探索和分析的基础知识。 | 课程 | Christopher |
| 06 | 使用 NoSQL 数据 | 数据操作 | 介绍非关系型数据及其不同类型,以及对文档数据库进行探索和分析的基础知识。 | 课程 | Jasmine |
| 07 | 使用 Python | 数据操作 | 使用 Python 和 Pandas 等库进行数据探索的基础。建议具备 Python 编程基础。 | 课程 视频 | Dmitry |
| 08 | 数据准备 | 数据操作 | 数据清洗和转换技术,处理缺失、不准确或不完整数据的挑战。 | 课程 | Jasmine |
| 09 | 数量可视化 | 数据可视化 | 学习如何用 Matplotlib 可视化鸟类数据 🦆 | 课程 | Jen |
| 10 | 数据分布可视化 | 数据可视化 | 可视化区间内的观察值和趋势。 | 课程 | Jen |
| 11 | 比例可视化 | 数据可视化 | 可视化离散及分组百分比数据。 | 课程 | Jen |
| 12 | 关系可视化 | 数据可视化 | 可视化数据集及其变量之间的联系和相关性。 | 课程 | Jen |
| 13 | 有意义的可视化 | 数据可视化 | 制作有价值的可视化,帮助有效地解决问题和获得洞察的技巧与指导。 | 课程 | Jen |
| 14 | 数据科学生命周期简介 | 生命周期 | 介绍数据科学生命周期及其第一步——获取和提取数据。 | 课程 | Jasmine |
| 15 | 分析 | 生命周期 | 关注数据科学生命周期中分析数据的技术。 | 课程 | Jasmine |
| 16 | 交流 | 生命周期 | 关注数据科学生命周期中以便于决策者理解的方式呈现数据洞察的阶段。 | 课程 | Jalen |
| 17 | 云端数据科学 | 云端数据 | 本系列课程介绍云端数据科学及其优势。 | 课程 | Tiffany 和 Maud |
| 18 | 云端数据科学 | 云端数据 | 使用低代码工具训练模型。 | 课程 | Tiffany 和 Maud |
| 19 | 云端数据科学 | 云端数据 | 使用 Azure Machine Learning Studio 部署模型。 | 课程 | Tiffany 和 Maud |
| 20 | 实际应用中的数据科学 | 实践 | 数据科学驱动的真实世界项目。 | 课程 | Nitya |
按照以下步骤在 Codespace 中打开此示例:
- 点击 Code 下拉菜单,选择 “Open with Codespaces” 选项。
- 在面板底部选择 “+ New codespace”。 更多信息请查看GitHub 文档。
按以下步骤使用您的本地计算机和 VSCode 通过 VS Code Remote - Containers 扩展在容器中打开此仓库:
- 如果这是您首次使用开发容器,请确保您的系统满足前置要求(例如已安装 Docker),详情见快速入门文档。
使用此仓库,您可以选择在隔离的 Docker 卷中打开仓库:
注意:此操作实际上会使用 Remote-Containers 的 Clone Repository in Container Volume... 命令,将源码克隆到 Docker 卷中而非本地文件系统。卷 是持久化容器数据的推荐机制。
或者打开本地克隆或下载的仓库版本:
- 将仓库克隆到本地文件系统。
- 按 F1 并选择 Remote-Containers: Open Folder in Container... 命令。
- 选择克隆的文件夹,等待容器启动,然后开始使用。
您可以使用 Docsify 离线运行文档。先 Fork 此仓库,安装 Docsify 到本地,然后在仓库根目录输入 docsify serve。网站将通过本地端口 3000 提供服务:localhost:3000。
注意,笔记本文件不会通过 Docsify 渲染,因此需要运行笔记本时,请单独在 VS Code 中使用 Python 内核运行。
我们的团队还制作了其他课程!敬请查看:
遇到问题? 请查阅我们的故障排除指南,获取常见问题的解决方案。
如果您遇到困难或对构建 AI 应用有任何疑问,请加入其他学习者和经验丰富的开发者一起讨论 MCP。这是一个支持性的社区,欢迎提问且知识自由共享。
如果您在构建过程中有产品反馈或遇到错误,请访问:
免责声明:
本文档通过 AI 翻译服务 Co-op Translator 进行翻译。虽然我们力求准确,但请注意自动翻译可能包含错误或不准确之处。应以原始语言版本的文档为权威来源。对于重要信息,建议使用专业人工翻译。我们不对因使用本翻译而产生的任何误解或误释承担责任。



