Skip to content

Latest commit

 

History

History
263 lines (186 loc) · 30.5 KB

File metadata and controls

263 lines (186 loc) · 30.5 KB

データサイエンス入門 - カリキュラム

GitHub Codespacesで開く

GitHub ライセンス GitHub コントリビューター GitHub イシュー GitHub プルリクエスト PRs歓迎

GitHub ウォッチャー GitHub フォーク GitHubスター

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

MicrosoftのAzure Cloud Advocatesは、データサイエンスに関する10週間、全20レッスンのカリキュラムを提供します。各レッスンには、レッスン前とレッスン後のクイズ、レッスン完了のための文書化された手順、解答例、課題が含まれています。プロジェクトベースの教育法により、実際に作りながら学習できるため、新しいスキルが「定着」することが証明されています。

著者の皆様へ心より感謝いたします: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 特に感謝します 🙏 Microsoft Student Ambassador の著者、レビューアー、コンテンツ提供者の皆様へ、 具体的には Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

@sketchthedocsによるスケッチノート https://sketchthedocs.dev
データサイエンス入門 - @nityaによるスケッチノート

🌐 多言語サポート

GitHub Actionsによるサポート(自動&常に最新)

アラビア語 | ベンガル語 | ブルガリア語 | ビルマ語(ミャンマー) | 中国語(簡体字) | 中国語(繁体字、香港) | 中国語(繁体字、マカオ) | 中国語(繁体字、台湾) | クロアチア語 | チェコ語 | デンマーク語 | オランダ語 | エストニア語 | フィンランド語 | フランス語 | ドイツ語 | ギリシャ語 | ヘブライ語 | ヒンディー語 | ハンガリー語 | インドネシア語 | イタリア語 | 日本語 | カンナダ語 | クメール語 | 韓国語 | リトアニア語 | マレー語 | マラヤーラム語 | マラーティー語 | ネパール語 | ナイジェリア・ピジン語 | ノルウェー語 | ペルシャ語(ファルシー) | ポーランド語 | ポルトガル語(ブラジル) | ポルトガル語(ポルトガル) | パンジャブ語(グルムキー) | ルーマニア語 | ロシア語 | セルビア語(キリル) | スロバキア語 | スロベニア語 | スペイン語 | スワヒリ語 | スウェーデン語 | タガログ語(フィリピン) | タミル語 | テルグ語 | タイ語 | トルコ語 | ウクライナ語 | ウルドゥー語 | ベトナム語

ローカルにクローンしますか?

このリポジトリには50以上の言語翻訳が含まれており、ダウンロードサイズが大きくなります。翻訳なしでクローンするには、スパースチェックアウトを使用してください。

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD(Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

これにより、コースを完了するのに必要なすべてがはるかに高速にダウンロードできます。

追加の翻訳言語を希望される場合は、こちら に掲載されています。

コミュニティへ参加しよう

Microsoft Foundry Discord

Discordでの「AIと学ぶシリーズ」を現在開催中です。詳細と参加はこちら Learn with AI Series、開催期間は2025年9月18日〜30日です。GitHub Copilotを活用したデータサイエンスのヒントやコツを学べます。

Learn with AI series

学生ですか?

以下のリソースから始めましょう:

  • Student Hubページ このページには初心者向けのリソースや学生パック、無料認定バウチャーを獲得する方法まであります。最低でも月に一度は内容が更新されるので、ブックマークして時々チェックしましょう。
  • Microsoft Learn Student Ambassadors グローバルな学生大使コミュニティに参加できます。Microsoftへの近道になるかもしれません。

はじめに

📚 ドキュメント

👨‍🎓 学生向け

完全な初心者の方へ:データサイエンスが初めて?まずは初心者向けの例から始めてみましょう!これらのシンプルでコメント付きの例が基礎理解の助けとなり、その後カリキュラム全体に進む前の準備になります。 学生の皆さん:このカリキュラムを自分で利用する場合はリポジトリ全体をフォークし、レッスン前クイズから始めて自習してください。その後、講義を読み残りの課題を完了しましょう。解答コードは各プロジェクト型レッスンの/solutionsフォルダーにありますが、解答を写すのではなくレッスンを理解して作成することを心がけてください。友人とスタディグループを作って一緒に進めるのも良い方法です。さらなる学習にはMicrosoft Learnを推奨します。

クイックスタート:

  1. インストールガイドを確認して環境を構築する
  2. 使用ガイドをレビューしてカリキュラムの使い方を理解する
  3. レッスン1から順番に進める
  4. サポートのためにDiscordコミュニティに参加する

👩‍🏫 教師向け

先生方へ: このカリキュラムの活用方法についていくつかの提案を含めています。ぜひディスカッションフォーラムでご意見をお聞かせください!

チームの紹介

プロモーションビデオ

GIF制作: Mohit Jaisal

🎥 上の画像をクリックすると、本プロジェクトとそれを作ったメンバーについてのビデオが見られます!

教育方針

このカリキュラムを作成するにあたり、プロジェクトベースであることと頻繁なクイズを取り入れることの二つの教育原則を選びました。このシリーズの終わりには、学生は倫理的概念、データ準備、データの扱い方の多様性、データ可視化、データ分析、実世界におけるデータサイエンスの活用例など、データサイエンスの基本原則を学んでいるでしょう。

さらに、授業前の軽いクイズは学生の学習への意欲を設定し、授業後の二回目のクイズが理解の定着を助けます。このカリキュラムは柔軟で楽しく、全体でも一部でも受講可能です。プロジェクトは小規模から始まり、10週間のサイクルの終わりには徐々に複雑になります。

行動規範貢献ガイドライン翻訳ガイドラインをご覧ください。建設的なフィードバックを歓迎します!

各レッスンには以下が含まれます:

  • オプションのスケッチノート
  • オプションの補足動画
  • 授業前のウォームアップクイズ
  • 文章によるレッスン内容
  • プロジェクトベースのレッスンの場合、プロジェクトの作成手順ガイド
  • 知識チェック
  • チャレンジ
  • 補足読書資料
  • 課題
  • 授業後のクイズ

クイズに関する注意: 全てのクイズはQuiz-Appフォルダー内にあり、計40回分、各3問のクイズがあります。レッスン内からリンクされていますが、クイズアプリはローカルで実行するかAzureにデプロイできます。quiz-appフォルダー内の説明に従ってください。順次ローカライズも進めています。

🎓 初心者に優しい例題

データサイエンス初心者ですか? シンプルでコメントが充実したコードをまとめた特別なexamplesディレクトリを作成しました。これで学び始めましょう:

  • 🌟 Hello World - はじめてのデータサイエンスプログラム
  • 📂 データの読み込み - データセットを読み込み、探索する方法
  • 📊 簡単な分析 - 統計を計算し、パターンを見つける
  • 📈 基本的な可視化 - チャートやグラフの作成
  • 🔬 実世界のプロジェクト - 初めから終わりまでの完全なワークフロー

どの例もステップごとに詳細なコメント付きで、完全な初心者にぴったり!

👉 例題から始める 👈

レッスン一覧

 @sketchthedocsによるスケッチノート https://sketchthedocs.dev
Data Science For Beginners: Roadmap - @nityaによるスケッチノート
レッスン番号 トピック レッスングループ 学習目標 関連レッスン 著者
01 データサイエンスの定義 イントロダクション データサイエンスの基本概念と、それが人工知能、機械学習、ビッグデータとどのように関連しているかを学ぶ。 レッスン ビデオ Dmitry
02 データサイエンス倫理 イントロダクション データ倫理の概念、課題およびフレームワーク。 レッスン Nitya
03 データの定義 イントロダクション データの分類法と一般的なデータソースについて。 レッスン Jasmine
04 統計と確率の入門 イントロダクション データを理解するための確率と統計の数学的手法。 レッスン ビデオ Dmitry
05 リレーショナルデータの操作 データ操作 リレーショナルデータの紹介と、構造化クエリ言語(SQL、発音は「シークェル」)を用いたリレーショナルデータの基本的な探索と分析方法。 レッスン Christopher
06 NoSQLデータの操作 データ操作 非リレーショナルデータの紹介、各種タイプ、ドキュメントデータベースの基本的な探索と分析方法。 レッスン Jasmine
07 Pythonの基礎:データ操作 データ操作 Pandasなどのライブラリを用いたデータ探索のためのPythonの基礎。Pythonプログラミングの基礎知識が推奨されます。 レッスン ビデオ Dmitry
08 データ準備 データ操作 欠損、不正確、または不完全なデータの課題を扱うためのデータクレンジングと変換の技術。 レッスン Jasmine
09 量の可視化 データ可視化 Matplotlibを使って鳥のデータを可視化する方法 🦆 レッスン Jen
10 データ分布の可視化 データ可視化 観測値やトレンドを区間内で視覚化する方法。 レッスン Jen
11 比率の可視化 データ可視化 離散的およびグループ化されたパーセンテージの可視化。 レッスン Jen
12 関係性の可視化 データ可視化 データセットと変数間のつながりや相関の可視化。 レッスン Jen
13 有意義な可視化 データ可視化 問題解決と洞察に役立つ価値ある可視化の技術とガイダンス。 レッスン Jen
14 データサイエンスのライフサイクル入門 ライフサイクル データサイエンスのライフサイクルと、データの収集および抽出に関する最初のステップの紹介。 レッスン Jasmine
15 データ分析 ライフサイクル データサイエンスライフサイクルのこのフェーズはデータ分析の技術に焦点を当てる。 レッスン Jasmine
16 コミュニケーション ライフサイクル データから得た知見を意思決定者に理解しやすく提示するフェーズ。 レッスン Jalen
17 クラウドにおけるデータサイエンス クラウドデータ クラウドにおけるデータサイエンスの紹介とその利点。 レッスン TiffanyMaud
18 クラウドにおけるデータサイエンス クラウドデータ ローコードツールを用いたモデルのトレーニング。 レッスン TiffanyMaud
19 クラウドにおけるデータサイエンス クラウドデータ Azure Machine Learning Studioによるモデルのデプロイ。 レッスン TiffanyMaud
20 実世界におけるデータサイエンス 実世界 現実世界でのデータサイエンス駆動のプロジェクト。 レッスン Nitya

GitHub Codespaces

このサンプルをCodespaceで開く手順:

  1. Codeのドロップダウンメニューをクリックし、Open with Codespacesを選択。
  2. パネル下部の+ New codespaceを選択。 詳細はGitHubドキュメントを参照。

VSCode Remote - Containers

ローカルマシンとVSCodeのVS Code Remote - Containers拡張機能を使ってこのリポジトリをコンテナ内で開く手順:

  1. 開発コンテナを初めて使う場合は、Getting Started ドキュメントの前提条件(例:Dockerがインストールされていること)を確認してください。

このリポジトリを使うには、隔離されたDockerボリューム内でリポジトリを開く方法があります:

注意: 内部的には、Remote-ContainersのClone Repository in Container Volume...コマンドを使い、ソースコードをローカルファイルシステムではなくDockerボリュームにクローンします。ボリュームはコンテナデータの永続化に推奨される仕組みです。

または、ローカルにクローンまたはダウンロードしたリポジトリを使うことも可能です:

  • このリポジトリをローカルファイルシステムにクローン。
  • F1キーを押し、Remote-Containers: Open Folder in Container... コマンドを選択。
  • クローンしたフォルダを選択し、コンテナが起動するのを待って、操作を試してください。

オフラインアクセス

Docsifyを使ってオフラインでこのドキュメントを閲覧できます。このリポジトリをフォークし、ローカルにDocsifyをインストールの上、ルートフォルダで docsify serve と入力すると、ローカルホストのポート3000でサイトが起動します:localhost:3000

注意:ノートブックはDocsifyではレンダリングされないため、ノートブックを実行するにはVS CodeのPythonカーネルを使って別途行ってください。

その他のカリキュラム

私たちのチームは他のカリキュラムも制作しています。ぜひご覧ください:

LangChain

LangChain4j for Beginners LangChain.js for Beginners LangChain for Beginners

Azure / Edge / MCP / Agents

AZD for Beginners Edge AI for Beginners MCP for Beginners AI Agents for Beginners


ジェネレーティブAIシリーズ

Generative AI for Beginners Generative AI (.NET) Generative AI (Java) Generative AI (JavaScript)


コアラーニング

ML for Beginners Data Science for Beginners AI for Beginners Cybersecurity for Beginners Web Dev for Beginners IoT for Beginners XR Development for Beginners


Copilotシリーズ

Copilot for AI Paired Programming Copilot for C#/.NET Copilot Adventure

ヘルプを得る

問題が発生しましたか? よくある問題の解決策についてはトラブルシューティングガイドを確認してください。

AIアプリの構築で行き詰まったり質問がある場合は、仲間の学習者や経験豊富な開発者とMCPに関するディスカッションに参加してください。質問が歓迎され、知識が自由に共有される支援的なコミュニティです。

Microsoft Foundry Discord

製品のフィードバックやビルド中のエラーがあれば以下を訪問してください:

Microsoft Foundry Developer Forum


免責事項:
本書類はAI翻訳サービス Co-op Translator を使用して翻訳されています。正確性を期していますが、自動翻訳には誤りや不正確な部分が含まれる可能性があることをご承知おきください。オリジナルの文書はその原言語での内容が正式な情報源とみなされるべきです。重要な情報については、専門の人間による翻訳を推奨します。本翻訳の使用により生じたいかなる誤解や誤訳についても当方は責任を負いかねます。