Skip to content

Latest commit

 

History

History
261 lines (186 loc) · 34 KB

File metadata and controls

261 lines (186 loc) · 34 KB

علم داده برای مبتدیان - یک برنامه آموزشی

باز کردن در GitHub Codespaces

مجوز GitHub همکاران GitHub مسائل GitHub درخواست‌های کشش GitHub خوش‌آمدگویی به PRها

تماشاگران GitHub شاخه‌های GitHub ستاره‌های GitHub

Microsoft Foundry Discord

فروم توسعه‌دهندگان Microsoft Foundry

مدافعان ابر Azure در مایکروسافت خوشحالند یک برنامه ۱۰ هفته‌ای شامل ۲۰ درس در زمینه علم داده ارائه دهند. هر درس شامل آزمون‌های قبل و بعد از درس، دستورالعمل‌های مکتوب برای تکمیل درس، پاسخ و یک تمرین است. روش یادگیری ما بر پایه پروژه به شما اجازه می‌دهد در هنگام ساخت، یاد بگیرید که این راه اثبات شده‌ای برای تثبیت مهارت‌های جدید است.

با تشکر صمیمانه از نویسندگان ما: Jasmine Greenaway، Dmitry Soshnikov، Nitya Narasimhan، Jalen McGee، Jen Looper، Maud Levy، Tiffany Souterre، Christopher Harrison.

🙏 تشکر ویژه 🙏 از نویسندگان، بازبین‌ها و مشارکت‌کنندگان محتوا از سفیران دانشجویی مایکروسافت، به ویژه Aaryan Arora، Aditya Garg، Alondra Sanchez، Ankita Singh، Anupam Mishra، Arpita Das، ChhailBihari Dubey، Dibri Nsofor، Dishita Bhasin، Majd Safi، Max Blum، Miguel Correa، Mohamma Iftekher (Iftu) Ebne Jalal، Nawrin Tabassum، Raymond Wangsa Putra، Rohit Yadav، Samridhi Sharma، Sanya Sinha، Sheena Narula، Tauqeer Ahmad، Yogendrasingh Pawar، Vidushi Gupta، Jasleen Sondhi

کادر نقاشی توسط @sketchthedocs https://sketchthedocs.dev
علم داده برای مبتدیان - کادر نقاشی توسط @nitya

🌐 پشتیبانی چند زبان

پشتیبانی شده توسط GitHub Action (خودکار و همیشه به‌روز)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

ترجیح می‌دهید به صورت محلی کلون کنید؟

این مخزن شامل بیش از ۵۰ ترجمه زبانی است که به طور قابل توجهی حجم دانلود را افزایش می‌دهد. برای کلون کردن بدون ترجمه‌ها، از sparse checkout استفاده کنید:

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD (ویندوز):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

این به شما همه چیزهایی را می‌دهد که برای تکمیل دوره نیاز دارید با سرعت دانلود بسیار بیشتر.

اگر می‌خواهید زبان‌های ترجمه بیشتری پشتیبانی شوند، لیست آن‌ها را اینجا ببینید

به جامعه ما بپیوندید

Microsoft Foundry Discord

ما یک سری یادگیری با هوش مصنوعی در دیسکورد برگزار می‌کنیم، برای اطلاعات بیشتر و پیوستن به ما به سری یادگیری با هوش مصنوعی از ۱۸ تا ۳۰ سپتامبر ۲۰۲۵ مراجعه کنید. شما نکات و ترفندهای استفاده از GitHub Copilot برای علم داده را دریافت خواهید کرد.

سری یادگیری با هوش مصنوعی

آیا شما دانشجو هستید؟

با منابع زیر شروع کنید:

  • صفحه مرکز دانشجویان در این صفحه منابع برای مبتدیان، بسته‌های دانشجویی و حتی راه‌هایی برای دریافت کوپن رایگان گواهینامه خواهید یافت. این یکی صفحه‌ای است که می‌خواهید نشانک بزنید و هر از گاهی آن را بررسی کنید چون ما محتوای آن را حداقل ماهیانه تغییر می‌دهیم.
  • سفیران دانشجویی مایکروسافت به یک جامعه جهانی از سفرای دانشجویی بپیوندید، این می‌تواند راه شما به سمت مایکروسافت باشد.

شروع به کار

📚 مستندات

👨‍🎓 برای دانشجویان

کاملاً مبتدی: به علم داده تازه واردید؟ با نمونه‌های مناسب مبتدیان ما شروع کنید! این نمونه‌های ساده و با کامنت‌های خوب به شما کمک می‌کنند تا اصول اولیه را قبل از ورود به دوره کامل بفهمید. دانشجویان: برای استفاده از این برنامه آموزشی به صورت مستقل، کل مخزن را فورک کنید و تمرین‌ها را با آزمون پیش‌درس شروع کنید. سپس درس را بخوانید و بقیه فعالیت‌ها را تکمیل کنید. سعی کنید پروژه‌ها را با درک درس‌ها بسازید نه با کپی کردن کد راه‌حل؛ البته آن کد در پوشه /solutions در هر درس مرتبط با پروژه موجود است. ایده دیگر تشکیل یک گروه مطالعه با دوستان است و با هم از مطالب عبور کنید. برای مطالعات بیشتر، ما Microsoft Learn را توصیه می‌کنیم.

شروع سریع:

  1. راهنمای نصب را برای راه‌اندازی محیط خود بررسی کنید
  2. راهنمای استفاده را برای یادگیری کار با دوره مرور کنید
  3. با درس ۱ شروع کنید و به ترتیب پیش بروید
  4. برای پشتیبانی به جامعه دیسکورد ما بپیوندید

👩‍🏫 برای معلمان

معلمان: ما چند پیشنهاد درباره نحوه استفاده از این برنامه درسی گنجانده‌ایم. خوشحال می‌شویم بازخورد شما را در انجمن بحث ما دریافت کنیم!

معرفی تیم

ویدئو تبلیغاتی

گیف ساخته شده توسط موهیت جایسال

🎥 برای دیدن ویدئویی درباره پروژه و افرادی که آن را ایجاد کرده‌اند، روی تصویر بالا کلیک کنید!

روش تدریس

در ساخت این برنامه درسی دو اصل آموزشی را انتخاب کرده‌ایم: اطمینان از اینکه مبتنی بر پروژه است و شامل آزمون‌های مکرر می‌باشد. تا پایان این مجموعه، دانش‌آموزان اصول پایه علم داده را خواهند آموخت، از جمله مفاهیم اخلاقی، آماده‌سازی داده‌ها، روش‌های مختلف کار با داده، مصورسازی داده‌ها، تحلیل داده، کاربردهای دنیای واقعی علم داده و غیره.

علاوه بر این، آزمون ساده قبل از کلاس، نیت دانش‌آموز را برای یادگیری موضوع تنظیم می‌کند، در حالی که آزمون دوم بعد از کلاس به تثبیت بیشتر مطالب کمک می‌کند. این برنامه درسی به گونه‌ای طراحی شده که انعطاف‌پذیر و سرگرم‌کننده باشد و می‌توان آن را به طور کامل یا بخشی از آن را مطالعه کرد. پروژه‌ها از ساده شروع شده و با پایان دوره ده هفته‌ای به تدریج پیچیده‌تر می‌شوند.

می‌توانید قانون رفتار، راهنمای مشارکت، و راهنمای ترجمه ما را بیابید. بازخورد سازنده شما را خوش‌آمد می‌گوییم!

هر درس شامل موارد زیر است:

  • نکته‌نویسی اختیاری
  • ویدئوی مکمل اختیاری
  • آزمون گرم کردن پیش از درس
  • درس مکتوب
  • برای درس‌های مبتنی بر پروژه، راهنمای گام‌به‌گام ساخت پروژه
  • ارزیابی دانش
  • یک چالش
  • مطالعه مکمل
  • تمرین
  • آزمون پس از درس

یادداشتی درباره آزمون‌ها: همه آزمون‌ها در پوشه Quiz-App قرار دارند، شامل مجموعاً ۴۰ آزمون با سه سوال هر کدام. این آزمون‌ها از داخل دروس لینک شده‌اند، اما اپلیکیشن آزمون را می‌توان محلی اجرا کرد یا در Azure مستقر نمود؛ دستورالعمل در پوشه quiz-app موجود است. در حال تدریج بومی‌سازی می‌شوند.

🎓 مثال‌های مناسب مبتدیان

جدید در علم داده؟ ما یک دایرکتوری مثال ویژه ساخته‌ایم که شامل کدهای ساده و خوب کامنت‌گذاری شده برای شروع کار شماست:

  • 🌟 سلام دنیا - اولین برنامه علم داده شما
  • 📂 بارگذاری داده‌ها - یادگیری نحوه خواندن و کاوش مجموعه داده‌ها
  • 📊 تحلیل ساده - محاسبه آمار و یافتن الگوها
  • 📈 مصورسازی پایه - ایجاد نمودارها و گراف‌ها
  • 🔬 پروژه دنیای واقعی - روند کامل از شروع تا پایان

هر مثال شامل نظرات مفصل برای توضیح هر مرحله است که آن را برای مبتدیان مطلق ایده‌آل می‌کند!

👉 شروع با مثال‌ها 👈

دروس

نکته‌نویسی توسط @sketchthedocs https://sketchthedocs.dev
نقشه راه علم داده برای مبتدیان - نکته‌نویسی توسط @nitya
شماره درس موضوع گروه‌بندی درس اهداف یادگیری درس مرتبط نویسنده
۰۱ تعریف علم داده مقدمه آشنایی با مفاهیم پایه علم داده و ارتباط آن با هوش مصنوعی، یادگیری ماشین و کلان داده. درس ویدئو دیمیتری
۰۲ اخلاقیات علم داده مقدمه مفاهیم اخلاق داده، چالش‌ها و چارچوب‌ها. درس نیتیا
۰۳ تعریف داده مقدمه نحوه طبقه‌بندی داده و منابع رایج آن. درس یاسمین
۰۴ مقدمه‌ای بر آمار و احتمال مقدمه استفاده از فنون ریاضی احتمال و آمار برای درک داده‌ها. درس ویدئو دیمیتری
۰۵ کار با داده‌های رابطه‌ای کار با داده‌ها معرفی داده‌های رابطه‌ای و اصول کاوش و تحلیل داده‌های رابطه‌ای با زبان ساختاری پرس و جو که به اختصار SQL گفته می‌شود. درس کریستوفر
۰۶ کار با داده‌های NoSQL کار با داده‌ها معرفی داده‌های غیر رابطه‌ای، انواع مختلف آن و اصول کاوش و تحلیل پایگاه‌های داده سند محور. درس یاسمین
۰۷ کار با پایتون کار با داده‌ها اصول استفاده از پایتون برای کاوش داده‌ها با کتابخانه‌هایی مانند Pandas. داشتن دانش پایه برنامه‌نویسی پایتون توصیه می‌شود. درس ویدئو دیمیتری
۰۸ آماده‌سازی داده‌ها کار با داده‌ها موضوعات مربوط به تکنیک‌های داده برای پاک‌سازی و تبدیل داده‌ها به منظور مقابله با مشکلات داده‌های گمشده، نادرست یا ناقص. درس یاسمین
۰۹ مصورسازی مقادیر مصورسازی داده یادگیری استفاده از Matplotlib برای مصورسازی داده‌های پرندگان 🦆 درس جن
۱۰ مصورسازی توزیع داده‌ها مصورسازی داده مصورسازی مشاهدات و روندها در بازه‌ای مشخص. درس جن
۱۱ مصورسازی نسبت‌ها مصورسازی داده مصورسازی درصدهای گسسته و گروه‌بندی شده. درس جن
۱۲ مصورسازی روابط مصورسازی داده مصورسازی ارتباطات و همبستگی بین مجموعه داده‌ها و متغیرهای آنها. درس جن
۱۳ مصورسازی‌های معنادار مصورسازی داده تکنیک‌ها و راهنمایی برای ساخت مصورسازی‌های ارزشمند برای حل موثر مسئله و کسب بینش. درس جن
۱۴ مقدمه‌ای بر چرخه عمر علم داده چرخه عمر معرفی چرخه عمر علم داده و اولین مرحله آن یعنی کسب و استخراج داده. درس یاسمین
۱۵ تحلیل داده‌ها چرخه عمر این مرحله از چرخه عمر علم داده بر فنون تحلیل داده تمرکز دارد. درس یاسمین
۱۶ ارتباطات چرخه عمر این مرحله از چرخه عمر علم داده بر ارائه بینش‌های داده به گونه‌ای که برای تصمیم‌گیرندگان قابل فهم‌تر باشد، متمرکز است. درس جالن
۱۷ علم داده در فضای ابری داده‌های ابری این سری دروس، علم داده در فضای ابری و مزایای آن را معرفی می‌کند. درس تیفانی و ماد
۱۸ علم داده در فضای ابری داده‌های ابری آموزش مدل‌ها با استفاده از ابزارهای کد کم. درس تیفانی و ماد
۱۹ علم داده در فضای ابری داده‌های ابری استقرار مدل‌ها با Azure Machine Learning Studio. درس تیفانی و ماد
۲۰ علم داده در دنیای واقعی در دنیای واقعی پروژه‌های مبتنی بر علم داده در دنیای واقعی. درس نیتیا

کد‌اسپیس‌های گیت‌هاب

برای باز کردن این نمونه در یک کد‌اسپیس گیت‌هاب مراحل زیر را دنبال کنید: ۱. منوی کشویی Code را کلیک کرده و گزینه Open with Codespaces را انتخاب کنید. ۲. در پایین صفحه گزینه + New codespace را انتخاب کنید. برای اطلاعات بیشتر، به مستندات گیت‌هاب مراجعه کنید.

VSCode Remote - Containers

برای باز کردن این مخزن در یک کانتینر با استفاده از ماشین محلی و VSCode با افزونه VS Code Remote - Containers:

۱. اگر برای اولین بار از کانتینر توسعه استفاده می‌کنید، مطمئن شوید سیستم شما پیش‌نیازها را دارد (مثلاً Docker نصب شده باشد) در مستندات شروع به کار.

برای استفاده از این مخزن، می‌توانید یا مخزن را در یک حجم جداشده Docker باز کنید:

نکته: در پشت صحنه، این به کمک دستور Remote-Containers: Clone Repository in Container Volume... کد منبع را در یک حجم Docker به جای فایل سیستم محلی کلون می‌کند. حجم‌ها مکانیزم ترجیحی برای حفظ داده‌های کانتینر هستند.

یا نسخه کلون شده یا دانلود شده مخزن را باز کنید:

  • این مخزن را روی فایل سیستم محلی کپی کنید.
  • کلید F1 را فشار دهید و دستور Remote-Containers: Open Folder in Container... را انتخاب کنید.
  • نسخه کپی شده این پوشه را انتخاب کنید، منتظر بمانید تا کانتینر شروع به کار کند و امتحان کنید.

دسترسی آفلاین

می‌توانید این مستندات را به صورت آفلاین با استفاده از Docsify اجرا کنید. این مخزن را فورک کنید، Docsify را نصب کنید روی ماشین محلی خود، سپس در پوشه ریشه این مخزن، دستور docsify serve را وارد کنید. وبسایت روی پورت ۳۰۰۰ در لوکال‌هاست: localhost:3000 سرو خواهد شد.

توجه داشته باشید، دفترچه‌ها (نوت‌بوک‌ها) توسط Docsify رندر نخواهند شد، بنابراین وقتی نیاز به اجرای نوت‌بوک دارید، آن را جداگانه در VS Code با کرنل پایتون اجرا کنید.

برنامه‌های درسی دیگر

تیم ما برنامه‌های درسی دیگری نیز تولید می‌کند! بررسی کنید:

LangChain

LangChain4j برای مبتدیان LangChain.js برای مبتدی‌ها LangChain برای مبتدی‌ها

Azure / Edge / MCP / عامل‌ها

AZD برای مبتدی‌ها Edge AI برای مبتدی‌ها MCP برای مبتدی‌ها عامل‌های هوش مصنوعی برای مبتدی‌ها


مجموعه هوش مصنوعی مولد

هوش مصنوعی مولد برای مبتدی‌ها هوش مصنوعی مولد (.NET) هوش مصنوعی مولد (جاوا) هوش مصنوعی مولد (جاوااسکریپت)


یادگیری اصلی

یادگیری ماشین برای مبتدی‌ها علم داده برای مبتدی‌ها هوش مصنوعی برای مبتدی‌ها امنیت سایبری برای مبتدی‌ها توسعه وب برای مبتدی‌ها اینترنت اشیاء برای مبتدی‌ها توسعه XR برای مبتدی‌ها


مجموعه کاپیلوت

کاپیلوت برای برنامه‌نویسی جفتی هوش مصنوعی کاپیلوت برای C#/.NET ماجراجویی کاپیلوت

دریافت کمک

با مشکلات مواجه شده‌اید؟ راهنمای عیب‌یابی ما را برای راه حل‌های مشکلات رایج بررسی کنید.

اگر گیر کرده‌اید یا سوالی درباره ساخت برنامه‌های هوش مصنوعی دارید، به جمع یادگیرندگان و توسعه‌دهندگان مجرب در بحث‌های MCP بپیوندید. این یک جامعه حمایتی است که سوالات خوش‌آمد گفته می‌شوند و دانش به‌صورت آزادانه به اشتراک گذاشته می‌شود.

دیسکورد Microsoft Foundry

اگر بازخورد محصول یا خطایی هنگام ساخت دارید به:

انجمن توسعه‌دهندگان Microsoft Foundry مراجعه کنید.


سلب مسئولیت:
این سند با استفاده از سرویس ترجمه ماشینی Co-op Translator ترجمه شده است. در حالی که ما برای دقت تلاش می‌کنیم، لطفاً توجه داشته باشید که ترجمه‌های خودکار ممکن است حاوی اشتباهات یا نواقصی باشند. سند اصلی به زبان بومی خود باید منبع معتبر تلقی شود. برای اطلاعات حیاتی، ترجمه حرفه‌ای انسانی توصیه می‌شود. ما مسئول هیچ گونه سوتفاهم یا برداشت نادرست ناشی از استفاده از این ترجمه نیستیم.