Ang Azure Cloud Advocates sa Microsoft ay natutuwa na mag-alok ng isang 10-linggong, 20-leksyon na kurikulum tungkol sa Data Science. Bawat leksyon ay may kasamang pre-lesson at post-lesson quizzes, mga nakasulat na tagubilin para makumpleto ang leksyon, isang solusyon, at isang takdang-aralin. Ang aming project-based na pagtuturo ay nagpapahintulot sa iyo na matuto habang nagtatayo, isang napatunayang paraan para ang mga bagong kasanayan ay manatili.
Taos-pusong pasasalamat sa aming mga may-akda: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.
π Espesyal na pasasalamat π sa aming mga Microsoft Student Ambassador na mga may-akda, tagasuri at mga kontribyutor ng nilalaman, lalo na sina Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi
![]() |
|---|
| Data Science Para sa mga Nagsisimula - Sketchnote ni @nitya |
Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese
Mas gusto mo bang I-clone Lokal?
Kasama sa repositoryong ito ang 50+ na mga pagsasalin ng wika na lubos na nagpapalaki sa laki ng pag-download. Para mag-clone nang walang mga pagsasalin, gamitin ang sparse checkout:
Bash / macOS / Linux:
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'CMD (Windows):
git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git cd Data-Science-For-Beginners git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"Binibigyan ka nito ng lahat ng kailangan mo para makumpleto ang kurso nang mas mabilis ang pag-download.
Kung nais mong magkaroon pa ng karagdagang mga suportadong wika ng pagsasalin, nakalista ang mga ito dito
Mayroon kaming Discord learn with AI series na tumatakbo, alamin pa at sumali sa amin sa Learn with AI Series mula Setyembre 18 - 30, 2025. Makakakuha ka ng mga tips at tricks sa paggamit ng GitHub Copilot para sa Data Science.
Magsimula gamit ang mga sumusunod na resources:
- Student Hub page Sa pahinang ito, makikita mo ang mga beginner na resources, Student packs at pati na mga paraan para makakuha ng libreng certificate voucher. Isang pahina ito na nais mong i-bookmark at tingnan paminsan-minsan habang pinapalitan namin ang nilalaman kahit buwan-buwan.
- Microsoft Learn Student Ambassadors Sumali sa isang pandaigdigang komunidad ng mga student ambassador, ito ay maaaring maging iyong daan papasok sa Microsoft.
- Installation Guide - Hakbang-hakbang na gabay sa pag-set up para sa mga nagsisimula
- Usage Guide - Mga halimbawa at karaniwang workflows
- Troubleshooting - Mga solusyon sa mga karaniwang isyu
- Contributing Guide - Paano mag-ambag sa proyektong ito
- Para sa mga Guro - Gabay sa pagtuturo at mga materyales para sa klase
Mga Ganap na Nagsisimula: Bago pa sa data science? Magsimula sa aming mga example na angkop para sa mga nagsisimula! Ang mga simpleng halimbawa na ito na may malinaw na komento ay makakatulong sa iyo na maunawaan ang mga pangunahing kaalaman bago magpatuloy sa buong kurikulum. Mga Estudyante: para gamitin ang kurikulum na ito ng mag-isa, i-fork ang buong repo at tapusin ang mga exercises nang mag-isa, simula sa pre-lecture quiz. Pagkatapos basahin ang lektura at kumpletuhin ang mga natitirang gawain. Subukang likhain ang mga proyekto sa pamamagitan ng pag-unawa sa mga leksyon kaysa kopyahin ang solusyon; gayunpaman, ang code na iyon ay makukuha sa mga /solutions na folder sa bawat proyekto-orientated na leksyon. Isa pang ideya ay magbuo ng study group kasama ang mga kaibigan at pag-aralan ang nilalaman nang magkakasama. Para sa karagdagang pag-aaral, inirerekomenda namin ang Microsoft Learn.
Mabilisang Pagsisimula:
- Tingnan ang Installation Guide para i-setup ang iyong environment
- Suriin ang Usage Guide para matutunan kung paano gamitin ang kurikulum
- Simulan sa Lesson 1 at sundan nang sunod-sunod
- Sumali sa aming Discord community para sa suporta
Mga Guro: nag- include kami ng ilang mungkahi kung paano gamitin ang kurikulum na ito. Nais naming marinig ang inyong puna sa aming discussion forum!
Gif ni Mohit Jaisal
π₯ I-click ang larawan sa itaas para sa isang video tungkol sa proyekto at sa mga taong lumikha nito!
Pinili namin ang dalawang pedagogical tenets habang binubuo ang kurikulum na ito: tiyakin na ito ay proyekto-based at may kasamang madalas na pagsusulit. Sa pagtatapos ng seryeng ito, matututuhan ng mga estudyante ang mga pangunahing prinsipyo ng data science, kabilang ang mga etikal na konsepto, paghahanda ng data, iba't ibang paraan ng pagtatrabaho gamit ang data, visualisasyon ng data, pagsusuri ng data, mga totoong gamit ng data science, at iba pa.
Bilang karagdagan, ang isang mababang-stakes na pagsusulit bago ang klase ay nagtatakda ng intensiyon ng estudyante na matutunan ang isang paksa, habang ang pangalawang pagsusulit pagkatapos ng klase ay nagtitiyak ng mas malalim na pag-alala. Dinisenyo ang kurikulum na ito upang maging flexible at masaya at maaaring kunin nang buo o bahagi. Nagsisimula ang mga proyekto nang maliit at nagiging mas kumplikado sa pagtatapos ng 10 linggong siklo.
Hanapin ang aming Code of Conduct, Contributing, Translation na mga patnubay. Malugod naming tinatanggap ang inyong makabuluhang puna!
- Opsyonal na sketchnote
- Opsyonal na karagdagang video
- Pre-lesson warmup quiz
- Nakasaad na aralin
- Para sa mga proyekto-based na aralin, step-by-step na gabay kung paano buuin ang proyekto
- Knowledge checks
- Isang hamon
- Karagdagang babasahin
- Takdang-aralin
- Post-lesson quiz
Tungkol sa mga pagsusulit: Lahat ng pagsusulit ay nasa folder ng Quiz-App, para sa kabuuang 40 na pagsusulit na may tig-tatlong tanong bawat isa. Nakalink ito mula sa mga aralin, ngunit ang quiz app ay maaaring patakbuhin nang lokal o ideploy sa Azure; sundin ang mga tagubilin sa folder na
quiz-app. Unti-unti itong nililinang sa lokal na wika.
Bago sa Data Science? Nilikha namin ang isang espesyal na mga direktoryo ng halimbawa na may simpleng mga code na may malinaw na paliwanag upang tulungan kang makapagsimula:
- π Hello World - Ang iyong unang data science program
- π Loading Data - Matutong magbasa at mag-explore ng mga dataset
- π Simple Analysis - Kalkulahin ang mga estadistika at hanapin ang mga pattern
- π Basic Visualization - Gumawa ng mga tsart at grap
- π¬ Real-World Project - Kumpletong workflow mula simula hanggang katapusan
Bawat halimbawa ay may detalyadong mga komento na nagpapaliwanag sa bawat hakbang, kaya perfect ito para sa mga ganap na nagsisimula!
π Magsimula sa mga halimbawa π
![]() |
|---|
| Data Science For Beginners: Roadmap - Sketchnote ni @nitya |
| Numero ng Aralin | Paksa | Pag-grupo ng Aralin | Mga Layunin ng Pagkatuto | Nakalink na Aralin | May-Akda |
|---|---|---|---|---|---|
| 01 | Pagpapakahulugan sa Data Science | Introduction | Matutunan ang mga pangunahing konsepto sa likod ng data science at kung paano ito may kaugnayan sa artificial intelligence, machine learning, at big data. | lesson video | Dmitry |
| 02 | Etika sa Data Science | Introduction | Mga Konsepto, Hamon & Mga Framework ng Data Ethics. | lesson | Nitya |
| 03 | Pagpapakahulugan sa Data | Introduction | Paano ikinaklasipika ang data at ang mga karaniwang pinagkukunan nito. | lesson | Jasmine |
| 04 | Panimula sa Estadistika at Probability | Introduction | Mga matematikal na teknik ng probability at estadistika upang maunawaan ang data. | lesson video | Dmitry |
| 05 | Pagtatrabaho gamit ang Relational Data | Working With Data | Panimula sa relational data at mga batayan ng pag-explore at pagsusuri ng relational data gamit ang Structured Query Language, kilala rin bilang SQL (binibigkas na βsee-quellβ). | lesson | Christopher |
| 06 | Pagtatrabaho gamit ang NoSQL Data | Working With Data | Panimula sa non-relational data, iba't ibang uri nito at mga batayan ng pag-explore at pagsusuri ng mga document database. | lesson | Jasmine |
| 07 | Pagtatrabaho gamit ang Python | Working With Data | Mga batayan ng paggamit ng Python para sa pag-explore ng data gamit ang mga library gaya ng Pandas. Inirerekomenda ang pangunahing pag-unawa sa programming sa Python. | lesson video | Dmitry |
| 08 | Paghahanda ng Data | Working With Data | Mga paksa tungkol sa mga teknik sa paglilinis at pagbabago ng data upang hawakan ang mga hamon ng nawawala, mali, o hindi kumpletong data. | lesson | Jasmine |
| 09 | Pag-visualize ng mga Dami | Data Visualization | Matutunan kung paano gamitin ang Matplotlib upang i-visualize ang bird data π¦ | lesson | Jen |
| 10 | Pag-visualize ng Pamamahagi ng Data | Data Visualization | Pag-visualize ng mga obserbasyon at mga trend sa loob ng isang interval. | lesson | Jen |
| 11 | Pag-visualize ng mga Proporsyon | Data Visualization | Pag-visualize ng discrete at pinangkat na porsyento. | lesson | Jen |
| 12 | Pag-visualize ng mga Ugnayan | Data Visualization | Pag-visualize ng mga koneksyon at korelasyon sa pagitan ng mga set ng data at kanilang mga variable. | lesson | Jen |
| 13 | Makabuluhang Mga Visualization | Data Visualization | Mga teknik at gabay para gawing mahalaga ang iyong mga visualization para sa epektibong paglutas ng problema at pagkuha ng mga kaalaman. | lesson | Jen |
| 14 | Panimula sa Lifecycle ng Data Science | Lifecycle | Panimula sa lifecycle ng data science at ang unang hakbang ng pagkuha at pag-extract ng data. | lesson | Jasmine |
| 15 | Pagsusuri | Lifecycle | Ang yugto ng data science lifecycle na ito ay nakatuon sa mga teknik para suriin ang data. | lesson | Jasmine |
| 16 | Komunikasyon | Lifecycle | Ang yugto ng data science lifecycle na ito ay nakatuon sa paghahayag ng mga kaalaman mula sa data sa isang paraan upang maging mas madali para sa mga tagagawa ng desisyon na maunawaan. | lesson | Jalen |
| 17 | Data Science sa Cloud | Cloud Data | Ang serye ng mga araling ito ay nagpapakilala ng data science sa cloud at ang mga benepisyo nito. | lesson | Tiffany at Maud |
| 18 | Data Science sa Cloud | Cloud Data | Pagsasanay sa mga modelo gamit ang Low Code tools. | lesson | Tiffany at Maud |
| 19 | Data Science sa Cloud | Cloud Data | Pag-deploy ng mga modelo gamit ang Azure Machine Learning Studio. | lesson | Tiffany at Maud |
| 20 | Data Science sa Aktuwal na Mundo | In the Wild | Mga proyektong pinatatakbo ng data science sa totoong mundo. | lesson | Nitya |
Sundin ang mga hakbang na ito upang buksan ang sample na ito sa isang Codespace:
- I-click ang drop-down na menu ng Code at piliin ang Open with Codespaces na opsyon.
- Piliin ang + New codespace sa ibaba ng pane. Para sa karagdagang impormasyon, tingnan ang GitHub documentation.
Sundin ang mga hakbang na ito upang buksan ang repo na ito sa isang container gamit ang iyong lokal na makina at VSCode gamit ang VS Code Remote - Containers extension:
- Kung ito ang unang pagkakataon mong gumamit ng development container, siguraduhin na ang iyong sistema ay nakakatugon sa mga kinakailangan (i.e. naka-install ang Docker) sa getting started documentation.
Para gamitin ang repository na ito, maaari mong buksan ang repository sa isang isolated Docker volume:
Tandaan: Sa likod nito, gagamitin nito ang Remote-Containers: Clone Repository in Container Volume... command upang i-clone ang source code sa isang Docker volume sa halip na sa lokal na filesystem. Ang Volumes ang mas pinipiling mekanismo para mapanatili ang data ng container.
O buksan ang lokal na na-clone o na-download na bersyon ng repository:
- I-clone ang repository na ito sa iyong lokal na filesystem.
- Pindutin ang F1 at piliin ang Remote-Containers: Open Folder in Container... na command.
- Piliin ang kinopyang folder, hintayin ang pagsisimula ng container, at subukan.
Maaari mong patakbuhin ang dokumentasyong ito offline gamit ang Docsify. I-fork ang repo na ito, i-install ang Docsify sa iyong lokal na makina, pagkatapos ay sa root folder ng repo na ito, i-type ang docsify serve. Ang website ay ise-serve sa port 3000 sa iyong localhost: localhost:3000.
Tandaan, hindi marender ang mga notebooks via Docsify, kaya kapag kailangang patakbuhin ang notebook, gawin ito nang hiwalay sa VS Code gamit ang isang Python kernel.
Ang aming koponan ay gumagawa ng ibang kurikulum! Tingnan ang:
May mga problema ba? Tingnan ang aming Troubleshooting Guide para sa mga solusyon sa mga karaniwang problema.
Kung ikaw ay nahihirapan o may mga tanong tungkol sa paggawa ng AI apps. Sumali sa mga kapwa nag-aaral at mga bihasang developer sa mga talakayan tungkol sa MCP. Ito ay isang suportadong komunidad kung saan malugod ang mga tanong at malaya ang pagbabahagi ng kaalaman.
Kung mayroon kang feedback sa produkto o mga error habang nagde-develop, bisitahin ang:
Paunawa:
Ang dokumentong ito ay naisalin gamit ang AI translation service na Co-op Translator. Bagamat aming pinagsisikapang maging tumpak, pakatandaan na ang mga awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi pagkakatugma. Ang orihinal na dokumento sa kanyang orihinal na wika ang dapat ituring na pangunahing sanggunian. Para sa mahahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na nagmumula sa paggamit ng pagsasaling ito.



