Skip to content

Latest commit

 

History

History
263 lines (186 loc) · 28.1 KB

File metadata and controls

263 lines (186 loc) · 28.1 KB

Duomenų mokslas pradedantiesiems – mokymo programa

Atidaryti GitHub Codespaces

GitHub licencija GitHub autorių skaičius GitHub problemos GitHub pull requestai PRs Laukiami

GitHub stebėtojai GitHub forkinimai GitHub žvaigždutės

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

„Microsoft“ Azure Cloud advokatai džiaugiasi galėdami pasiūlyti 10 savaičių, 20 pamokų mokymo programą, skirtą Duomenų mokslo temai. Kiekviena pamoka apima prieš pamoką ir po pamokos testus, rašytines instrukcijas pamokai atlikti, sprendimą ir užduotį. Mūsų projektiniu pagrindu grindžiamas mokymosi metodas leidžia mokytis kurti iš karto – tai patikrintas būdas, kaip nauji įgūdžiai „įsitvirtina“.

Išskirtinis dėkingumas mūsų autoriams: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 Specialus ačiū 🙏 mūsų „Microsoft Student Ambassador“ autoriams, recenzentams ir turinio prisidėjusiems, ypač Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

Sketchnote by @sketchthedocs https://sketchthedocs.dev
Duomenų mokslas pradedantiesiems – Sketchnote parengė @nitya

🌐 Daugiakalbė parama

Palaikoma per GitHub Action (automatiškai ir visada atnaujinama)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

Norite klonuoti vietoje?

Šiame saugykloje yra daugiau nei 50 kalbų vertimų, dėl ko žymiai padidėja atsisiuntimo dydis. Norėdami klonuoti be vertimų, naudokite sparsų atsisiuntimą:

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD (Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

Tai suteikia viską, ko reikia kursui užbaigti, su daug greitesniu atsisiuntimu.

Jei norite palaikyti papildomas vertimo kalbas, jos yra išvardytos čia

Prisijunkite prie mūsų bendruomenės

Microsoft Foundry Discord

Vyksta Discord paskaitų serija „Mokykimės su dirbtiniu intelektu“, sužinokite daugiau ir prisijunkite prie mūsų mokymosi su DI serijos nuo 2025 m. rugsėjo 18 iki 30 d. Jūs gausite patarimų ir gudrybių, kaip naudoti GitHub Copilot duomenų moksle.

Learn with AI series

Ar esate studentas?

Pradėkite nuo šių išteklių:

  • Studentų centras Šiame puslapyje rasite pradedančiųjų išteklius, studentų paketus ir net galimybes gauti nemokamą sertifikato kuponą. Tai puslapis, kurį verta užsirašyti ir reguliariai patikrinti, nes turinys atnaujinamas bent kartą per mėnesį.
  • Microsoft Learn Student Ambassadors Prisijunkite prie pasaulinės studentų ambasadorių bendruomenės, tai gali būti jūsų kelias į Microsoft.

Pradžia

📚 Dokumentacija

👨‍🎓 Studentams

Pilni pradedantieji: Nauji duomenų moksle? Pradėkite nuo mūsų pradedančiųjų pavyzdžių! Šie paprasti, gerai paaiškinti pavyzdžiai padės suprasti pagrindus prieš imantis visos programos. Studentai: norėdami naudotis programa savarankiškai, galite suforkinti visą saugyklą ir savarankiškai atlikti pratimus, pradėdami nuo testuko prieš paskaitą. Tada perskaitykite paskaitą ir atlikite likusias veiklas. Stenkitės kurti projektus suprasdami pamokas, o ne kopijuodami sprendimų kodą; tačiau tas kodas yra prieinamas /solutions aplankuose kiekvienoje projekto pamokoje. Kita idėja – sukurti mokymosi grupę su draugais ir kartu peržiūrėti medžiagą. Tolimesniam mokymuisi rekomenduojame Microsoft Learn.

Greitas pradžios planas:

  1. Peržiūrėkite Įdiegimo vadovą, kad sukonfigūruotumėte aplinką
  2. Susipažinkite su Naudojimo vadovu, kad sužinotumėte, kaip dirbti su programa
  3. Pradėkite nuo 1-os pamokos ir dirbkite nuosekliai
  4. Prisijunkite prie mūsų Discord bendruomenės pagalbai

👩‍🏫 Mokytojams

Mokytojams: mes įtraukėme keletą pasiūlymų, kaip naudoti šią mokymo programą. Laukiame jūsų atsiliepimų mūsų diskusijų forume!

Susipažinkite su komanda

Reklaminis vaizdo įrašas

GIF sukūrė Mohit Jaisal

🎥 Spustelėkite aukščiau esantį vaizdą, kad peržiūrėtumėte vaizdo įrašą apie projektą ir žmones, kurie jį sukūrė!

Pedagogika

Kurdami šią mokymo programą pasirinkome du pedagoginius principus: užtikrinti, kad ji būtų paremta projektais ir apimtų dažnus testus. Baigus šią seriją studentai išmoks pagrindines duomenų mokslo taisykles, įskaitant etikos koncepcijas, duomenų paruošimą, skirtingus duomenų apdorojimo būdus, duomenų vizualizaciją, duomenų analizę, realius duomenų mokslo panaudojimo atvejus ir daugiau.

Be to, prieš paskaitą rengiamas mažos svarbos testas skatina mokinių norą mokytis temą, o antras testas po paskaitos užtikrina geresnį įsisavinimą. Ši mokymo programa sukurta būti lanksti ir įdomi, ją galima atlikti visą arba atskiras dalis. Projektai prasideda nuo mažesnių ir palaipsniui tampa sudėtingesni per 10 savaičių ciklą.

Raskite mūsų Elgesio kodeksą, Prisidėjimo gaires, Vertimo gaires. Laukiame jūsų konstruktyvių atsiliepimų!

Kiekviena pamoka apima:

  • Pasirenkamą eskizą
  • Pasirenkamą papildomą vaizdo įrašą
  • Apšilimo testą prieš pamoką
  • Rašytinę pamoką
  • Projektais pagrįstose pamokose – žingsnis po žingsnio instrukcijas, kaip sukurti projektą
  • Žinių tikrinimą
  • Iššūkį
  • Papildomą literatūrą
  • Užduotį
  • Testą po pamokos

Pastaba apie testus: visi testai yra Quiz-App aplanke, iš viso 40 testų po tris klausimus. Jie susieti pamokose, bet testų programėlę galima paleisti vietoje arba įdiegti į Azure; vykdykite nurodymus quiz-app aplanke. Jie palaipsniui yra lokalizuojami.

🎓 Pavyzdžiai pradedantiesiems

Naujas duomenų mokslui? Sukūrėme specialų pavyzdžių katalogą su paprastu, gerai komentuotu kodu, padedančiu pradėti:

  • 🌟 Hello World – Jūsų pirmoji duomenų mokslo programa
  • 📂 Duomenų įkėlimas – Išmokite skaityti ir tyrinėti duomenų rinkinius
  • 📊 Paprasta analizė – Apskaičiuokite statistinius duomenis ir raskite dėsningumus
  • 📈 Pagrindinė vizualizacija – Kurkite diagramas ir grafikus
  • 🔬 Realus projektas – Pilnas darbo procesas nuo pradžios iki pabaigos

Kiekviename pavyzdyje pateikti išsamūs komentarai paaiškina kiekvieną žingsnį – tai puiku visiškiems pradedantiesiems!

👉 Pradėkite nuo pavyzdžių 👈

Pamokos

Eskizas sukurtas @sketchthedocs https://sketchthedocs.dev
Duomenų mokslas pradedantiesiems: kelio žemėlapis - Eskizas sukurtas @nitya
Pamokos numeris Tema Pamokos grupė Mokymosi tikslai Susieta pamoka Autorius
01 Duomenų mokslo apibrėžimas Įvadas Sužinokite pagrindines duomenų mokslo sąvokas ir kaip jis susijęs su dirbtiniu intelektu, mašininio mokymosi bei didžiųjų duomenų apdorojimu. pamoka vaizdo įrašas Dmitrijus
02 Duomenų mokslo etika Įvadas Duomenų etikos sąvokos, iššūkiai ir pagrindai. pamoka Nitya
03 Duomenų apibrėžimas Įvadas Kaip klasifikuojami duomenys ir jų įprasti šaltiniai. pamoka Jasmine
04 Įvadas į statistiką ir tikimybes Įvadas Matematiniai tikimybių ir statistikos metodai duomenims suprasti. pamoka vaizdo įrašas Dmitrijus
05 Darbas su reliaciniais duomenimis Darbas su duomenimis Įvadas į reliacinius duomenis ir pagrindai, kaip tyrinėti bei analizuoti reliacinius duomenis naudojant struktūrinės užklausų kalbą, dar vadinamą SQL (ištariama „es-ki-u-el“). pamoka Christopher
06 Darbas su NoSQL duomenimis Darbas su duomenimis Įvadas į nereliacinius duomenis, jų įvairias rūšis ir pagrindus, kaip tyrinėti ir analizuoti dokumentų duomenų bazes. pamoka Jasmine
07 Darbas su Python Darbas su duomenimis Python naudojimo duomenų tyrimui pagrindai su bibliotekomis, tokiomis kaip Pandas. Rekomenduojama turėti pagrindines Python programavimo žinias. pamoka vaizdo įrašas Dmitrijus
08 Duomenų paruošimas Darbas su duomenimis Duomenų valymo ir transformavimo technikos, skirtos spręsti trūkstamų, netikslių ar nebaigtų duomenų problemas. pamoka Jasmine
09 Kiekybių vizualizavimas Duomenų vizualizacija Išmokite naudoti Matplotlib, kad vizualizuotumėte paukščių duomenis 🦆 pamoka Jen
10 Duomenų pasiskirstymo vizualizavimas Duomenų vizualizacija Duomenų stebėjimų ir tendencijų vizualizavimas intervale. pamoka Jen
11 Proporcijų vizualizavimas Duomenų vizualizacija Diskrečių ir grupuotų procentų vizualizavimas. pamoka Jen
12 Ryšių vizualizavimas Duomenų vizualizacija Ryšių ir koreliacijų tarp duomenų rinkinių bei jų kintamųjų vizualizavimas. pamoka Jen
13 Prasmingos vizualizacijos Duomenų vizualizacija Technikos ir patarimai, kaip padaryti vizualizacijas vertingas efektyviam problemų sprendimui ir įžvalgoms. pamoka Jen
14 Įvadas į duomenų mokslo gyvavimo ciklą Gyvavimo ciklas Įvadas į duomenų mokslo gyvavimo ciklą ir jo pirmąjį žingsnį – duomenų gavimą ir išgavimą. pamoka Jasmine
15 Duomenų analizė Gyvavimo ciklas Ši duomenų mokslo gyvavimo ciklo dalis orientuota į duomenų analizės technikas. pamoka Jasmine
16 Komunikacija Gyvavimo ciklas Ši duomenų mokslo gyvavimo ciklo dalis orientuota į rezultatų iš duomenų pateikimą taip, kad sprendimų priėmėjams būtų aiškiau suprasti. pamoka Jalen
17 Duomenų mokslas debesyje Debesų duomenys Šių pamokų serija pristato duomenų mokslą debesyje ir jo privalumus. pamoka Tiffany ir Maud
18 Duomenų mokslas debesyje Debesų duomenys Modelių mokymas naudojant Low Code įrankius. pamoka Tiffany ir Maud
19 Duomenų mokslas debesyje Debesų duomenys Modelių diegimas naudojant Azure Machine Learning Studio. pamoka Tiffany ir Maud
20 Duomenų mokslas gamtoje Gamtoje Duomenų mokslo projektai realiame pasaulyje. pamoka Nitya

GitHub Codespaces

Vadovaukitės šiomis instrukcijomis, kaip atidaryti šį pavyzdį Codespace aplinkoje:

  1. Spustelėkite Code išskleidžiamąjį meniu ir pasirinkite Open with Codespaces parinktį.
  2. Apačioje pasirinkite + New codespace. Daugiau informacijos rasite GitHub dokumentacijoje.

VSCode Nuotolinė - konteineriai

Vadovaukitės šiomis instrukcijomis, kaip atidaryti šį saugyklą konteineryje, naudodami savo kompiuterį ir VSCode su VS Code Remote - Containers plėtiniu:

  1. Jei tai pirmas kartas, kai naudojate plėtros konteinerį, įsitikinkite, kad jūsų sistema atitinka reikalavimus (pvz., įdiegta Docker) pagal pradžios gaires.

Norėdami naudoti šią saugyklą, galite atidaryti ją izoliuotame Docker tūryje:

Pastaba: Iš esmės tai naudos Remote-Containers: Clone Repository in Container Volume... komandą, kad šaltinio kodas būtų nukopijuotas į Docker tūrį, o ne vietinę failų sistemą. Tūriai yra pageidaujama duomenų konteineryje išlaikymo priemonė.

Arba atidarykite vietoje nuklonuotą arba parsisiųstą saugyklos kopiją:

  • Nuklonuokite šią saugyklą į vietinę failų sistemą.
  • Paspauskite F1 ir pasirinkite komandą Remote-Containers: Open Folder in Container....
  • Pasirinkite šios aplanko nuklonuotą kopiją, palaukite, kol konteineris paleis, ir išbandykite.

Offline prieiga

Galite naudoti šią dokumentaciją neprisijungę naudodami Docsify. Nuklonuokite šią saugyklą, įdiekite Docsify savo kompiuteryje, tada paleiskite docsify serve šios saugyklos šakninėje aplankoje. Svetainė bus pasiekiama per 3000 prievadą localhost:3000.

Pastaba: užrašų knygelės (notebooks) nebus atvaizduojamos Docsify, todėl jei reikia paleisti užrašų knygelę, atlikite tai atskirai VS Code su Python branduoliu.

Kitos mokymo programos

Mūsų komanda kuria ir kitas mokymo programas! Patikrinkite:

LangChain

LangChain4j pradedantiesiems LangChain.js pradedantiesiems LangChain pradedantiesiems

Azure / Edge / MCP / Agentai

AZD pradedantiesiems Edge AI pradedantiesiems MCP pradedantiesiems AI agentai pradedantiesiems


Generatyvusis DI serija

Generatyvusis DI pradedantiesiems Generatyvusis DI (.NET) Generatyvusis DI (Java) Generatyvusis DI (JavaScript)


Pagrindinis mokymasis

ML pradedantiesiems Duomenų mokslas pradedantiesiems DI pradedantiesiems Kibernetinis saugumas pradedantiesiems Tinklalapių kūrimas pradedantiesiems Daiktų internetas pradedantiesiems XR kūrimas pradedantiesiems


Copilot serija

Copilot DI porinė programavimas Copilot C#/.NET Copilot nuotykiai

Pagalbos gavimas

Susiduriate su problemomis? Peržiūrėkite mūsų Trikčių šalinimo vadovą sprendimams rasti dažniausiai pasitaikančias problemas.

Jei užstrigote ar turite klausimų apie DI programėlių kūrimą. Prisijunkite prie mokymosi bendruomenės ir patyrusių kūrėjų diskusijų apie MCP. Tai palaikanti bendruomenė, kurioje klausimai laukiami, o žinios dalijamasi laisvai.

Microsoft Foundry Discord

Jei turite produkto atsiliepimų ar klaidų derindami apsilankykite:

Microsoft Foundry Developer Forum


Atsakomybės apribojimas:
Šis dokumentas buvo išverstas naudojant DI vertimo paslaugą Co-op Translator. Nors stengiamės užtikrinti tikslumą, prašome atkreipti dėmesį, kad automatiniai vertimai gali turėti klaidų ar netikslumų. Originalus dokumentas jo gimtąja kalba turėtų būti laikomas patikimiausiu šaltiniu. Svarbiai informacijai rekomenduojama naudoti profesionalų žmonių vertimą. Mes neprisiimame atsakomybės už nesusipratimus ar neteisingus aiškinimus, kilusius dėl šio vertimo naudojimo.