Skip to content

Latest commit

 

History

History
106 lines (70 loc) · 21.6 KB

File metadata and controls

106 lines (70 loc) · 21.6 KB

អធិប្បាយអំពីវិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក

 Sketchnote by (@sketchthedocs)
វិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក៖ អធិប្បាយ - Sketchnote ដោយ @nitya

នៅក្នុងមេរៀននេះ អ្នកនឹងរៀនពីក្រុមការណ៍មូលដ្ឋាននៃពពក បន្ទាប់មកអ្នកនឹងឃើញថាហេតុអ្វីបានជាវាមានចំណាប់អារម្មណ៍សម្រាប់អ្នកក្នុងការប្រើប្រាស់សេវាកម្មពពកដើម្បីដំណើរការគម្រោងវិទ្យាសាស្រ្តទិន្នន័យរបស់អ្នក ហើយយើងនឹងមើលឧទាហរណ៍ខ្លះនៃគម្រោងវិទ្យាសាស្រ្តទិន្នន័យដែលដំណើរការនៅក្នុងពពក។

តើពពកគឺជាអ្វី?

ពពក ឬ ការគណនាក្នុងពពក គឺជាការផ្ដល់សេវាកម្មគណនាដែលបង់ប្រាក់​តាមការប្រើប្រាស់ ដែលត្រូវបានផ្ដល់ជូននៅលើមហាអ៊ីនធឺណិតជាមួយហេដ្ឋារចនាសម្ព័ន្ធមួយ។ សេវាកម្មរួមមានដូចជា ដំណោះស្រាយទុកស្តុកទិន្នន័យ, មូលដ្ឋានទិន្នន័យ, បណ្ដាញ, សូហ្វវែរ, វិភាគ និងសេវាកម្មខាងបញ្ញា។

យើងភាគច្រើនបំបែកពពកឲ្យទៅជា ពពកសាធារណៈ, ពពកឯកជន និងពពកតម្រង់ដូចខាងក្រោម៖

  • ពពកសាធារណៈ: ពពកសាធារណៈគឺជាដែលមានកម្មសិទ្ធិ និងគ្រប់គ្រងដោយអ្នកផ្ដល់សេវាកម្មពពកភាគីទីបី ដែលផ្ដល់ធនធានគណនារបស់ខ្លួនតាមអ៊ីនធឺណិតទៅសាធារណៈ
  • ពពកឯកជន: មានន័យថាធនធានគណនាក្នុងពពកដែលប្រើប្រាស់ដោយអង្គការឬអាជីវកម្មតែម្នាក់ឯង មានសេវាកម្ម និងហេដ្ឋារចនាសម្ព័ន្ធត្រូវបានគ្រប់គ្រងលើបណ្ដាញឯកជន
  • ពពកតម្រង់: ពពកតម្រង់គឺជាប្រព័ន្ធដែលបញ្ចូលពពកសាធារណៈ និងឯកជន។ អ្នកប្រើប្រាស់ជ្រើសរើសមជ្ឈមណ្ឌលទិន្នន័យនៅក្នុងកន្លែងដែលមាន ប៉ុន្តែអនុញ្ញាតឲ្យទិន្នន័យ និងកម្មវិធីដំណើរការទៅលើពពកសាធារណៈមួយឬច្រើន។

សេវាកម្មគណនាក្នុងពពកភាគច្រើនចែកចេញជាបីប្រភេទ៖ ហេដ្ឋារចនាសម្ព័ន្ធជាសេវាកម្ម (IaaS), វេទិកាជាសេវាកម្ម (PaaS) និងសូហ្វវែរជាសេវាកម្ម (SaaS)។

  • ហេដ្ឋារចនាសម្ព័ន្ធជាសេវាកម្ម (IaaS): អ្នកប្រើជួលហេដ្ឋារចនាសម្ព័ន្ធ IT ដូចជាម៉ាស៊ីនបម្រើ និងម៉ាស៊ីនវឺឌួល (VMs), ទុកស្តុក, បណ្ដាញ, ប្រព័ន្ធប្រតិបត្តិការ
  • វេទិកាជាសេវាកម្ម (PaaS): អ្នកប្រើជួលបរិយាកាសសម្រាប់អភិវឌ្ឍ, សាកល្បង, ចែកចាយ និងគ្រប់គ្រងកម្មវិធីសូហ្វវែរ។ អ្នកប្រើមិនចាំបាច់ការព្រួយបារម្ភអំពីការដំឡើង ឬគ្រប់គ្រងហេដ្ឋារចនាសម្ព័ន្ធរបស់ម៉ាស៊ីនបម្រើ ទុកស្តុក បណ្ដាញ និងមូលដ្ឋានទិន្នន័យដែលទាមទារសម្រាប់ការអភិវឌ្ឍន៍ឡើយ
  • សូហ្វវែរជាសេវាកម្ម (SaaS): អ្នកប្រើទទួលបានការចូលប្រើកម្មវិធីសូហ្វវែរ តាមអ៊ីនធឺណិត ពេលដែលត្រូវការនិងភាគច្រើននៅលើមូលដ្ឋានជាសមាជិកជាប្រចាំ។ អ្នកប្រើមិនចាំបាច់បារម្ភអំពីការផ្ទុក និងគ្រប់គ្រងកម្មវិធីសូហ្វវែរ ហេដ្ឋារចនាសម្ព័ន្ធគាំទ្រ ឬការថែទាំ ដូចជាការអាប់ដេតកម្មវិធី និងការជួសជុលសុវត្ថិភាពឡើយ។

អ្នកផ្ដល់សេវាកម្មពពកធំនៅលើទីផ្សារមួយចំនួនគឺ包括Amazon Web Services, Google Cloud Platform និង Microsoft Azure

ហេតុអ្វីជ្រើសរើសពពកសម្រាប់វិទ្យាសាស្រ្តទិន្នន័យ?

អ្នកអភិវឌ្ឍន៍ និងអ្នកជំនាញ IT ជ្រើសរើសធ្វើការជាមួយពពកដោយហេតុផលជាច្រើន រួមមាន៖

  • នវានុវត្តន៍៖ អ្នកអាចបង្កើតកម្មវិធីរបស់អ្នកដោយបញ្ចូលសេវាកម្មនវានុវត្តន៍ដែលបានបង្កើតឡើងដោយអ្នកផ្ដល់សេវាកម្មពពកដោយផ្ទាល់ទៅក្នុងកម្មវិធីរបស់អ្នក
  • ភាពបត់បែន៖ អ្នកបង់ប្រាក់សម្រាប់សេវាកម្មដែលអ្នកត្រូវការតែប៉ុណ្ណោះ ហើយអាចជ្រើសរើសពីសេវាកម្មជាច្រើន។ ភាគច្រើនអ្នកបង់តាមការប្រើប្រាស់ និងអាចធ្វើការប្រែប្រួលសេវាកម្មឲ្យសមរម្យទៅនឹងតម្រូវការដែលកំពុងអភិវឌ្ឍ
  • ថវិកា៖ អ្នកមិនចាំបាច់វិនិយោគដំបូង ទិញរឹង និងសូហ្វវែរ ដំឡើង និងដំណើរការមជ្ឈមណ្ឌលទិន្នន័យក្នុងតំបន់ និងអ្នកអាចបង់ប្រាក់ទាំងអស់សម្រាប់អ្វីដែលអ្នកប្រើប្រាស់បានតែប៉ុណ្ណោះ
  • ភាពសមរម្យក្នុងការលាយលំចិត្តនិងពង្រីក៖ ធនធានរបស់អ្នកអាចលាយឡំតាមតម្រូវការនៃគម្រោង ដែលមានន័យថាកម្មវិធីរបស់អ្នកអាចប្រើប្រាស់ថាមពលគណនាឬទុកស្តុក និងថាមពលបណ្តាញលើស ឬតិច ដោយតាមពេលវេលា និងបរិបទក្រៅ
  • ផលិតភាព៖ អ្នកអាចផ្ដោតលើអាជីវកម្មរបស់អ្នកជាងចំណាយពេលលើភារកិច្ចដែលអ្នកផ្សេងអាចគ្រប់គ្រងបាន ដូចជា ការគ្រប់គ្រងមជ្ឈមណ្ឌលទិន្នន័យ
  • ការជឿជាក់៖ ការគណនាក្នុងពពកផ្ដល់វិធីសាស្រ្តជាច្រើនក្នុងការបម្រុងទុកទិន្នន័យរបស់អ្នកជាបន្តបន្ទាប់ ហើយអ្នកអាចរៀបចំផែនការផ្ទៃព្រួតរងគ្រោះដើម្បីរក្សាអាជីវកម្ម និងសេវាកម្មរបស់អ្នក ដើម្បីបន្តដំណើរការនៅពេលមានវិបត្តិ
  • សុវត្ថិភាព៖ អ្នកអាចទទួលបានអត្ថប្រយោជន៍ពីគោលនយោបាយ បច្ចេកវិទ្យា និងតុល្យភាពដែលពង្រឹងសុវត្ថិភាពគម្រោងរបស់អ្នក

នេះជាហេតុផលទូទៅមួយចំនួនដែលមនុស្សជ្រើសរើសប្រើសេវាកម្មពពក។ ឥឡូវនេះពេលយើងមានការយល់ដឹងល្អជាងមុនអំពីអ្វីដែលពពកជានិងអត្ថប្រយោជន៍សំខាន់របស់វា ពេលនេះយើងនឹងមើលឲ្យច្បាស់ល្អចំពោះការងាររបស់អ្នកវិទ្យាសាស្រ្តទិន្នន័យ និងអ្នកអភិវឌ្ឍន៍ធ្វើការជាមួយទិន្នន័យ ហើយតើពពកអាចជួយពួកគេទៅជាមួយបញ្ហាជាច្រើនដែលពួកគេប្រឈមមុខ៖

  • ការផ្ទុកទិន្នន័យច្រើន៖ ជៀសវាងការទិញ គ្រប់គ្រង និងការពារម៉ាស៊ីនបម្រើធំនានា អ្នកអាចផ្ទុកទិន្នន័យរបស់អ្នកដោយផ្ទាល់នៅក្នុងពពក ជាមួយដំណោះស្រាយដូចជា Azure Cosmos DB, Azure SQL Database និង Azure Data Lake Storage។
  • ការប្រតិបត្តិការសមាសភាពទិន្នន័យ៖ ការសមាសភាពទិន្នន័យគឺជាផ្នែកសំខាន់នៃវិទ្យាសាស្រ្តទិន្នន័យ ដែលអនុញ្ញាតឲ្យអ្នកធ្វើបម្លែងចេញពីការប្រមូលទិន្នន័យទៅការប្រឹងប្រែងអង្គការសកម្ម។ ជាមួយសេវាកម្មសមាសភាពទិន្នន័យដែលផ្ដល់នៅក្នុងពពក អ្នកអាចប្រមូល បម្លែង និងសមាសភាពទិន្នន័យពីប្រភពផ្សេងៗចូលទៅក្នុងឃ្លាំងទិន្នន័យតែមួយ ជាមួយ Data Factory។
  • ការដំណើរការទិន្នន័យ៖ ការដំណើរការទិន្នន័យច្រើនទាមទារថាមពលគណនាច្រើន ហើយមនុស្សមិនម្នាក់ណាមានព្រលឹងគ្រឿងចក្រ ដែលមានថាមពលគ្រប់គ្រាន់សម្រាប់ការប្រតិបត្តិ នេះហើយជាហេតុផលដែលមនុស្សជាច្រើនជ្រើសរើសប្រើប្រាស់ថាមពលគណនាធំបំផុតក្នុងពពកជាផ្ទាល់ដើម្បីដំណើរការ និងចែកចាយដំណោះស្រាយរបស់ពួកគេ។
  • ការប្រើប្រាស់សេវាកម្មវិភាគទិន្នន័យ៖ សេវាកម្មពពកដូចជា Azure Synapse Analytics, Azure Stream Analytics និង Azure Databricks ជួយអ្នកបំលែងទិន្នន័យរបស់អ្នកទៅជាជំនាញដែលអាចអនុវត្តបាន។
  • ការប្រើប្រាស់សេវាកម្មរៀនម៉ាស៊ីន និងបញ្ញាទិន្នន័យ៖ ជំនួសចាប់ផ្តើមពីសូន្យ អ្នកអាចប្រើប៉ូឡិចម៉ាស៊ីនរៀនដែលផ្ដល់ដោយអ្នកផ្ដល់សេវាកម្មពពក ជាមួយសេវាកម្មដូចជា AzureML។ អ្នកក៏អាចប្រើសេវាកម្មបញ្ញាដូចជា ពាក្យនិយាយទៅជាអត្ថបទ អត្ថបទទៅជាពាក្យនិយាយ ការមើលឃើញកុំព្យូទ័រនិងផ្សេងៗទៀត។

ឧទាហរណ៍នៃវិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក

មកធ្វើឲ្យវាច្បាស់ឡើងដោយមើលឧទាហរណ៍ពីករណីពីរបី៕

វិភាគអារម្មណ៍បណ្ដាញសង្គមជាប្រព័ន្ធពេលវេលាពិតប្រាកដ

យើងនឹងចាប់ផ្តើមជាមួយករណីដែលមនុស្សភាគច្រើនសិក្សានៅពេលចាប់ផ្តើមរៀនលើម៉ាស៊ីនរៀន៖ វិភាគអារម្មណ៍បណ្ដាញសង្គមក្នុងពេលវេលាពិតប្រាកដ។

សន្ដិសុខថាអ្នកដំណើរការរបាយការណ៍ព័ត៌មានមួយ ហើយអ្នកចង់ប្រើទិន្នន័យផ្ទាល់នៅក្នុងលេីកដើម្បីយល់អំពីមាតិកាដែលអ្នកអានអាចមានចំណាប់អារម្មណ៍។ ដើម្បីដឹងពីអ្វីនេះ អ្នកអាចបង្កើតកម្មវិធីមួយដែលអនុវត្តវិភាគអារម្មណ៍បណ្ដាញសង្គមនៅពេលវេលាពិតប្រាកដពីការបង្ហោះ Twitter ពីប្រធានបទដែលពាក់ព័ន្ធទៅអ្នកអាន។

សញ្ញាចំបើងដែលអ្នកនឹងមើលគឺ បរិមាណសារTweetលើប្រធានបទជាក់លាក់ (hashtags) និងអារម្មណ៍ ដែលកំណត់ដោយការប្រើប្រាស់ឧបករណ៍វិភាគដែលអនុវត្តវិភាគអារម្មណ៍នៅជុំវិញប្រធានបទដែលបានកំណត់។

ជំហានដែលចាំបាច់សម្រាប់បង្កើតគម្រោងនេះមានដូចជា៖

  • បង្កើត event hub សម្រាប់ស្ទ្រីមទិន្នន័យដែលនឹងប្រមូលទិន្នន័យពី Twitter
  • ការកំណត់រចនាសម្ព័ន្ធ និងចាប់ផ្តើមកម្មវិធី Twitter client ដែលនឹងហៅ Twitter Streaming APIs
  • បង្កើត Stream Analytics job
  • កំណត់ការបញ្ចូលការងារ និងស្នើសុំ
  • បង្កើត output sink និងកំណត់ការចេញការងារ
  • ចាប់ផ្តើមការងារ

ដើម្បីមើលដំណើរការទាំងមូល សូមមើលនៅ ឯកសារ

វិភាគអត្ថបទវិទ្យាសាស្ត្រ

សូមយកឧទាហរណ៍មួយទៀតពីគម្រោងដែលបង្កើតដោយ Dmitry Soshnikov មួយក្នុងចំណោមអ្នកនិពន្ធនៃមេរៀននេះ។

Dmitry បានបង្កើតឧបករណ៍ដែលវិភាគឯកសារទាក់ទងជាមួយ COVID។ ដោយពិនិត្យការគម្រោងនេះ អ្នកនឹងមើលឃើញនូវរបៀបដែលអ្នកអាចបង្កើតឧបករណ៍ដកស្រង់ចំណេះដឹងពីអត្ថបទវិទ្យាសាស្ត្រ ទទួលបានចំណេះដឹង និងជួយស្រាវជ្រាវស្វែងរកតាមទិសដៅក្នុងការប្រមូលផ្តុំអត្ថបទច្រើនដោយមានប្រសិទ្ធភាព។

មកមើលជំហាននានា​ដែលបានប្រើសម្រាប់នេះ៖

  • ដកស្រង់ និងអង្គភាពព័ត៌មានជាមុនជាមួយ Text Analytics for Health
  • ប្រើ Azure ML ដើម្បីដំណើរការជា​បួស
  • ទុកស្តុក និងស្នើសុំព័ត៌មានជាមួយ Cosmos DB
  • បង្កើតផ្ទាំងបង្ហាញទិន្នន័យអន្តរប្រតិបត្តិសម្រាប់ការស្វែងរកទិន្នន័យ និងការតំណាងទិន្នន័យប្រើ Power BI

ដើម្បីឃើញដំណើរការទាំងមូល សូមទៅកាន់ ប្លុករបស់ Dmitry

ដូចដែលអ្នកឃើញ យើងអាចប្រើប្រាស់សេវាកម្មពពកដោយមានវិធីជាច្រើនដើម្បីអនុវត្តវិទ្យាសាស្រ្តទិន្នន័យ។

ចំណាំចុងក្រោយ

ប្រភព៖

ប្រលងបន្ទាប់ពីមេរៀន

កិច្ចការផ្ទះ

Market Research


ការបដិសេធ
ឯកសារនេះត្រូវបានបកប្រែដោយប្រើសេវាកម្ម​បកប្រែ AI Co-op Translator។ ទោះយើងខិតខំប្រឹងប្រែងដើម្បីភាពត្រឹមត្រូវ សូមយល់ឱ្យបានច្បាស់ថាការបកប្រែដោយស្វ័យប្រវត្តិអាចមានកំហុស ឬមិនត្រឹមត្រូវ។ ឯកសារដើមដែលមានភាសាមាតុភូមិគួរត្រូវបានគេចាត់ទុកជាឯកសារដែលមានសិទ្ធិលើព័ត៌មានច្បាស់លាស់។ សម្រាប់ព័ត៌មានសំខាន់ៗ សូមណែនាំការបកប្រែដោយអ្នកជំនាញមនុស្សវិជ្ជាជីវៈ។ យើងមិនទទួលខុសត្រូវចំពោះការយល់ច្រឡំ ឬការបកស្រាយខុសប្លែកណាមួយដែលកើតឡើងចេញពីការប្រើប្រាស់ការបកប្រែនេះទេ។