អធិប្បាយអំពីវិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក


វិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក៖ អធិប្បាយ - Sketchnote ដោយ @nitya

នៅក្នុងមេរៀននេះ អ្នកនឹងរៀនពីក្រុមការណ៍មូលដ្ឋាននៃពពក បន្ទាប់មកអ្នកនឹងឃើញថាហេតុអ្វីបានជាវាមានចំណាប់អារម្មណ៍សម្រាប់អ្នកក្នុងការប្រើប្រាស់សេវាកម្មពពកដើម្បីដំណើរការគម្រោងវិទ្យាសាស្រ្តទិន្នន័យរបស់អ្នក ហើយយើងនឹងមើលឧទាហរណ៍ខ្លះនៃគម្រោងវិទ្យាសាស្រ្តទិន្នន័យដែលដំណើរការនៅក្នុងពពក។

ប្រលងមុនមេរៀន

តើពពកគឺជាអ្វី?

ពពក ឬ ការគណនាក្នុងពពក គឺជាការផ្ដល់សេវាកម្មគណនាដែលបង់ប្រាក់តាមការប្រើប្រាស់ ដែលត្រូវបានផ្ដល់ជូននៅលើមហាអ៊ីនធឺណិតជាមួយហេដ្ឋារចនាសម្ព័ន្ធមួយ។ សេវាកម្មរួមមានដូចជា ដំណោះស្រាយទុកស្តុកទិន្នន័យ, មូលដ្ឋានទិន្នន័យ, បណ្ដាញ, សូហ្វវែរ, វិភាគ និងសេវាកម្មខាងបញ្ញា។

យើងភាគច្រើនបំបែកពពកឲ្យទៅជា ពពកសាធារណៈ, ពពកឯកជន និងពពកតម្រង់ដូចខាងក្រោម៖

ពពកសាធារណៈ: ពពកសាធារណៈគឺជាដែលមានកម្មសិទ្ធិ និងគ្រប់គ្រងដោយអ្នកផ្ដល់សេវាកម្មពពកភាគីទីបី ដែលផ្ដល់ធនធានគណនារបស់ខ្លួនតាមអ៊ីនធឺណិតទៅសាធារណៈ
ពពកឯកជន: មានន័យថាធនធានគណនាក្នុងពពកដែលប្រើប្រាស់ដោយអង្គការឬអាជីវកម្មតែម្នាក់ឯង មានសេវាកម្ម និងហេដ្ឋារចនាសម្ព័ន្ធត្រូវបានគ្រប់គ្រងលើបណ្ដាញឯកជន
ពពកតម្រង់: ពពកតម្រង់គឺជាប្រព័ន្ធដែលបញ្ចូលពពកសាធារណៈ និងឯកជន។ អ្នកប្រើប្រាស់ជ្រើសរើសមជ្ឈមណ្ឌលទិន្នន័យនៅក្នុងកន្លែងដែលមាន ប៉ុន្តែអនុញ្ញាតឲ្យទិន្នន័យ និងកម្មវិធីដំណើរការទៅលើពពកសាធារណៈមួយឬច្រើន។

សេវាកម្មគណនាក្នុងពពកភាគច្រើនចែកចេញជាបីប្រភេទ៖ ហេដ្ឋារចនាសម្ព័ន្ធជាសេវាកម្ម (IaaS), វេទិកាជាសេវាកម្ម (PaaS) និងសូហ្វវែរជាសេវាកម្ម (SaaS)។

ហេដ្ឋារចនាសម្ព័ន្ធជាសេវាកម្ម (IaaS): អ្នកប្រើជួលហេដ្ឋារចនាសម្ព័ន្ធ IT ដូចជាម៉ាស៊ីនបម្រើ និងម៉ាស៊ីនវឺឌួល (VMs), ទុកស្តុក, បណ្ដាញ, ប្រព័ន្ធប្រតិបត្តិការ
វេទិកាជាសេវាកម្ម (PaaS): អ្នកប្រើជួលបរិយាកាសសម្រាប់អភិវឌ្ឍ, សាកល្បង, ចែកចាយ និងគ្រប់គ្រងកម្មវិធីសូហ្វវែរ។ អ្នកប្រើមិនចាំបាច់ការព្រួយបារម្ភអំពីការដំឡើង ឬគ្រប់គ្រងហេដ្ឋារចនាសម្ព័ន្ធរបស់ម៉ាស៊ីនបម្រើ ទុកស្តុក បណ្ដាញ និងមូលដ្ឋានទិន្នន័យដែលទាមទារសម្រាប់ការអភិវឌ្ឍន៍ឡើយ
សូហ្វវែរជាសេវាកម្ម (SaaS): អ្នកប្រើទទួលបានការចូលប្រើកម្មវិធីសូហ្វវែរ តាមអ៊ីនធឺណិត ពេលដែលត្រូវការនិងភាគច្រើននៅលើមូលដ្ឋានជាសមាជិកជាប្រចាំ។ អ្នកប្រើមិនចាំបាច់បារម្ភអំពីការផ្ទុក និងគ្រប់គ្រងកម្មវិធីសូហ្វវែរ ហេដ្ឋារចនាសម្ព័ន្ធគាំទ្រ ឬការថែទាំ ដូចជាការអាប់ដេតកម្មវិធី និងការជួសជុលសុវត្ថិភាពឡើយ។

អ្នកផ្ដល់សេវាកម្មពពកធំនៅលើទីផ្សារមួយចំនួនគឺ包括Amazon Web Services, Google Cloud Platform និង Microsoft Azure។

ហេតុអ្វីជ្រើសរើសពពកសម្រាប់វិទ្យាសាស្រ្តទិន្នន័យ?

អ្នកអភិវឌ្ឍន៍ និងអ្នកជំនាញ IT ជ្រើសរើសធ្វើការជាមួយពពកដោយហេតុផលជាច្រើន រួមមាន៖

នវានុវត្តន៍៖ អ្នកអាចបង្កើតកម្មវិធីរបស់អ្នកដោយបញ្ចូលសេវាកម្មនវានុវត្តន៍ដែលបានបង្កើតឡើងដោយអ្នកផ្ដល់សេវាកម្មពពកដោយផ្ទាល់ទៅក្នុងកម្មវិធីរបស់អ្នក
ភាពបត់បែន៖ អ្នកបង់ប្រាក់សម្រាប់សេវាកម្មដែលអ្នកត្រូវការតែប៉ុណ្ណោះ ហើយអាចជ្រើសរើសពីសេវាកម្មជាច្រើន។ ភាគច្រើនអ្នកបង់តាមការប្រើប្រាស់ និងអាចធ្វើការប្រែប្រួលសេវាកម្មឲ្យសមរម្យទៅនឹងតម្រូវការដែលកំពុងអភិវឌ្ឍ
ថវិកា៖ អ្នកមិនចាំបាច់វិនិយោគដំបូង ទិញរឹង និងសូហ្វវែរ ដំឡើង និងដំណើរការមជ្ឈមណ្ឌលទិន្នន័យក្នុងតំបន់ និងអ្នកអាចបង់ប្រាក់ទាំងអស់សម្រាប់អ្វីដែលអ្នកប្រើប្រាស់បានតែប៉ុណ្ណោះ
ភាពសមរម្យក្នុងការលាយលំចិត្តនិងពង្រីក៖ ធនធានរបស់អ្នកអាចលាយឡំតាមតម្រូវការនៃគម្រោង ដែលមានន័យថាកម្មវិធីរបស់អ្នកអាចប្រើប្រាស់ថាមពលគណនាឬទុកស្តុក និងថាមពលបណ្តាញលើស ឬតិច ដោយតាមពេលវេលា និងបរិបទក្រៅ
ផលិតភាព៖ អ្នកអាចផ្ដោតលើអាជីវកម្មរបស់អ្នកជាងចំណាយពេលលើភារកិច្ចដែលអ្នកផ្សេងអាចគ្រប់គ្រងបាន ដូចជា ការគ្រប់គ្រងមជ្ឈមណ្ឌលទិន្នន័យ
ការជឿជាក់៖ ការគណនាក្នុងពពកផ្ដល់វិធីសាស្រ្តជាច្រើនក្នុងការបម្រុងទុកទិន្នន័យរបស់អ្នកជាបន្តបន្ទាប់ ហើយអ្នកអាចរៀបចំផែនការផ្ទៃព្រួតរងគ្រោះដើម្បីរក្សាអាជីវកម្ម និងសេវាកម្មរបស់អ្នក ដើម្បីបន្តដំណើរការនៅពេលមានវិបត្តិ
សុវត្ថិភាព៖ អ្នកអាចទទួលបានអត្ថប្រយោជន៍ពីគោលនយោបាយ បច្ចេកវិទ្យា និងតុល្យភាពដែលពង្រឹងសុវត្ថិភាពគម្រោងរបស់អ្នក

នេះជាហេតុផលទូទៅមួយចំនួនដែលមនុស្សជ្រើសរើសប្រើសេវាកម្មពពក។ ឥឡូវនេះពេលយើងមានការយល់ដឹងល្អជាងមុនអំពីអ្វីដែលពពកជានិងអត្ថប្រយោជន៍សំខាន់របស់វា ពេលនេះយើងនឹងមើលឲ្យច្បាស់ល្អចំពោះការងាររបស់អ្នកវិទ្យាសាស្រ្តទិន្នន័យ និងអ្នកអភិវឌ្ឍន៍ធ្វើការជាមួយទិន្នន័យ ហើយតើពពកអាចជួយពួកគេទៅជាមួយបញ្ហាជាច្រើនដែលពួកគេប្រឈមមុខ៖

ការផ្ទុកទិន្នន័យច្រើន៖ ជៀសវាងការទិញ គ្រប់គ្រង និងការពារម៉ាស៊ីនបម្រើធំនានា អ្នកអាចផ្ទុកទិន្នន័យរបស់អ្នកដោយផ្ទាល់នៅក្នុងពពក ជាមួយដំណោះស្រាយដូចជា Azure Cosmos DB, Azure SQL Database និង Azure Data Lake Storage។
ការប្រតិបត្តិការសមាសភាពទិន្នន័យ៖ ការសមាសភាពទិន្នន័យគឺជាផ្នែកសំខាន់នៃវិទ្យាសាស្រ្តទិន្នន័យ ដែលអនុញ្ញាតឲ្យអ្នកធ្វើបម្លែងចេញពីការប្រមូលទិន្នន័យទៅការប្រឹងប្រែងអង្គការសកម្ម។ ជាមួយសេវាកម្មសមាសភាពទិន្នន័យដែលផ្ដល់នៅក្នុងពពក អ្នកអាចប្រមូល បម្លែង និងសមាសភាពទិន្នន័យពីប្រភពផ្សេងៗចូលទៅក្នុងឃ្លាំងទិន្នន័យតែមួយ ជាមួយ Data Factory។
ការដំណើរការទិន្នន័យ៖ ការដំណើរការទិន្នន័យច្រើនទាមទារថាមពលគណនាច្រើន ហើយមនុស្សមិនម្នាក់ណាមានព្រលឹងគ្រឿងចក្រ ដែលមានថាមពលគ្រប់គ្រាន់សម្រាប់ការប្រតិបត្តិ នេះហើយជាហេតុផលដែលមនុស្សជាច្រើនជ្រើសរើសប្រើប្រាស់ថាមពលគណនាធំបំផុតក្នុងពពកជាផ្ទាល់ដើម្បីដំណើរការ និងចែកចាយដំណោះស្រាយរបស់ពួកគេ។
ការប្រើប្រាស់សេវាកម្មវិភាគទិន្នន័យ៖ សេវាកម្មពពកដូចជា Azure Synapse Analytics, Azure Stream Analytics និង Azure Databricks ជួយអ្នកបំលែងទិន្នន័យរបស់អ្នកទៅជាជំនាញដែលអាចអនុវត្តបាន។
ការប្រើប្រាស់សេវាកម្មរៀនម៉ាស៊ីន និងបញ្ញាទិន្នន័យ៖ ជំនួសចាប់ផ្តើមពីសូន្យ អ្នកអាចប្រើប៉ូឡិចម៉ាស៊ីនរៀនដែលផ្ដល់ដោយអ្នកផ្ដល់សេវាកម្មពពក ជាមួយសេវាកម្មដូចជា AzureML។ អ្នកក៏អាចប្រើសេវាកម្មបញ្ញាដូចជា ពាក្យនិយាយទៅជាអត្ថបទ អត្ថបទទៅជាពាក្យនិយាយ ការមើលឃើញកុំព្យូទ័រនិងផ្សេងៗទៀត។

ឧទាហរណ៍នៃវិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក

មកធ្វើឲ្យវាច្បាស់ឡើងដោយមើលឧទាហរណ៍ពីករណីពីរបី៕

វិភាគអារម្មណ៍បណ្ដាញសង្គមជាប្រព័ន្ធពេលវេលាពិតប្រាកដ

យើងនឹងចាប់ផ្តើមជាមួយករណីដែលមនុស្សភាគច្រើនសិក្សានៅពេលចាប់ផ្តើមរៀនលើម៉ាស៊ីនរៀន៖ វិភាគអារម្មណ៍បណ្ដាញសង្គមក្នុងពេលវេលាពិតប្រាកដ។

សន្ដិសុខថាអ្នកដំណើរការរបាយការណ៍ព័ត៌មានមួយ ហើយអ្នកចង់ប្រើទិន្នន័យផ្ទាល់នៅក្នុងលេីកដើម្បីយល់អំពីមាតិកាដែលអ្នកអានអាចមានចំណាប់អារម្មណ៍។ ដើម្បីដឹងពីអ្វីនេះ អ្នកអាចបង្កើតកម្មវិធីមួយដែលអនុវត្តវិភាគអារម្មណ៍បណ្ដាញសង្គមនៅពេលវេលាពិតប្រាកដពីការបង្ហោះ Twitter ពីប្រធានបទដែលពាក់ព័ន្ធទៅអ្នកអាន។

សញ្ញាចំបើងដែលអ្នកនឹងមើលគឺ បរិមាណសារTweetលើប្រធានបទជាក់លាក់ (hashtags) និងអារម្មណ៍ ដែលកំណត់ដោយការប្រើប្រាស់ឧបករណ៍វិភាគដែលអនុវត្តវិភាគអារម្មណ៍នៅជុំវិញប្រធានបទដែលបានកំណត់។

ជំហានដែលចាំបាច់សម្រាប់បង្កើតគម្រោងនេះមានដូចជា៖

បង្កើត event hub សម្រាប់ស្ទ្រីមទិន្នន័យដែលនឹងប្រមូលទិន្នន័យពី Twitter
ការកំណត់រចនាសម្ព័ន្ធ និងចាប់ផ្តើមកម្មវិធី Twitter client ដែលនឹងហៅ Twitter Streaming APIs
បង្កើត Stream Analytics job
កំណត់ការបញ្ចូលការងារ និងស្នើសុំ
បង្កើត output sink និងកំណត់ការចេញការងារ
ចាប់ផ្តើមការងារ

ដើម្បីមើលដំណើរការទាំងមូល សូមមើលនៅ ឯកសារ។

វិភាគអត្ថបទវិទ្យាសាស្ត្រ

សូមយកឧទាហរណ៍មួយទៀតពីគម្រោងដែលបង្កើតដោយ Dmitry Soshnikov មួយក្នុងចំណោមអ្នកនិពន្ធនៃមេរៀននេះ។

Dmitry បានបង្កើតឧបករណ៍ដែលវិភាគឯកសារទាក់ទងជាមួយ COVID។ ដោយពិនិត្យការគម្រោងនេះ អ្នកនឹងមើលឃើញនូវរបៀបដែលអ្នកអាចបង្កើតឧបករណ៍ដកស្រង់ចំណេះដឹងពីអត្ថបទវិទ្យាសាស្ត្រ ទទួលបានចំណេះដឹង និងជួយស្រាវជ្រាវស្វែងរកតាមទិសដៅក្នុងការប្រមូលផ្តុំអត្ថបទច្រើនដោយមានប្រសិទ្ធភាព។

មកមើលជំហាននានាដែលបានប្រើសម្រាប់នេះ៖

ដកស្រង់ និងអង្គភាពព័ត៌មានជាមុនជាមួយ Text Analytics for Health
ប្រើ Azure ML ដើម្បីដំណើរការជាបួស
ទុកស្តុក និងស្នើសុំព័ត៌មានជាមួយ Cosmos DB
បង្កើតផ្ទាំងបង្ហាញទិន្នន័យអន្តរប្រតិបត្តិសម្រាប់ការស្វែងរកទិន្នន័យ និងការតំណាងទិន្នន័យប្រើ Power BI

ដើម្បីឃើញដំណើរការទាំងមូល សូមទៅកាន់ ប្លុករបស់ Dmitry។

ដូចដែលអ្នកឃើញ យើងអាចប្រើប្រាស់សេវាកម្មពពកដោយមានវិធីជាច្រើនដើម្បីអនុវត្តវិទ្យាសាស្រ្តទិន្នន័យ។

ចំណាំចុងក្រោយ

ប្រភព៖

ប្រលងបន្ទាប់ពីមេរៀន

កិច្ចការផ្ទះ

Market Research

ការបដិសេធ៖
ឯកសារនេះត្រូវបានបកប្រែដោយប្រើសេវាកម្មបកប្រែ AI Co-op Translator។ ទោះយើងខិតខំប្រឹងប្រែងដើម្បីភាពត្រឹមត្រូវ សូមយល់ឱ្យបានច្បាស់ថាការបកប្រែដោយស្វ័យប្រវត្តិអាចមានកំហុស ឬមិនត្រឹមត្រូវ។ ឯកសារដើមដែលមានភាសាមាតុភូមិគួរត្រូវបានគេចាត់ទុកជាឯកសារដែលមានសិទ្ធិលើព័ត៌មានច្បាស់លាស់។ សម្រាប់ព័ត៌មានសំខាន់ៗ សូមណែនាំការបកប្រែដោយអ្នកជំនាញមនុស្សវិជ្ជាជីវៈ។ យើងមិនទទួលខុសត្រូវចំពោះការយល់ច្រឡំ ឬការបកស្រាយខុសប្លែកណាមួយដែលកើតឡើងចេញពីការប្រើប្រាស់ការបកប្រែនេះទេ។

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

អធិប្បាយអំពីវិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក

ប្រលងមុនមេរៀន

តើពពកគឺជាអ្វី?

ហេតុអ្វីជ្រើសរើសពពកសម្រាប់វិទ្យាសាស្រ្តទិន្នន័យ?

ឧទាហរណ៍នៃវិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក

វិភាគអារម្មណ៍បណ្ដាញសង្គមជាប្រព័ន្ធពេលវេលាពិតប្រាកដ

វិភាគអត្ថបទវិទ្យាសាស្ត្រ

ចំណាំចុងក្រោយ

ប្រលងបន្ទាប់ពីមេរៀន

ប្រលងបន្ទាប់ពីមេរៀន

កិច្ចការផ្ទះ

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

អធិប្បាយអំពីវិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក

ប្រលងមុនមេរៀន

តើពពកគឺជាអ្វី?

ហេតុអ្វីជ្រើសរើសពពកសម្រាប់វិទ្យាសាស្រ្តទិន្នន័យ?

ឧទាហរណ៍នៃវិទ្យាសាស្រ្តទិន្នន័យនៅក្នុងពពក

វិភាគអារម្មណ៍បណ្ដាញសង្គមជាប្រព័ន្ធពេលវេលាពិតប្រាកដ

វិភាគអត្ថបទវិទ្យាសាស្ត្រ

ចំណាំចុងក្រោយ

ប្រលងបន្ទាប់ពីមេរៀន

ប្រលងបន្ទាប់ពីមេរៀន

កិច្ចការផ្ទះ