8. การจัดสร้าง RoadMapของการดาเนินการ Big data
แผนการนา Big data มา ใช้งานขึ้นอยู่กับเป้ าหมายทางธุรกิจ รวมทั้งวุฒิภาวะในการบริหารจัดการ
ข้อมูล รวมทั้งความเสี่ยงที่องค์กรของท่านยอมรับได้ เริ่มด้วยจากการพิจารณาสิ่งที่จะนาไปสู่เส้นทางของการนา
Big Data มาใช้งาน รวมทั้งพิจารณาต่อไปนี้
ความเร่งด่วนในทางธุรกิจ
พลังของการประมวลผลที่คาดการณ์ไว้
Software ที่ต้องการและวิธีการพัฒนา
งบประมาณที่มีอยู่และทักษะการดาเนินงาน
ความพร้อมที่จะเสี่ยง
43.
9. เจ็ดขั้นตอนสู่ความสาเร็จสาหรับ BigData
ขั้นตอน #1 ยอมรับว่าองค์กรมีปัญหาเกี่ยวกับข้อมูล
องค์กรของท่านกาลังจมอยู่กับข้อมูลหรือไม่?
ท่านไม่ทราบว่าข้อมูลของท่านอยู่ที่ใด?
ผู้บริหารธุรกิจของท่านไม่สามารถได้รับข่าวสารใดๆจากข้อมูลที่มีอยู่
ผู้บริหารตัดสินใจทางธุรกิจโดยไม่ได้อยู่บนพื้นฐานของข้อมูล
ท่านเห็นโอกาสที่จะทาให้ Big Data เข้ามาเกี่ยวข้องกับนโยบายการดาเนินการทางธุรกิจและกลยุทธ์
มากขึ้น ?
ขั้นตอน #2 : สร้างแผนงานการใช้ Big Data
แยกแยะข้อมูลที่จะเป็นส่วนหนึ่งของ Big Data
แยกแยะข้อมูลสาหรับ Big Data ออกเป็นประเภทต่างๆ เช่น ข้อมูลเกี่ยวกับการวิเคราะห์ทรัพยากร
บุคคล ข้อมูลวิเคราะห์ลูกค้า และผลิตภัณฑ์
ตระหนักและเข้าใจถึง แก่นสาคัญที่สุดของข้อมูล
ทาความเข้าใจกับเทคโนโลยีที่จะนามาใช้กับการประมวลผลแบบเรียลไทม์หรือกึ่งเรียลไทม์สาหรับ Big
Data
ระบุหรือพิสูจน์ทราบกุญแจสาคัญของโซลูชั่นรวมทั้งผู้ขาย
เริ่มต้นจากขนาดเล็ก แล้วค่อยขยาย จากนั้นดาเนินการการประเมิน ความคุ้มทุนก่อนเข้าสู่โครงการที่
ใหญ่ขึ้น
วิเคราะห์และประเมินอย่างต่อเนื่อง ปรับแต่งวิธีการรวบรวมข้อมูล การจัดข้อมูลให้สอดคล้องกับ Big
Data
ขั้นตอน # 3 : คิดถึงการประมวลผลแบบกระจายและสิ่งที่เกี่ยวข้อง
สถาปัตยกรรมที่สามารถรองรับข้อมูลหลากหลาย
Distributed database
Virtualization
Storm :ประมวลผลแบบกระจายชนิดเรียลไทม์และ Fault-tolerant
Apache Drill : ระบบประมวลผลแบบกระจายสาหรับวิเคราะห์ชุดข้อมูลในลักษณะ Interactive
Apache Drill : ระบบประมวลผลแบบกระจายสาหรับวิเคราะห์ชุดข้อมูลในลักษณะ Interactive
Rapid Miner : การค้นพบข้อมูลความรู้ในฐานข้อมูล เป็น เครื่องจักรเรียนรู้ และเหมืองข้อมูล
Pentaho : การจัดรายงานในระดับวิสาหกิจ การวิเคราะห์ และ Dashboard เป็นเหมืองข้อมูล และบริหาร
จัดการ Workflow รวมทั้งอื่นๆ
HPCC Systems : หรือ High Performance Computing Cluster เป็นแพลตฟอร์มการคานวณและการ
ประมวลผลแบบขนาน สาหรับแก้ปัญหาต่างๆที่เกิดขึ้นบน Big Data
ขั้นตอน # 7 : คานึงถึงระบบรักษาความปลอดภัย
การเข้ารหัสข้อมูลใน Disk หรืออุปกรณ์จัดเก็บข้อมูล
การป้ องกันการสื่อสารระหว่าง Client กับอุปกรณ์จัดเก็บข้อมูล หรือ Server
ในกรณีที่ใช้ Cloud ให้พิจารณาความปลอดภัยข้อมูลที่วิ่งบนเส้นทางผ่าน Internet
ใช้ KERBEROS หรือ Key Distribution Center (KDC)
พิจารณาระบบตรวจสอบความถูกต้องของ Node ผ่านทางการบริหาร Virtualization หรือจากสิ่งอานวย
ความสะดวกของผู้ให้บริการ Cloud หรืออาจใช้ ผลิตภัณฑ์จาก Third Party เช่น Chef และ Puppet
พิจารณาติดตั้ง Log และระบบ Audit
46.
10. ข้อพึงปฏิบัติสาหรับงาน BigData
1. เข้าใจวัตถุประสงค์ของท่าน
2. จัดตั้ง Road Map
3. ค้นหาข้อมูลที่เกี่ยวข้องกับ Big Data
4. ตรวจสอบดูว่าข้อมูลใดที่ท่านยังไม่มี
5. ทาความเข้าใจกับเทคโนโลยีที่เกี่ยวข้อง
6. วางแผนเกี่ยวกับการดูแลความปลอดภัยในบริบทของ Big Data
7. รวบรวมความต้องการทางธุรกิจก่อนที่จะรวบรวมข้อมูล
8. วางแผนกลยุทธ์บรรษัทภิบาลข้อมูล
9. วางแผนการบริการกระจายข้อมูล
10. ทดสอบสมมติฐานของท่านอย่างต่อเนื่อง
11. การดาเนินการ Big data เป็นเรื่องของการตัดสินใจทางธุรกิจมิใช่ไอที
12. ประเมินความต้องการข้อมูล
13. ทาการสมทบข้อมูล Big data กับข้อมูลขององค์กร
14. จัดทาโครงสร้างของ Big Data ในรูปแบบการวิเคราะห์ มิใช่เป็นเพียงการรายงานแบบมาตรฐานทั่วไป
หรือการสอบถามข้อมูลเฉพาะกิจ
สิ่งที่ควรและไม่ควรทาสาหรับ Big Data 11 ประการ
1. อย่ารวมเอาหน่วยธุรกิจทั้งหมดของท่านเข้าไปอยู่ในระบบ Big
2. ให้ประเมินวิธีการและรูปแบบการแจกจ่ายข้อมูลสาหรับ Big Data
3. ให้คิดถึงแหล่งที่มาของข้อมูลดั้งเดิมเป็นส่วนหนึ่งของกลยุทธ์สาหรับ Big Data
4. ให้วางแผนจัดการ Metadata อย่างคงเส้นคงวา
5. ให้มีการส่งกระจายข้อมูลของท่าน
6. อย่าเข้าสู่ Big Data หากท่านยังไม่พร้อม
47.
7. อย่ามองข้ามความต้องการที่จะควบรวมข้อมูล
8. อย่าลืมบริหารจัดการความปลอดภัยของข้อมูล
9.อย่ามองข้ามความต้องการที่จะบริหารจัดการ
10. อย่ามองข้ามประสิทธิภาพของข้อมูล
11. อย่าพึ่งพาอาศัยแนวทางวิเคราะห์สาหรับ Big Data เพียงแบบเดียว
11 อนาคตของ Big Data
เครื่องมือวิเคราะห์ที่ทรงพลังมากขึ้นรวมทั้งเครื่องมือที่ให้ข้อมูลที่ดูง่ายต่อความเข้าใจมากขึ้น
การประมวลผลบนกระแสของข้อมูล
การผงาดขึ้นมาของตลาดข้อมูล
การพัฒนาเครื่องมือสาหรับจัดการกระแสการทางานของข้อมูล
เพิ่มความเข้าใจหรือความต้องการที่จะเห็นความชัดเจนจากผลของการวิเคราะห์ข้อมูลมากขึ้น
ที่มา : http://www.cyberthai.com/index.php/knowledge-center