‘Data Lake’ ก้าวแรกสู่ Data-Driven Organization - Forbes Thailand

‘Data Lake’ ก้าวแรกสู่ Data-Driven Organization

FORBES THAILAND / ADMIN
15 Jan 2021 | 04:28 PM
READ 5025

โลกยุคปัจจุบันที่ธุรกิจและองค์กรทั่วโลกต่างขับเคลื่อนด้วยข้อมูลจำนวนมหาศาล จึงไม่น่าแปลกใจที่จะเห็นบริษัทชั้นนำของโลกอย่าง Google, Amazon หรือ Alibaba ต่างมีกลยุทธ์ในการนำข้อมูลในมือไปใช้ให้เกิดประสิทธิภาพสูงสุด หรือที่เรียกกันว่า Data-Driven Organization โดยเริ่มต้นจาก Data Lake เป็นส่วนสำคัญ

ในประเทศไทยนั้น หลายองค์กรเพิ่งเริ่มทำ Digital Transformation และยังขาดความพร้อมในการนำข้อมูลมาวิเคราะห์เพื่อเพิ่มศักยภาพการแข่งขัน แน่นอนว่าเกือบทุกองค์กรต่างเร่งปรับตัวเพื่อแข่งขันในสมรภูมิข้อมูล แต่การทำเช่นนั้นกลับไม่ง่าย ท่ามกลางความท้าทายในการจัดการข้อมูลที่หลายองค์กรเผชิญอยู่ จนเจอจุดสะดุดสู่การทรานส์ฟอร์มเป็น Data-Driven Organization ไม่ว่าจะเป็น
  • การทำงานแบบแยกส่วนในองค์กร (Organizational Silos)
องค์กรส่วนใหญ่ยังมีรูปแบบการทำงานแบบไซโล (Silo) หรือการทำงานแยกส่วน โดยพนักงานแต่ละทีมรับรู้เฉพาะงานของทีมตัวเอง ทำให้ข้อมูลและองค์ความรู้ของธุรกิจอยู่กระจัดกระจายกัน แทนที่จะรวมศูนย์ไว้ที่เดียว ซึ่งส่งผลให้การเข้าถึงและนำข้อมูลไปใช้งานทำได้ยาก
  • ระบบจัดการข้อมูลไม่มีประสิทธิภาพ
ด้วยความที่หลายองค์กรเก็บข้อมูลกระจัดกระจายกันไปตามหน่วยธุรกิจ ทำให้ระบบเก็บข้อมูลที่ใช้งานอยู่มีจำนวนมาก ซึ่งในบางกรณีมากเกินความจำเป็น จนสิ้นเปลืองต้นทุนในการดูแลและยากต่อการบริหารจัดการ ดังนั้น หากองค์กรต้องการเป็น Data-Driven Organization จำเป็นต้องมีพื้นที่เก็บข้อมูลส่วนกลาง ที่รองรับข้อมูลปริมาณมหาศาลจากทุกระบบ รวมถึงมีโครงสร้างการเก็บข้อมูลที่ยืดหยุ่น สามารถรองรับความเข้ากันได้ (Compatibility) ของข้อมูลซึ่งมาจากระบบต่างๆ ที่แตกต่างกัน
  • บุคลากรขาดความรู้เรื่องการบริหารจัดการข้อมูล
บุคลากรทุกคนในองค์กรควรต้องมีความรู้ความเข้าใจเรื่องการจัดการข้อมูล ไม่ใช่แค่เฉพาะทีม IT เท่านั้น โดยบุคลากรควรเข้าใจตั้งแต่ขั้นตอนการเก็บข้อมูล การจัดการข้อมูลที่เก็บมาแล้ว และวิธีการนำข้อมูลไปใช้ เพื่อสร้างประสิทธิภาพสูงสุดให้องค์กร   ตอกเสาเข็มแรกด้วย Data Lake หนทางก้าวไปสู่การเป็น Data-Driven Organization ต้องเริ่มที่การสร้าง Data Platform เพื่อจัดเก็บและจัดการข้อมูลอย่างเป็นระบบ โดยขั้นแรกต้องมีพื้นที่เก็บข้อมูลส่วนกลางจากทุกแหล่งข้อมูล หรือ Data Lake ซึ่งมีค่าใช้จ่ายต่ำเมื่อเทียบกับฐานข้อมูลอื่นๆ และสามารถรวบรวมข้อมูลได้ทุกรูปแบบโดยไม่จำเป็นต้องออกแบบโครงสร้างของข้อมูลก่อน ทำให้สามารถรองรับข้อมูลจากแหล่งต่างๆ ได้อย่างยืดหยุ่น อีกทั้งยังเชื่อมต่อกับเครื่องมือในการวิเคราะห์ข้อมูลได้หลากหลาย ตั้งแต่การทำ คลังข้อมูล (Data Warehouse) เพื่อนำเสนอข้อมูลออกมาเป็นรายงานหรือในรูปแบบที่เข้าใจง่ายและเห็นภาพอย่าง Visualized Dashboard รวมไปถึงการทำ Machine Learning ตลอดจนการวิเคราะห์ข้อมูลแบบเรียลไทม์ (Real-time Analytic) หลังดำเนินการสร้าง Data Platform ขึ้นเป็นพื้นที่เก็บข้อมูลส่วนกลาง เพื่อให้การเข้าถึงและการนำข้อมูลไปใช้ทำได้อย่างสะดวกรวดเร็วแล้ว องค์กรจำเป็นต้องกำหนดนโยบายเพื่อกำกับดูแลข้อมูล (Data Governance) โดยมีวัตถุประสงค์หลัก 2 เรื่อง คือเพื่อให้จัดเก็บข้อมูลอย่างมีคุณภาพและเพิ่มความปลอดภัยของข้อมูล
  1. เพิ่มการจัดเก็บข้อมูลอย่างมีคุณภาพ
แม้ว่าวิธีการวิเคราะห์ข้อมูลจะมีประสิทธิภาพสูงเพียงใดก็ตาม แต่หากข้อมูลที่นำไปวิเคราะห์ไม่มีคุณภาพ ผลลัพธ์ที่ได้ย่อมไม่สามารถนำไปใช้ประโยชน์ ตามคำกล่าวที่ว่า “Garbage in, Garbage Out” ซึ่งแปลตรงตัวว่า โยนขยะเข้าไป ก็ได้ขยะออกมา ดังนั้นการเพิ่มคุณภาพของข้อมูลที่เก็บมาจึงมีความสำคัญ โดยการวัดคุณภาพข้อมูลมีเกณฑ์ 5 ข้อคือ 1. ข้อมูลมีความถูกต้อง (Accuracy) 2. ข้อมูลมีความครบถ้วนสมบูรณ์ (Completeness) 3. ข้อมูลจากต่างระบบสามารถเชื่อมโยงกันได้ (Coherent) 4. ข้อมูลจากต่างระบบไม่ขัดแย้งกัน (Consistency) 5. ข้อมูลมีการอัพเดทให้เป็นปัจจุบัน (Timeliness)
  1. เพิ่มความปลอดภัยของข้อมูล
เมื่อข้อมูลกลายเป็นทรัพย์สินมีค่าขององค์กร และมีบทบาทสำคัญต่อศักยภาพการแข่งขัน จึงต้องวางมาตรการรักษาความปลอดภัยของข้อมูลอย่างรัดกุม โดยองค์กรควรมีกระบวนการจัดลำดับชั้นของข้อมูล แหล่งที่มา และผู้รับผิดชอบข้อมูล เพื่อให้การดูแลข้อมูลทำได้ง่ายและครอบคลุมยิ่งขึ้น รวมถึงตรวจสอบได้อย่างรวดเร็วเมื่อเกิดความผิดปกติภายในระบบเก็บข้อมูลนอกจากนี้ ยังควรออกแบบระบบเพื่อให้พนักงานทุกคนสามารถเข้าถึงข้อมูลได้ตามสิทธิที่กำหนดไว้ หรือขออนุญาตจากผู้มีอำนาจอนุมัติสิทธิได้ในกรณีที่จำเป็นต้องใช้ข้อมูลนั้นๆ ทั้งนี้ การทำ Data Lake และการวางนโยบายกำกับดูแลข้อมูลช่วยเพิ่มประสิทธิภาพให้องค์กรในหลายมิติ อาทิ
  • ลดปัญหาข้อมูลซ้ำซ้อน ไม่ตรงกัน
Data Lake ช่วยให้องค์กรดึงข้อมูลจากหลากหลายแหล่งมารวมไว้ ซึ่งเป็นการสร้างแหล่งรวมข้อมูลเดียวในองค์กร (Be a single source of truth) ทำให้ทุกฝ่ายได้รับข้อมูลใหม่ตรงกัน จากเดิมที่แต่ละฝ่ายอาจมีข้อมูลเก่าและไม่ทันต่อสถานการณ์ เช่น ฝ่ายขายในบริษัทก่อสร้างที่ยังมีข้อมูลสเปคโรงงานเวอร์ชันเก่า ขณะที่ฝ่ายหน้างานไปเก็บข้อมูลราคาสินค้าเพิ่มมาแล้ว ซึ่งทำให้ฝ่ายขายเสี่ยงขายสินค้าไปในราคาต่ำกว่าที่ควรจะเป็น
  • ลดระยะเวลาและขั้นตอนที่ไม่จำเป็น
เมื่อมีแหล่งรวมข้อมูลเดียวในองค์กร ทำให้ทุกฝ่ายสามารถเข้าถึงข้อมูลได้เองตามสิทธิการเข้าถึงที่ได้รับ โดยไม่ต้องยื่นเรื่องขออนุญาตจากฝ่าย IT เพื่อขอเข้าถึงข้อมูล ซึ่งช่วยย่นระยะเวลาและตัดขั้นตอนที่ไม่จำเป็นเมื่อต้องการใช้ข้อมูลอย่างเร่งด่วน
  • เพิ่มประสิทธิภาพการตัดสินใจของธุรกิจ
การที่ทีมงานสามารถเห็นภาพรวมของทั้งองค์กรนอกเหนือจากงานที่ตัวเองทำ อาจทำให้ค้นพบมุมมองใหม่ๆ จากข้อมูลเชิงลึกซึ่งได้รับการวิเคราะห์มาแล้ว และข้อมูลดังกล่าวสามารถช่วยให้ตัดสินใจได้ดีขึ้น และเปิดทางต่อยอดไปสู่แนวคิดที่แตกต่าง สร้างความได้เปรียบเหนือคู่แข่ง โดยมีผลการสำรวจเมื่อไม่นานนี้จากบริษัทเพื่อการลงทุน Aberdeen พบว่า องค์กรที่ทำ Data Lake มีอัตราการเติบโตด้วยตัวเอง (Organic Growth) มากกว่าองค์กรคู่แข่งถึง 9% ต่อปี   4 ขั้นตอนสู่ความสำเร็จปั้น Data-Driven Organization 
  1. เริ่มทำ Data Blueprint ซึ่งเป็นการวางแผนผังข้อมูลทั้งหมดขององค์กร โดยเริ่มจากการสำรวจดูว่าแต่ละฝ่ายมีข้อมูลอะไรอยู่บ้าง รวมถึงต้องตรวจสอบแหล่งที่มาของข้อมูลและติดตามการนำข้อมูลไปใช้งาน (Data Linage)
  2. ประเมินและวิเคราะห์องค์กร ตั้งแต่ระบบจัดเก็บข้อมูลทั้งหมดที่ใช้อยู่ว่าควรต้องปรับปรุงในส่วนไหน หลังจากนั้นประเมินงบประมาณและความพร้อมขององค์กรในการเปลี่ยนไปใช้ Data Lake ซึ่งมีให้เลือกทั้งแบบบน Cloud หรือแบบ on-premise
  3. วางนโยบายกำกับดูแลข้อมูล เพื่อบริหารจัดการข้อมูลอย่างเป็นระบบ และสร้างความรู้ความเข้าใจให้พนักงานเกี่ยวกับการดูแลจัดการข้อมูล เพื่อสร้าง Data-Driven Culture ขึ้นในองค์กร
  4. ปรับใช้ตัวช่วยเพื่อให้องค์กรทรานส์ฟอร์มอย่างมีประสิทธิภาพ เช่น PMO (Program Management Office) หรือ หน่วยงานเฉพาะกิจที่จัดตั้งขึ้นเพื่อบริหารจัดการโครงการต่างๆ ให้บรรลุตามเป้าหมายที่วางไว้
คงปฏิเสธไม่ได้ว่าการทรานส์ฟอร์มองค์กรเพื่อก้าวไปเป็น Data-Driven Organization ไม่ใช่เรื่องง่ายและต้องใช้เวลา เพราะนอกจากจะต้องทุ่มเททรัพยากรเพื่อให้ความรู้คนในองค์กรแล้ว ยังต้องผลักดันให้ทั้งองค์กรมีวัฒนธรรมการนำข้อมูลมาใช้ในการตัดสินใจ และชี้ให้เห็นถึงทิศทางที่องค์กรต้องการจะขับเคลื่อนไปในอนาคต ไม่เพียงเท่านั้น การเริ่มทำ Data Lake เพื่อพัฒนาขีดความสามารถในการแข่งขันด้วยข้อมูลนั้น ยังอาจมีความยุ่งยากเรื่องการจัดตั้งทีมงานพิเศษที่มีความสามารถในการควบคุม ประสานงานกับฝ่ายต่างๆ และผลักดันให้การทรานส์ฟอร์มเกิดขึ้นจริง อีกทั้งยังต้องประเมินความพร้อมองค์กรอย่างรอบด้าน ทั้งการวิเคราะห์ระบบ ประมาณการต้นทุน และเลือกแพลตฟอร์มที่เหมาะสมกับธุรกิจเพื่อสร้าง Data Lake ขึ้น ซึ่งกระบวนการเหล่านี้มีความซับซ้อนและจำเป็นต้องใช้ทักษะเฉพาะทางขั้นสูง จากปัจจัยต่างๆ ที่กล่าวมาข้างต้น การหาผู้เชี่ยวชาญเฉพาะทางจึงนับเป็นอีกทางเลือกหนึ่งในการผลักดันให้องค์กรประสบความสำเร็จในการทรานส์ฟอร์มสู่ Data-Driven Organization ซึ่งหากรอให้องค์กรพร้อมอย่างเต็มที่แล้วค่อยเปลี่ยนแปลงอย่างช้าๆ ก็อาจสายเกินการณ์ในโลกยุค Digital Disruption เพราะยิ่งช้า ธุรกิจจะยิ่งมีต้นทุนค่าเสียโอกาสเพิ่มขึ้นเรื่อยๆ และในบางครั้ง การตัดสินใจช้ากว่าคู่แข่งเพียงเสี้ยวนาที อาจสร้างผลกระทบมหาศาลต่อบริษัทก็เป็นได้   พิพัฒน์ ประภาพรรณพงศ์ ผู้อำนวยการและหัวหน้าทีม Data Science (Machine Learning) บริษัท บลูบิค กรุ๊ป จำกัด

ไม่พลาดเรื่องราวน่าสนใจอื่นๆ ของเรา ติดตามเราได้ที่ เพจเฟซบุ๊ก Forbes Thailand Magazine