วันอาทิตย์ที่ 11 มีนาคม พ.ศ. 2561

Big data คือ

ในยุคปัจจุบันที่โลกถูกขับเคลื่อนด้วยข้อมูล ผู้คนพึ่งพิงข้อมูลในการตัดสินใจต่างๆ กระบวนการคิดของคนทั่วไปหรือแม้แต่องค์กรต่างๆในทุกวันนี้ส่วนใหญ่อยู่บนฐานของการรวบรวมข้อมูล ประมวลผล เพื่อประกอบการตัดสินใจทำอะไรบางอย่าง

แต่ด้วยความที่ข้อมูลในปัจจุบันมีอยู่มากมายและกระจัดกระจาย คำถามสำคัญ คือ เราจะเข้าถึงข้อมูลมหาศาลเหล่านั้นและใช้ข้อมูลเหล่านั้นให้เป็นประโยชน์ได้อย่างไร จากคำถามดังกล่าวจึงทำให้คนหันมาสนใจสิ่งที่เรียกว่า Big data กันมากขึ้นจนกลายเป็นกระแสสังคมในปัจจุบัน

What is big data?
Big data คือ ข้อมูลที่ประกอบด้วยคุณลักษณะ 4 อย่างคือ

1. Volume — size ของข้อมูลมีขนาดใหญ่ มีปริมาณข้อมูลมาก ซึ่งสามารถเป็นได้ทั้งข้อมูลแบบ offline หรือ online

2. Variety — ข้อมูลมีความหลากหลาย สามารถเป็นได้ทั้งที่มีโครงสร้างและข้อมูลที่ไม่สามารถจับ pattern ได้

3. Velocity — ข้อมูลมีการเปลี่ยนแปลงตลอดเวลาอย่างรวดเร็ว มีการส่งผ่านข้อมูลอย่างต่อเนื่องในลักษณะ streaming ทำให้การวิเคราะห์ข้อมูลแบบ manual มีข้อจำกัด

4. Veracity — ข้อมูลมีความไม่ชัดเจน (untrusted, uncleaned)

โดยรูปแบบของข้อมูลของ big data ก็สามารถเป็นไปได้หลากหลาย ตั้งแต่

1. Behavioral data: ข้อมูลเชิงพฤติกรรมการใช้งานต่างๆเช่น server log, พฤติกรรมการคลิกดูข้อมูล, ข้อมูลการใช้ ATM เป็นต้น

2. Image & sounds: ภาพถ่าย, วีดีโอ, รูปจาก google street view, ภาพถ่ายทางการแพทย์, ลายมือ, ข้อมูลเสียงที่ถูกบันทึกไว้ เป็นต้น

3. Languages: text message, ข้อความที่ถูก tweet, เนื้อหาต่างๆในเว็บไซต์ เป็นต้น

4. Records: ข้อมูลทางการแพทย์, ข้อมูลผลสำรวจที่มีขนาดใหญ่, ข้อมูลทางภาษี เป็นต้น

5. Sensors: ข้อมูลอุณหภูมิ, accelerometer, ข้อมูลทางภูมิศาสตร์ เป็นต้น

Big data analytics
การวิเคราะห์ข้อมูล Big data อาศัยหลักการพื้นฐานบางอย่างเพื่อพัฒนาเป็นเทคนิคในการดึงข้อมูลสำคัญออกจากชุดฐานข้อมูลขนาดใหญ่ที่เต็มไปด้วยข้อมูลหลากหลายรูปแบบ เพื่อนำมาหา pattern ของข้อมูลที่มองไม่เห็นด้วยตาเปล่า หารูปแบบความสัมพันธ์ที่ซ่อนอยู่ หาแนวโน้มการตลาด เทรนด์ความชอบของลูกค้า และข้อมูลอื่นๆที่เป็นประโยชน์ทางธุรกิจ

ผลจากการวิเคราะห์ข้อมูล Big data ทำให้มีข้อมูลที่เป็นข้อเท็จจริงซึ่งผ่านการวิเคราะห์อย่างเป็นระบบเพื่อใช้ประกอบการตัดสินใจ โดยระดับของการวิเคราะห์ก็เป็นได้หลากหลาย แล้วแต่รูปแบบการนำไปใช้งาน

1. Descriptive analytics

เป็นการวิเคราะห์ในระดับที่บอกว่าเกิดอะไรขึ้น จำนวนเท่าไหร่ ถี่แค่ไหน
เกิดเหตุการณ์สำคัญๆตอนไหน ตรงไหนบ้าง เป็นต้น โดยสามารถทำในรูปแบบของ

- Standard report: “เกิดอะไรขึ้น”

- Ad hoc report: “จำนวนเท่าไหร่ บ่อยแค่ไหน ที่ไหน”

- Query: “อะไรคือปัญหาที่แท้จริง”

- Alerts: “ต้องเกิด action อะไร”

2. Predictive analytics

เป็นการวิเคราะห์ในลักษณะที่ซับซ้อนขึ้นไปอีกขั้นหนึ่งคือ เป็นการประเมินว่าจะเกิดอะไรขึ้นต่อไป มีการให้ข้อมูลตัวชี้วัดของผลลัพธ์ที่อาจจะเกิดขึ้นถ้าแนวโน้มยังเป็นอย่างนี้ต่อไป โดยผลการวิเคราะห์อาจออกมาในรูปแบบของ

- Statistical analysis: “ทำไมถึงเกิดเหตุการณ์นี้”

- Randomized testing: “จะเกิดอะไรขึ้นถ้าเราทดลองทำวิธีการนี้”

- Predictive modeling: “จะเกิดอะไรขึ้นต่อไป”

- Optimization: “อะไรคือสถานการณ์ที่ดีที่สุดที่จะเกิดขึ้น”

3. Prescriptive analytics

เป็นการสังเคราะห์ข้อมูลเพื่อวิเคราะห์แนวโน้มและเสนอทางเลือกในการตัดสินใจที่เหมาะสมกับการคาดการณ์บนฐานของข้อมูล

Why big data now?
มีหลายคนที่เกิดคำถามว่าทำไมเรื่อง big data จึงกลายเป็นกระแสในปัจจุบัน อ.ธีรณีได้ให้ความเห็นว่า กระแสนี้เป็นผลที่จากเกิดหลายๆองค์ประกอบ ไม่ว่าจะเป็น

Demand for better data เกิดกระแสกดดันภายใต้บริบทของการปฏิรูป สภาวะทางเศรษฐกิจ และนวัตกรรมใหม่ๆ
Supply of relevant data at scale มีการแพร่หลายและไหลเวียนของข้อมูลทั้งข้อมูลทางการแพทย์และข้อมูลอื่นๆที่สามารถเข้าถึงได้ทั่วไป
Technical capability มีการพัฒนาเทคนิคในการวิเคราะห์ข้อมูลจำนวนมากที่ทันสมัย ทำงานง่ายขึ้นและเข้าถึงได้แพร่หลาย
Government catalyzing market change มีแรงส่งจากภาครัฐที่ถูกกดดันให้มีการเปิดเผยข้อมูลให้โปร่งใสจนกระจายไปสู่ภาคธุรกิจอื่นๆ
จากนี้เราคงเห็นเทรนด์ในการใช้ Big Data ในการสร้างสรรนวัตกรรมใหม่ ๆ เกิดขึ้นอีกเรื่อย ๆ เป็นกระแสที่น่าติดตามอีกกระแสหนึ่งเลยทีเดียว

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

Grey Hat คืออะไร

Grey Hat คืออะไร Grey Hat คือ Hacker ที่มีทั้งด้สนดีและไม่ดีอยู่ภายในตัว อาจมีจุดประสงค์เพื่อโจมตีหรือป้องกันระบบโดยขึ้นอยู๋กับสถานการณ...