28 ส.ค. เวลา 10:26 • การศึกษา
Data By Shoper Gamer

Unstructured Data คืออะไร

โดย
ในปัจจุบัน ข้อมูลกว่า 80-90% ที่องค์กรต่างๆ จัดเก็บไว้คือ "Unstructured Data" (ข้อมูลไม่มีโครงสร้าง) ซึ่งเป็นข้อมูลที่เราพบเจอในชีวิตประจำวันเป็นส่วนใหญ่ ตั้งแต่เอกสาร, อีเมล, โพสต์บนโซเชียล ไปจนถึงวิดีโอ และ ภาพถ่าย ข้อมูลเหล่านี้ดูเหมือนจะรก และ จัดการยาก แต่กลับซ่อน "ขุมทรัพย์" ของข้อมูลเชิงลึก และ คุณค่าไว้ภายใน การทำความเข้าใจ และ นำข้อมูลประเภทนี้มาใช้ประโยชน์จึงกลายเป็นความท้าทาย และ โอกาสสำคัญของยุคดิจิทัล
  • ​Unstructured Data คืออะไร
Unstructured Data คือ ข้อมูลที่ไม่มีรูปแบบ หรือ โครงสร้างที่กำหนดไว้ล่วงหน้า ไม่เหมือนกับตารางในฐานข้อมูลที่มีคอลัมน์ และ แถวที่ชัดเจน แต่จะถูกจัดเก็บในรูปแบบดั้งเดิม ทำให้คอมพิวเตอร์ทั่วไป "ไม่เข้าใจ" เนื้อหา และ ไม่สามารถจัดระเบียบ หรือ วิเคราะห์ได้ง่ายด้วยวิธีการแบบดั้งเดิม
  • ​Unstructured Data ทำงานอย่างไร
เนื่องจากคอมพิวเตอร์ไม่เข้าใจข้อมูลประเภทนี้โดยตรง จึงต้องอาศัยเทคโนโลยีขั้นสูงในการประมวลผล
1) การจัดเก็บ: โดยปกติจะถูกเก็บไว้ใน Data Lakes หรือ ระบบไฟล์ทั่วไป ซึ่งสามารถรองรับข้อมูลทุกประเภทได้โดยไม่ต้องกำหนดโครงสร้าง
2) การเตรียมข้อมูล (Pre-processing): ทำความสะอาด จัดรูปแบบ และ เตรียมข้อมูลให้พร้อมสำหรับการวิเคราะห์
3) การวิเคราะห์ด้วย AI: ใช้เทคโนโลยีปัญญาประดิษฐ์ (AI) และ การประมวลผลภาษาธรรมชาติ (NLP) เพื่อ "อ่าน" และ "ทำความเข้าใจ" เนื้อหาของข้อมูล
4) การดึงข้อมูลเชิงลึก (Insights): ค้นหารูปแบบ, ความรู้สึก, หัวข้อ และ ความสัมพันธ์ที่ซ่อนอยู่ในข้อมูล
  • ​ประเภทของ Unstructed Data
○ ข้อความ (Text): เอกสาร, อีเมล, รายงาน, โพสต์บนโซเชียลมีเดีย, บทความ, บันทึกการสนทนา
○ สื่อ (Media): รูปภาพ, วิดีโอ, ไฟล์เสียง, เพลง, พอดแคสต์
○ ข้อมูลจากเซ็นเซอร์ (Sensor Data): ข้อมูลดิบจากอุปกรณ์ IoT ต่างๆ
○ เนื้อหาบนเว็บไซต์ (Web Content): เนื้อหาบนเว็บไซต์, บล็อก, ความคิดเห็น
○ อื่นๆ: ไฟล์ Log, สัญญาณดาวเทียม, ภาพทางการแพทย์
  • ​ประโยชน์
✅️ ได้รับข้อมูลเชิงลึกเกี่ยวกับลูกค้าอย่างลึกซึ้ง: วิเคราะห์ความรู้สึกบนโซเชียลมีเดีย, ความคิดเห็นของลูกค้า เพื่อทำความเข้าใจความต้องการ และ ความรู้สึกที่แท้จริงของลูกค้า
✅️ ค้นพบแนวโน้มและโอกาสใหม่ๆ: ระบุแนวโน้มที่เกิดขึ้นใหม่จากบทความข่าว, รายงานการวิจัย และ เนื้อหาบนเว็บไซต์
✅️ เพิ่มประสิทธิภาพระบบอัตโนมัติ: ใช้ AI จัดหมวดหมู่เอกสาร, ดึงข้อมูลสำคัญ และ สรุปเนื้อหาโดยอัตโนมัติ
✅️ ปรับปรุงการตัดสินใจ: ให้ข้อมูลพื้นฐานที่ครอบคลุม และ หลากหลาย เพื่อสนับสนุนการตัดสินใจเชิงกลยุทธ์
✅️ สร้างนวัตกรรม: เป็นพื้นฐานสำคัญในการพัฒนา AI Model ที่ทันสมัย โดยเฉพาะ Large Language Models (LLM) เช่น ChatGPT ที่ต้องใช้ข้อมูลจำนวนมหาศาลในการเรียนรู้
  • ​ตัวอย่างการใช้งาน
○ การวิเคราะห์ความรู้สึก (Sentiment Analysis) บริษัทวิเคราะห์ความคิดเห็นของลูกค้าบน X เพื่อวัดปฏิกิริยาต่อการเปิดตัวผลิตภัณฑ์ใหม่แบบเรียลไทม์
○ Chatbots และผู้ช่วยเสมือน: Chatbot เช่น ChatGPT ได้รับการฝึกฝนจากข้อมูลข้อความจำนวนมาก ทำให้สามารถเข้าใจ และ สร้างภาษาที่คล้ายมนุษย์ได้
○ การแนะนำเนื้อหา: Netflix วิเคราะห์ประวัติการรับชมของคุณ (ซึ่งเป็น Unstructured Data) เพื่อแนะนำภาพยนตร์และ รายการที่คุณน่าจะชอบ
○ ด้านการแพทย์: วิเคราะห์ภาพทางการแพทย์ (เช่น ภาพเอกซเรย์, MRI) เพื่อช่วยแพทย์ตรวจหาความผิดปกติ และ วินิจฉัยโรค
○ รถยนต์ไร้คนขับ: รถยนต์ประมวลผลวิดีโอแบบเรียลไทม์และข้อมูลจากเซ็นเซอร์ เพื่อ "มองเห็น" ถนน และ ตัดสินใจในการขับขี่
✏️ Shoper Gamer
  • ​Structured Data คืออะไร 👇
  • ​Semi-Structured Data คืออะไร 👇
  • ​Big Data คืออะไร 👇
Credit :
👇
  • ​https://www.datawow.co.th/th/blogs/structured-data-vs-unstructured-data
  • ​https://www.mongodb.com/resources/basics/unstructured-data
  • ​https://www.techtarget.com/searchbusinessanalytics/definition/unstructured-data

ดูเพิ่มเติมในซีรีส์

โฆษณา