8 ส.ค. 2022 เวลา 12:00 • ธุรกิจ
#เมื่อUserถามว่าทำไมข้อมูลไม่ตรง? ❌😅
หนึ่งในคำถามที่คนสายDataต้องเจอทุกคน 555 🥲 ก็คือ #ทำไมข้อมูลในโมเดลกับของUserไม่ตรงกัน? 😤 และจะเป็นสิ่งที่หลอกหลอน👻คนทำข้อมูลที่ต้องไปไล่หาคำตอบอีกใช่ไหมละครับ? (แอดคุ้กกี้🍪เข้าใจเพราะโดนมาเหมือนกันน55😂) ส่วน #สาเหตุและแก้ไขได้ไงบ้าง? ไปลองดูกันค้าบบ 😉
1️⃣ ข้อมูลดึงจากต่างระบบกัน 🤷‍♂️🤷
User ดึงจาก #เว็บ เราสาย Data ดึงจาก #Datalake 🌊 แค่นี้ก็มีจุดที่ทำให้ข้อมูลอัพเดตไม่เท่ากันเยอะละค้าบบ 😞 เช่น ความถี่ในการอัพเดตข้อมูลที่ไม่เท่ากัน Logic ในการ input ข้อมูลที่แตกต่างกัน เป็นต้น แอดแนะนำ 👍 ให้ #ตั้งค่าความแตกต่างหรือDiff. ของข้อมูล 2 ระบบที่ยอมรับได้ 😁 เช่น 5% error เป็นต้น (เพราะเอาเวลาไปหาความต่างกินเวลาทั้งวันแน่ครับ😅)
2️⃣ ข้อมูลในโมเดลถูก Clean มาละไง 🧹
ข้อมูลที่เรานำมาวิเคราะห์ต้องผ่านการ #ETL หรือ การ Clean 🧹 ให้ข้อมูลพร้อมก่อนนำไปวิเคราะห์ใช่ไหมละครับ 😉 แค่นี้ #ขนาดของข้อมูลก็น้อยกว่าUser ละ 5555
3️⃣ ข้อมูลผ่านการคำนวนมา แล้วใส่วิธีคิดไม่ครบ 🤪
อันนี้เป็น #HumanError เลยหละครับ 😜 หลายครั้งที่เราต้องคำนวน หรือ Aggregate เพื่อให้ได้ตัวเลขที่ต้องการแถมลดไซส์ของข้อมูลไปด้วย 🤓 แต่หลายครั้งก็จะพลาดในรายละเอียดนิดหน่อย 😞 เช่น เงื่อนไขในการคำนวน Filter ที่ต้องเอาออก เป็นต้น
ปล. หวังว่าอ่านโพสต์นี้แล้วจะไม่เป็นแบบรูปนะค้าบบ 555 😁
🔥คอร์สใหม่ประจำเดือน ส.ค. !!!! กับคอร์ส #DataVisualwithPython 🐍📊 เขียนโค้ดแปลงข้อมูลเป็นรูปภาพ (ภาษาไทย) 👉https://bit.ly/3Q9eUlC
📍นี้เป็นเพจที่ให้ความรู้การวิเคราะห์ข้อมูล รับปรึกษาทุกอย่างด้านข้อมูลทั้งแบบบุคคลและร้านค้า ฟรี! ไม่มีค่าใช้จ่าย ❤️ (ดูผลงานของเพจได้ที่👉http://1ab.in/IeN)
📍เพจเรามีกลุ่ม FB ละน้าา เข้าจอยได้นะจ้ะ
#datacookie #Data #BigData #Datascience #Datascientist #Dataanalyst #Datastudio #Dataanalytics #Database #SQL #Excel
โฆษณา