8 ส.ค. 2022 เวลา 15:19 • การศึกษา
วิธีการเก็บข้อมูล: Census or Sampling
Census: การสำมะโนเป็นการสำรวจข้อมูลระดับประชากรในประเด็นที่ผู้สำรวจสนใจทุกรายการ เช่น สำมะโนธุรกิจอุตสาหกรรม ซึ่งจัดทำทุก 5 ปี โดยสำนักงานสถิติแห่งชาติ ที่ www.nso.go.th/sites/2014/Pages/สำมะโนอุตสาหกรรม/2560/สำมะโนอุตสาหกรรม2560.aspx รายการข้อมูลชุดนี้ทำให้ประเทศมีข้อมูลพื้นฐานด้านเศรษฐกิจอย่างต่อเนื่อง แต่การเก็บข้อมูลจำนวนมากต้องใช้เวลาและทรัพยากรมากเช่นกัน งานศึกษาวิเคราะห์ทางสถิติส่วนใหญ่จึงใช้ข้อมูลจากการสุ่มตัวอย่าง
Sampling: กลุ่มตัวอย่างที่ดีควรมีลักษณะสอดคล้องกับกลุ่มประชากร เพื่อให้ค่าสังเกต หรือค่าวัดตัวแปรที่แสดงคุณลักษณะต่างๆ ที่ได้จากข้อมูลของกลุ่มตัวอย่าง สะท้อนถึงคุณสมบัติของประชากรที่สนใจได้ใกล้เคียงกันมากที่สุด เช่น หากสนใจศึกษาว่าบัณฑิตของคณะพาณิชย์ฯ ที่จบการศึกษาไปในช่วงไม่เกิน 4 ปีที่ผ่านมา ทำงานในธุรกิจอุตสาหกรรมใดบ้าง แสดงว่าประชากรที่ศึกษาคือผู้จบการศึกษาจากคณะฯ ภายในช่วงเวลาดังกล่าว ซึ่งมีสัดส่วนเป็นเพศหญิงมากกว่าเพศอื่นๆ
เมื่อสุ่มตัวอย่าง เราก็ควรจะได้รายการตัวอย่างที่มีสัดส่วนเพศหญิงสูงกว่า หรือมีค่าใกล้เคียงกับค่าสัดส่วนที่หาได้จากรายชื่อบัณฑิตที่จบการศึกษาจริง ซึ่งคณะฯ ทราบค่าสัดส่วนนี้ได้จากข้อมูลประชากรในฐานข้อมูลผู้จบการศึกษา ในกรณีนี้ จึงใช้ค่าสัดส่วนเพศชาย-หญิงเป็นเกณฑ์เปรียบเทียบความสอดคล้องระหว่างกลุ่มตัวอย่างและประชากรได้
วิธีการสุ่มตัวอย่างให้ได้กลุ่มตัวอย่างที่มีลักษณะคล้ายกลุ่มประชากรมากที่สุด ก็คือการเปิดโอกาสให้สมาชิกแต่ละหน่วยของประชากรมีโอกาสถูกเลือกเป็นสมาชิกของกลุ่มตัวอย่างด้วยความน่าจะเป็นเท่าๆ กัน ด้วยเหตุนี้ วิธีการคัดเลือกตัวอย่างจึงแบ่งได้เป็น 2 ประเภท คือ 1) Non-statistical sampling และ 2) Statistical sampling
1) Non-statistical sampling หรือ Non-probability sampling เป็นวิธีการสุ่มตัวอย่างที่อาจทำให้ได้กลุ่มตัวอย่างที่มีลักษณะต่างจากประชากร การสุ่มด้วยวิธีนี้ไม่ได้ให้ความสำคัญกับหลักการที่กำหนดให้สมาชิกทุกรายการของประชากรได้รับโอกาสถูกเลือกเป็นตัวอย่างด้วยความน่าจะเป็นเท่าๆ กัน
ทั้งนี้ ความลำเอียงในการเลือกตัวอย่างอาจเกิดขึ้นไม่ว่าจะโดยตั้งใจหรือไม่ก็ตาม และข้อมูลที่ได้จากการสุ่มตัวอย่างประเภทนี้ไม่เหมาะกับการนำข้อมูลมาวิเคราะห์โดยใช้หลักสถิติ ยกเว้นแต่ผู้วิเคราะห์ได้อธิบายเหตุผลความจำเป็น และได้ทดสอบความสอดคล้องของตัวอย่างและประชากรซึ่งเป็นข้อตกลงพื้นฐานในการวิเคราะห์ขั้นสูง การสุ่มตัวอย่างที่อาจนำให้เกิดอคตินี้ มี 2 วิธี คือ
1.1) Accidental หรือ Convenience sampling หมายถึงการเลือกตัวอย่างตามความสะดวก เข้าถึงแหล่งข้อมูลด้วยความบังเอิญหรือสะดวก โดยการแจกแบบสอบถามหน้าที่หน้าร้าน หรือส่งต่อผ่านช่องทางอิเลกทรอนิกส์และ Social media วิธีนี้จึงมีความเสี่ยงว่าคุณลักษณะของตัวอย่างที่ได้อาจไม่ใช่ตัวแทนที่ดีของกลุ่มประชากรที่สนใจ
1.2) Purposive sampling เป็นวิธีการเลือกตัวอย่าง โดยมีวัตถุประสงค์เฉพาะ ซึ่งไม่จำเป็นว่าสมาชิกทุกรายการของประชากรควรได้รับโอกาสถูกเลือกเท่าๆ กัน วิธีการในกลุ่มนี้ ได้แก่ การขอทราบความเห็นจากผู้เชี่ยวชาญ การจำกัดโควต้าผู้ให้ข้อมูล (Quota sampling) โดยกำหนดจำนวนของตัวอย่างด้วยเงื่อนไขบางอย่าง เช่น ความเร็วและช่องทางในการตอบรับ และการส่งต่อแบบเจาะจงผู้รับ (Snowball sampling) โดยให้ผู้ตอบแบบสอบถามระบุผู้ที่ตนเองเห็นว่าควรเป็นผู้ให้ข้อมูลเป็นลำดับถัดไป และทำเช่นนี้ต่อกันเป็นลำดับ
2) Statistical sampling หรือ Probability sampling หมายถึงการเลือกตัวอย่างโดยให้ความสำคัญกับสมาชิกทุกรายการในกลุ่มประชากรว่าจะมีโอกาสได้รับการสุ่มเลือกเป็นกลุ่มตัวอย่างด้วยความน่าจะเป็นเท่าๆ กัน กลุ่มตัวอย่างที่ได้จึงมีแนวโน้มจะเป็นตัวแทนที่ดีของกลุ่มประชากร วิธีการเลือกตัวอย่างในกลุ่มนี้ แยกย่อยเป็น 4 วิธี คือ Simple random sampling, Stratified sampling, Cluster sampling และ Systematic sampling
2.1) Simple random sampling: การสุ่มอย่างง่าย หมายถึงการสุ่มตัวอย่างตามจำนวนชิ้นตัวอย่างที่ต้องการจากประชากรทั้งหมด โดยไม่เจาะจงหรือเปิดโอกาสให้สมาชิกหน่วยใดในกลุ่มประชากรถูกเลือกขึ้นมาเป็นพิเศษ เราเรียกจำนวนตัวอย่างที่กำหนดไว้นี้ว่าขนาดตัวอย่าง (Sample size, n) แม้จะมีชื่อเรียกว่าสุ่มอย่างง่าย แต่ที่จริง วิธีมีแนวทางดำเนินงานเป็นขั้นตอน เพื่อป้องกันความลำเอียงที่อาจเกิดขึ้นจากการสุ่มตัวอย่าง (Sampling bias) ดังนี้
1) กำหนดขอบเขตของประชากรที่ต้องการศึกษา เช่น แหล่งข้อมูล ช่วงเวลา
2) กำหนดลำดับเลขที่ให้กับรายการของข้อมูลประชากร หรือใช้ลำดับเลขที่รายการของชุดข้อมูลจริง เช่น เลขที่ใบเสร็จรับเงิน เลขประจำตัวบุคลากร
3) กำหนดจำนวนตัวอย่างที่ต้องการ (อธิบายวิธีคำนวณในบทที่ 5)
4) สร้างรายการตัวอย่างที่ถูกเลือกอย่างสุ่มให้ได้จำนวนครบตามขนาดตัวอย่าง ด้วยการจับฉลากเลขที่รายการข้อมูล หรือใช้ฟังก์ชั่น Random Number ของโปรแกรมช่วยคำนวณ เช่น MS Excel เพื่อระบุเลขที่รายการข้อมูล
5) เก็บตัวอย่างตามลำดับรายการที่สร้างขึ้นจนครบจำนวน
เงื่อนไขในการสุ่มอย่างง่ายด้วยวิธีการที่ถูกต้องคือ เราจำเป็นต้องทราบจำนวนประชากรและระบุสมาชิกของประชากรได้ทุกรายการ การระบุขอบเขตประชากรที่ชัดเจนจึงมีความสำคัญ หลักการสุ่มอย่างง่ายจึงถูกนำไปประยุกต์เป็นแนวทางในการเลือกตัวอย่างโดยคำนึงถึงความน่าจะเป็นแบบอื่นๆ ดังนี้
2.2) Stratified sampling: การสุ่มแบบแบ่งชั้นภูมิ คือการสุ่มตัวอย่างจากประชากรที่ถูกแบ่งเป็นกลุ่มย่อย โดยที่แต่ละกลุ่มมีคุณลักษณะบางอย่างร่วมกัน เรียกกลุ่มลักษณะนี้ว่า Strata เช่น แบ่งผู้บริโภคโดยใช้เกณฑ์รายได้ หรืออายุ แบ่งปริมาณการผลิตโดยแยกตามเครื่องจักรที่ใช้ในสายการผลิต เมื่อแบ่งกลุ่มแล้วจึงใช้วิธีสุ่มอย่างง่ายเพื่อเก็บตัวอย่างจากประชากรที่เป็นสมาชิกในแต่ละกลุ่มย่อย ให้ได้จำนวนตัวอย่างเป็นสัดส่วนกับขนาดของกลุ่ม
2.3) Cluster sampling: การสุ่มแบบแบ่งเขต คือการสุ่มตัวอย่างจากประชากรที่แบ่งเป็นกลุ่มย่อย โดยไม่เจาะจงเงื่อนไขว่าสมาชิกของกลุ่มย่อยต้องมีคุณสมบัติใดที่เหมือนกัน จึงถือเสมือนว่าสมาชิกของกลุ่มย่อยแต่ละกลุ่มมีลักษณะเหมือนกับประชากรกลุ่มใหญ่ หลังจากแบ่งกลุ่มแล้วจึงใช้วิธีสุ่มอย่างง่ายเพื่อเลือกกลุ่ม ตัวอย่างที่ได้คือสมาชิกของกลุ่มที่ถูกเลือก เกณฑ์ที่ใช้แบ่งกลุ่มสำหรับวิธีนี้มักจะเป็นเกณฑ์พื้นที่ เช่น ลูกค้าเขตภาคเหนือ ใต้ ตะวันออก ตะวันตก และภาคกลาง เพื่อลดค่าใช้จ่ายในการเข้าถึงและรวบรวมตัวอย่าง
2.4) Systematic sampling: การสุ่มอย่างเป็นระบบ คือการสุ่มตัวอย่างโดยเลือกตัวอย่างชิ้นแรกด้วยวิธี Simple random sampling และกำหนดเกณฑ์ในการเลือกชิ้นตัวอย่างถัดไปด้วยเกณฑ์เดียวกันให้เป็นช่วงเวลาหรือลำดับที่สม่ำเสมอ เช่น ทุกๆ ชิ้นที่ 24 หรือ ทุกๆ 55 นาทีถัดไป จนกระทั่งได้ตัวอย่างครบจำนวนตามต้องการ
ถ้าเป็นการสุ่มตัวอย่างจากประชากรที่มีขนาดจำกัด เราจะคำนวณช่วงระยะเวลาที่เว้นนี้ จากค่าสัดส่วนของจำนวนประชากรต่อขนาดตัวอย่างที่ต้องการ เพื่อให้สามารถรวบรวมข้อมูลจากตัวอย่างได้ครบจำนวนภายในเวลาที่กำหนด
ในกรณีที่เป็นการสุ่มตัวอย่างจากประชากรที่เพิ่มขึ้นตลอดเวลา เช่น ในการสุ่มตรวจความคลาดเคลื่อนในการผลิตชิ้นงาน สุ่มสำรวจปัญหา หรือระยะเวลาในการให้บริการลูกค้า เราสามารถใช้หลัก Systematic sampling สร้างตารางเก็บข้อมูลประจำวัน โดยแต่ละวันมีจุดเวลาเริ่มต้นแตกต่างกัน เพื่อให้ได้ตารางเก็บข้อมูลที่ใช้งานได้ต่อเนื่อง ช่วยลดอคติที่อาจเกิดขึ้นเมื่อผู้ได้รับมอบหมายให้ทำหน้าที่รวบรวมข้อมูล เลือกเก็บช้อมูลเฉพาะเวลาที่สะดวก หรือให้ความสนใจกับผู้ปฏิบัติงานคนใดคนหนึ่ง
ข้อมูลที่ใช้ในการวิเคราะห์ทางสถิติควรได้มาจากการสุ่มตัวอย่างโดยคำนึงถึงความน่าจะเป็น เพื่อลดความลำเอียงในการได้มาซึ่งชิ้นตัวอย่างอันอาจทำให้ได้ผลการวิเคราะห์คลาดเคลื่อนจากความเป็นจริง
ในกรณีที่ประชากรมีขนาดเล็กเมื่อเทียบกับจำนวนตัวอย่างที่ใช้ การสุ่มตัวอย่างนั้นจะต้องเป็นการสุ่มแบบคืนที่ แต่บ่อยครั้งเครื่องมือที่ใช้ในการสุ่มตัวอย่าง คือการสำรวจโดยใช้แบบสอบถาม ซึ่งผู้ตอบมักตอบเพียงครั้งเดียว การเก็บข้อมูลนี้จึงมีลักษณะเข้าได้กับการสุ่มตัวอย่างแบบไม่คืนที่
ดังนั้น เราควรกำหนดขอบเขตประชากรที่ศึกษาและขนาดตัวอย่างให้เหมาะสมเพื่อป้องกันความลำเอียงที่อาจเกิดขึ้น การกำหนดขนาดตัวอย่าง และการแก้ปัญหาอื่นๆ ที่เกี่ยวข้องกับการใช้ข้อมูลจากกลุ่มตัวอย่างเพื่อศึกษาคุณลักษณะของประชากร จะอธิบายในบทที่ 5
จบแล้ววว ยาวเนอะ 😉
โฆษณา