26 ก.ย. 2023 เวลา 06:10 • วิทยาศาสตร์ & เทคโนโลยี

Ep. 12 | ความตรง (Validity): ค่าบอกความใช่ของเครื่องมือวัด

👉
ในบทความก่อน (Ep. 11) เราพูดถึงความเที่ยง (reliability) ซึ่งเป็นหนึ่งในสองลักษณะทางไซโคเมทริก (psychometric) ที่สำคัญของเครื่องมือวัดทางจิตวิทยา (psychological measurement tool)
ในบทความนี้ เราจะมาพูดถึงนิยามและการประเมินความตรง (validity) ซึ่งเป็นลักษณะทางไซโคเมทริกขั้นพื้นฐานที่สอง
📘 1. นิยาม ลักษณะเด่น และความสำคัญ
.
🧐 1.1. นิยาม
ความตรง คือ ความสามารถของเครื่องมือวัดในการประเมินสิ่งที่ถูกออกแบบมาให้ประเมิน
เช่น แบบทดสอบความฉลาด (intelligence test) จะมีความตรงก็ต่อเมื่อสามารถวัดความฉลาด (intelligence) ได้ และไม่มีความตรงถ้าไม่สามารถวัดความฉลาดได้
.
😲 1.2. ความแตกต่างระหว่างความเที่ยงและความตรง
ความตรงแตกต่างกับความเที่ยงว่า ความเที่ยงบอกเราได้ว่า เครื่องมือวัดสามารถประเมินลักษณะทางจิตวิทยา (psychological characteristics) ใด ๆ ได้ดีขนาดไหน แต่ความตรงจะบอกเราว่า ลักษณะที่เครื่องมือวัดได้ คือ สิ่งที่เราต้องการหรือไม่
.
🤔 1.3. ความสำคัญ
ความตรงมีความสำคัญต่อการประเมินทางจิตวิทยา (psychological test) เพราะช่วยบอกได้ว่า ผลลัพธ์จากเครื่องมือวัด (เช่น คะแนนบุคลิกภาพ) สะท้อนถึงสิ่งที่เราต้องการวัดขนาดไหน และเราสามารถตีความจากผลลัพธ์ของเครื่องมือได้ขนาดไหน
เช่น หากแบบทดสอบความฉลาดมีความตรงสูง (สะท้อนถึงความฉลาดได้ดี) เราสามารถมั่นใจได้ว่า คะแนนที่ได้จากเครื่องมือวัดนี้สะท้อนถึงความฉลาดของคนที่ทำแบบทดสอบ และเรายังสามารถทำนายพฤติกรรมต่าง ๆ ที่เกี่ยวข้องกับความฉลาดของคนคนนี้ได้อีกด้วย (เช่น ผลการเรียน)
ในทางกลับกัน หากแบบทดสอบมีความตรงต่ำ เราไม่อาจมั่นใจได้ว่า คะแนนสะท้อนถึงความฉลาดของผู้ทำแบบประเมิน แต่อาจสะท้อนถึงลักษณะอื่น ๆ (เช่น แรงจูงใจตอนทำแบบทดสอบ) และเราไม่สามารถทำนายพฤติกรรมที่เกี่ยวข้องกับความฉลาดได้อย่างเต็มที่ (ไม่สามารถบอกได้ว่า คนคนนี้จะได้ผลการเรียนดีขนาดไหน)
📏 2. การประเมินความตรง
เราจะรู้ได้ยังไงว่า เครื่องมือวัดของเรามีความตรง (สามารถวัดสิ่งที่เราต้องการวัดได้จริง) โดยเฉพาะว่า สิ่งที่เราต้องการวัดเป็นสิ่งที่มองไม่เห็น (เช่น บุคลิกภาพ ความฉลาด)?
เราสามารถทำได้ 3 วิธี ดังนี้
.
Content validity มาจากการประเมินโดยผู้เชี่ยวชาญ (รูป: Image by pressfoto on Freepik)
😎 2.1. ประเมินจากเนื้อหา (Content) ของเครื่องมือวัด: Content Validity และ Face Validity
ความตรงที่ประเมินจากเนื้อหาของเครื่องมือวัด เรียกว่า content validity ซึ่งได้จากการพิจารณาของผู้เชี่ยวชาญว่า เครื่องมือวัดมีเนื้อหาที่ครอบคลุมสิ่งที่ต้องการจะวัดหรือไม่
เช่น เราต้องการพัฒนาแบบทดสอบความฉลาดและต้องการรู้ content validity, เราสามารถให้ผู้เชี่ยวชาญเรื่องความฉลาดมาพิจารณาว่า ข้อคำถาม (item) ที่ใช้ในแบบทดสอบมีความเกี่ยวข้องและครอบคลุมทุกมิติของความฉลาดหรือไม่
สมมุติว่า ความฉลาดประกอบด้วยความสามารถในการใช้เหตุผลและความรู้ทางภาษา แบบทดสอบของเราก็ควรข้อคำถามเกี่ยวกับตรรกะและการใช้ภาษา ถึงจะมี content validity ที่สมบูรณ์
Content validity มีความใกล้เคียงกับ face validity ซึ่งเป็นความเที่ยงที่ไม่ได้ประเมินโดยวิธีการทางสถิติเหมือนกัน อย่างไรก็ตาม ความแตกต่างระหว่าง content validity และ face validity คือ content validity เป็นการประเมินโดยผู้เชี่ยวชาญ แต่ face validity เป็นการประเมินว่า เครื่องมือวัดดูเหมือนกำลังวัดในสิ่งที่ต้องการหรือเปล่า ในสายตาคนทั่วไป
เครื่องมือวัดที่มี content validity อาจไม่มี face validity ได้ เช่น name letter test* ซึ่งเป็นเครื่องมือวัดที่ให้คนให้คะแนนตัวอักษร (เช่น บอกว่า ชอบตัว A, B, C, … ขนาดไหน) ซึ่งหากมองผ่าน ๆ เครื่องมือนี้อาจดูไม่เหมือนเครื่องมือวัดทางจิตวิทยา (มี face validity ต่ำ) แต่จริง ๆ แล้วเครื่องมือนี้สามารถวัด self-esteem ได้ (มี content validity เพราะหลักการประเมินเป็นไปตามทฤษฎี)
ในการพัฒนาเครื่องมือวัดอย่างจริงจัง เราควรให้ความสนใจกับ content validity มากกว่า face validity เพราะ เป็นการประเมินจากผู้เชี่ยวชาญ
อย่างไรก็ตาม face validity มีความสำคัญต่อประสิทธิภาพของเครื่องมือเช่นกัน เช่น แบบทดสอบที่ดูเหมือนกำลังวัดในสิ่งที่บอกว่าวัด อาจทำให้คนที่ทำแบบทดสอบมีแรงจูงใจที่จะทำแบบทดสอบให้จบ เป็นต้น
ทั้งนี้ การประเมินความตรงมีข้อจำกัดว่า ขอบเขตของเนื้อหาที่ควรถูกรวมอยู่ในเครื่องมือวัดอาจไม่มีความชัดเจน ทำให้ไม่สามารถบอกได้อย่างแน่ชัดว่า เครื่องมือมี content validity ดีขนาดไหน
นอกจากนี้ เรายังไม่สามารถบอกได้ว่า เครื่องมือสามารถประเมินสิ่งที่เราต้องการได้มากขนาดไหน เพราะสิ่งที่เรารู้จาก content validity คือ เครื่องมือมีเนื้อหาที่ครอบคลุมไหม ดังนั้น ในการพัฒนาเครื่องมือ เราควรประเมินความตรงด้วยวิธีอื่นด้วย
.
Construct validity ดูจากความสัมพันธ์กับเครื่องมือวัดอื่น (รูป: Image by Freepik)
👷‍♂️ 2.2. ประเมินจากความสัมพันธ์ของผลลัพธ์จากเครื่องมือวัดและผลลัพธ์ของเครื่องมือวัดอื่น ๆ: Construct Validity
อีกวิธีการหนึ่งที่เราจะบอกได้ว่า เครื่องมือมีความตรงหรือไม่ คือ การดูความสัมพันธ์ของผลลัพธ์จากเครื่องมือ กับผลลัพธ์จากเครื่องมืออื่น ๆ
เช่น เราต้องการพัฒนาแบบทดสอบความฉลาด และเรารู้ว่า ความฉลาดมีความเกี่ยวข้องกับความสามารถทางภาษา เราก็สามารถนำคะแนนของแบบทดสอบความฉลาดมาเปรียบเทียบกับคะแนนแบบทดสอบภาษา เพื่อหาความตรงได้ โดยถ้าคะแนนของทั้งสองแบบทดสอบเป็นไปในทิศทางที่เราตั้งสมมุติฐานไว้ (เช่น สูงไปในทิศทางเดียวกัน) เราก็อาจบอกได้ว่า แบบทดสอบความฉลาดของเรามีความตรง
ความตรงที่ได้จากการประเมินแบบนี้เรียกว่า construct validity
ทั้งนี้ construct validity แบ่งได้เป็น 2 ประเภท
(1) convergent validity หรือความตรงที่ประเมินโดยดูว่า ผลลัพธ์ของเครื่องมือมีความสัมพันธ์ที่มีนัยสำคัญกับเครื่องมือวัดอื่น ๆ ที่ควรจะมีความสัมพันธ์ด้วยหรือไม่
เช่นตัวอย่างข้างต้นที่เราพิจารณาความตรงของแบบทดสอบความฉลาดด้วยการดูความสัมพันธ์กับความสามารถทางภาษา ซึ่งในทางทฤษฎีระบุว่าเป็นสิ่งที่เกี่ยวข้องกับความฉลาด
(2) discriminant validity หรือความตรงที่ประเมินโดยดูว่า ผลลัพธ์ของเครื่องมือไม่ม่ความสัมพันธ์ที่มีนัยสำคัญกับเครื่องมือวัดที่ไม่ควรเกี่ยวข้อง
เช่น ถ้าความฉลาดไม่มีความเกี่ยวข้องกับเพศ แบบทดสอบความฉลาดจะมี discriminant validity ได้ก็ต่อเมื่อคะแนนไม่มีความสัมพันธ์กับเพศของผู้ทำแบบทดสอบ (เช่น ผู้ชายได้คะแนนสูงกกว่าผู้หญิง)
.
Criterion validity ดูจากความสัมพันธ์กับผลลัพธ์ (รูป: Image by Freepik)
🌡️ 2.3. ประเมินจากความสัมพันธ์ของผลลัพธ์จากเครื่องมือวัดและพฤติกรรมอื่น ๆ: Criterion Validity
วิธีสุดท้ายในการประเมินความตรง คือ การพิจารณาความสัมพันธ์ของผลลัพธ์จากเครื่องมือวัดกับพฤติกรรมหรือผลลัพธ์ในชีวิตต่าง ๆ (เช่น พฤติกรรมการเรียน ผลการเรียน)
ซึ่งความตรงที่ได้จากการประเมินนี้เรียกว่า criterion validity และแบ่งได้เป็น 2 ประเภท คือ
(1) concurrent validity ซึ่งพิจารณาโดยการดูความสัมพันธ์ของผลลัพธ์จากเครื่องมือวัดและพฤติกรรมที่เกิดขึ้นในเวลาเดียวกับการวัด (เช่น ดูคะแนจากแบบทดสอบความฉลาดและคะแนนสอบภาคปลายที่ได้มาจากการทดสอบในครั้งเดียวกัน)
(2) predictive validity ซึ่งพิจารณาโดยดูจากความสัมพันธ์ของผลลัพธ์จากเครื่องมือวัดและพฤติกรรมที่เกิดขึ้นในเวลาต่อมา (เช่น ดูคะแนจากแบบทดสอบความฉลาดและคะแนนสอบภาคปลายที่ได้มาในอีก 1 เดือนให้หลัง)
🙏 3. สรุปความตรง
ความตรงสะท้อนให้เห็นถึงความสามารถของเครื่องมือในการวัดลักษณะทางจิตวิทยาที่เราต้องการ
โดยการประเมินความตรงทำได้ 3 วิธี
(1) Content validity: พิจารณาความเกี่ยวข้องและครอบคลุมของเนื้อหาของเครื่องมือวัด (โดยผู้เชี่ยวชาญ)
(2) Construct validity: พิจารณาจากความสัมพันธ์ระหว่างผลลัพธ์จากเครื่องมือวัด และผลลัพธ์ของเครื่องมือวัดอื่นที่มีความเกี่ยวข้อง (convergent validity) และไม่เกี่ยวข้อง (discriminant validity)
(3) Criterion validity: พิจารณาจากระเมินจากความสัมพันธ์ของผลลัพธ์จากเครื่องมือวัดและพฤติกรรมที่เกิดขึ้นในเวลาเดียวกัน (concurrent validity) หรือในเวลาต่างกัน (predictive validity)
⚡ หมายเหตุ
* สำหรับคนที่สนใจเกี่ยวกับ name letter test สามารถอ่านเพิ่มเติมได้จาก Nuttin (1985)
#psychology #individualdifferences #personality #psychometrics #psychometricproperties #validity #contentvalidity #facevalidity #constructvalidity #convergentvalidity #discriminantvalidity #criterionvalidity #concurrentvalidity #predictivevalidity #จิตวิทยา #บุคลิกภาพ #ไซโคเมทริก #ความตรง
📃 อ้างอิง
Nuttin, J. M. (1985). Narcissism beyond Gestalt and awareness: The name letter effect. European Journal of Social Psychology, 15(3), 353–361. https://doi.org/10.1002/ejsp.2420150309
📃 สรุปเนื้อหาจาก:
Ashton, M. C. (2023). Basic concepts in psychological measurement. In Individual Differences and Personality (pp. 1–29). Elsevier. https://doi.org/10.1016/B978-0-323-85950-9.00003-0
Furr, R. M., & Bacharach, V. R. (2014). Psychometrics: An introduction (2nd ed.). SAGE Publications.
Sireci, S. G., & Sukin, T. (2013). Test validity. In K. F. Geisinger, B. A. Bracken, J. F. Carlson, J.-I. C. Hansen, N. R. Kuncel, S. P. Reise, & M. C. Rodriguez (Eds.), APA handbook of testing and assessment in psychology, Vol. 1. Test theory and testing and assessment in industrial and organizational psychology (pp. 61–84). American Psychological Association. https://doi.org/10.1037/14047-004
ภาพปก: Image by azerbaijan_stockers on Freepik
โฆษณา