27 เม.ย. เวลา 02:00 • วิทยาศาสตร์ & เทคโนโลยี

EP196 - เล่างานวิจัย: การทดสอบ LLM ด้วย metamorphic testing

EP นี้หยิบเอางานวิจัยล่าสุดที่เพิ่งได้รับตอบรับให้ตีพิมพ์มาเล่าให้ฟังครับ งานวิจัยชื่อ “Test It Before You Trust It: Applying Software Testing for Trustworthy In-context Learning” ซึ่งได้ตีพิมพ์ที่ 30th Annual International Conference on Natural Language & Information Systems (NLDB 2025) เราได้นำหลักการ metamorphic testing มาใช้เพื่อทดสอบ LLM และผลการทดสอบก็พบว่า LLM เช่น ChatGPT-4o และ Gemini-2.0-Flash ยังให้คำตอบผิดอยู่บ้างหากได้รับอินพุตที่ถูกแก้ไขด้วย metamorphic testing
เนื้อหางานจะเป็นอย่างไร ไปฟังกันใน EP นี้ครับ
โฆษณา