25 ก.ค. 2023 เวลา 06:58 • วิทยาศาสตร์ & เทคโนโลยี

งานวิจัยเผย ศักยภาพของแชทบอทในการทำงานบางประเภทได้แย่ลงเมื่อเวลาผ่านไป

ในการที่จะสรุปข้อสันนิษฐานข้างต้นนี้ นักวิจัยเปรียบเทียบผลลัพธ์จากโมเดลภาษาขนาดใหญ่ (LLM) ได้แก่ GPT-3.5 และ GPT-4 ซึ่งให้บริการในเดือนมีนาคมและมิถุนายน 2023 ในเวลาเพียงสามเดือน พวกเขาสังเกตเห็นการเปลี่ยนแปลงที่สำคัญในโมเดลที่ใช้เป็นแกนหลักในการขับเคลื่อน ChatGPT
ตัวอย่างเช่น ในเดือนมีนาคม พบว่า ChatGPT-4 สามารถระบุจำนวนเฉพาะได้อย่างแม่นยำถึง 97.6% ทว่า ภายในเดือนมิถุนายน 2023 ความแม่นยำลดลงเหลือเพียง 2.4%
การทดลองดังกล่าวยังประเมินอัตราซึ่งโมเดลเหล่านี้สามารถตอบคำถามที่มีควาซับซ้อน รวมถึงวิธีการที่มันสามารถสร้างโค้ดและความสามารถในการทำ Visual Reasoning จากทักษะต่าง ๆ ที่ถูกทดทดสอบ ทางทีมงานสังเกตการณ์คุณภาพของคำตอบที่ ChatGPT สร้างซึ่งมีความแม่นยำน้อยลง แสดงให้เห็นถึงคุณภาพของโมเดลภาษาที่ถดถอย
โฆษณา