8 มี.ค. เวลา 03:22 • วิทยาศาสตร์ & เทคโนโลยี

Alibaba Cloud เปิดตัว QwQ-32B เทียบชั้น DeepSeek-R1

โดย
Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ LLM ชื่อ QwQ-32B (ควิว) รุ่นจริง หลังจากเปิดตัวรุ่นพรีวิวเมื่อปลายปี 2024
○ โมเดลนี้มีคะแนนทดสอบดีขึ้นอย่างชัดเจน จนมีประสิทธิภาพใกล้เคียงกับ DeepSeek-R1 ซึ่งมีขนาดใหญ่กว่าถึง 20 เท่า
○ ทีมงานฝึก QwQ โดยเริ่มจากปัญหาคณิตศาสตร์ และ การเขียนโปรแกรม เพื่อให้สามารถใช้ reinforcement learning (RL) ได้อย่างมีประสิทธิภาพ
○ จากนั้นจึงฝึกเพิ่มความสามารถด้านอื่นๆ เช่น การใช้เครื่องมือ โดยไม่กระทบความสามารถหลักด้านการเขียนโปรแกรม
○ QwQ-32B มีประสิทธิภาพเหนือกว่า DeepSeek-R1 รุ่นที่ฝึกต่อจาก Qwen-32B
○ โมเดลนี้สามารถใช้งานได้บนคอมพิวเตอร์ขนาดเล็ก และ เปิดให้ใช้งานอย่างเสรี
○ หุ้น Alibaba เพิ่มขึ้นถึง 8% หลังจากการเปิดตัว QwQ-32B
✏️ Shoper Gamer
Credit :
👇
  • ​https://www.blognone.com/node/145121​
  • ​https://qwenlm.github.io/blog/qwq-32b/
โฆษณา