1 พ.ค. เวลา 13:39 • วิทยาศาสตร์ & เทคโนโลยี

Tencent เปิดตัวโมเดล Hy3 ใช้ RL ที่สร้างเอง เปิด API ราคาเริ่มต้น 1.2/4 หยวน

โดย
Tencent เปิดตัวโมเดลตระกูล Hy3 (Hunyuan 3) ขนาด 295B-A21B รองรับ context 256K ซึ่งอาศัยโครงสร้างการฝึกแบบ Reinforcement Learning (RL) ที่ Tencent ออกแบบขึ้นมาเอง
  • ​รายละเอียดสำคัญ
- ขนาด : 295B-A21B (เล็กกว่า GLM-5 และ Kimi-K2.5 ที่ใช้อ้างอิง)
- context : 256K โทเค็น
- การทดสอบ : ทีมงานลดการพึ่งเทียบกับ benchmark มาตรฐาน เนื่องจากเห็นว่าถูกโกงได้ง่าย → สร้างชุดทดสอบภายในที่เป็นข้อสอบใหม่ล่าสุดแทน
- ประสิทธิภาพ : ตามรายงานสามารถเทียบชั้น GLM-5/Kimi-K2.5 ได้
- ขนาดเล็กกว่า สะท้อนต้นทุนการรันที่ถูกกว่า
  • ​การให้บริการ
- พร้อมใช้งานผ่านช่องทางของ Tencent
- เปิด API ราคาเริ่มต้น 1.2 หยวน/4 หยวน ต่อล้านโทเค็น (อินพุต/เอาต์พุต)
✏️ Shoper Gamer
  • ​Reinforcement Learning คืออะไร 👇
Credit :
👇
  • ​https://www.blognone.com/node/150402
  • ​https://hy.tencent.com/research/hy3
โฆษณา