14 พ.ค. เวลา 06:12 • วิทยาศาสตร์ & เทคโนโลยี

Apple เปิดตัว FastVLM! โมเดล AI อ่านภาพเร็วขึ้น 85 เท่า

โดย
  • จุดเด่นของ FastVLM​
- โมเดล AI ใหม่จาก Apple ที่เน้นความเร็วสูงด้วยสถาปัตยกรรม FastViHD (Encoder ประมวลผลภาพ)
- เร็วขึ้น 85 เท่า ในเวลาเริ่มตอบคำตอบแรก (TTFT) และเร็วขึ้น 3.4 เท่า ในอัตราการประมวลผลภาพรวม
- เหมาะกับการประมวลผล ภาพขนาดใหญ่
  • ​รายละเอียดโมเดล
- พัฒนาจากโมเดลเดิมเช่น LLaVA-OneVision และ Qwen2-7B
- ตัวอย่างประสิทธิภาพ:
โมเดล 7B จาก Qwen2-7B เริ่มตอบคำถามเร็วขึ้น 7.9 เท่า
- คะแนนประสิทธิภาพดีกว่าโมเดลเดิมหลายชุด
  • ​การใช้งาน
- รันบน PyTorch หรือ MLX (สำหรับชิป Apple Silicon)
- เน้นปรับปรุงเฉพาะส่วน Encoder ฝั่งภาพ โดยคงโครงสร้างเดิมไว้
✏️ Shoper Gamer
  • ​สำหรับคนที่สนใจ 👇
Credit :
👇
  • ​https://www.blognone.com/node/146391
โฆษณา