กล่าวกันว่า GPT-4 สามารถรับอินพุตข้อความและรูปภาพได้ สิ่งนี้ช่วยให้ผู้ใช้สามารถระบุทั้งงานด้านการมองเห็นและภาษา ตัวอย่างเช่น ตอนนี้คุณสามารถใช้เอกสารที่มีข้อความพร้อมรูปถ่าย ไดอะแกรม หรือแม้แต่ภาพหน้าจอ - ผลลัพธ์ที่สร้างขึ้นใช้ข้อมูลเริ่มต้นทั้งหมดเพื่อสร้างคําตอบตามข้อมูลที่มีอยู่ทั้งหมด (ลองส่งภาพตลกๆ และขอให้ AI บอกว่าอะไรทําให้ภาพนี้น่าขบขัน)