8 ชั่วโมงที่แล้ว • ไอที & แก็ดเจ็ต

สรุปวิธีใช้ “Gemini CLI” ลูกน้อง AI ช่วยทำงาน แบบฟรี ๆ คล้าย Claude Cowork

AI Agent คือ AI ที่ถูกพูดถึงมากช่วงนี้ เช่น Claude Cowork ที่สามารถทำงานกับไฟล์ในคอมพิวเตอร์ของเราได้ จนเหมือนกับว่าเรามีลูกน้องมาช่วยทำงานอีก 1 คน
1
รู้หรือไม่ว่า ทางฝั่งของ Gemini ก็มี AI ที่มีความสามารถคล้ายแบบนี้เหมือนกัน ชื่อว่า “Gemini CLI”
ที่สำคัญคือ ใช้งานฟรี แตกต่างจาก Claude Cowork ที่ต้องสมัครสมาชิกรายเดือน
แล้ว Gemini CLI ใช้งานอย่างไร ? ทำอะไรได้บ้าง ? MarketThink สรุปมาให้แล้ว
ทั้งโมเดล
- Gemini CLI เป็นเครื่องมือ AI ที่เปิดให้คนทั่วไปใช้ความสามารถของ Gemini Pro และโมเดล Flash บนคอมพิวเตอร์เราได้เลย
พอเป็นการติดตั้งลงเครื่องเราเลย ทำให้เราใช้ความสามารถของ Gemini กับไฟล์ต่าง ๆ ในคอมพิวเตอร์ของเราได้ด้วย
ไม่ว่าจะเป็น
สั่งให้ Gemini CLI สร้างรูปภาพ แล้วเอาเข้าไปเก็บในไฟล์ที่เรากำหนดไว้ได้
สั่งให้ Gemini CLI รวบรวมข่าวล่าสุด แล้วสรุปเป็นไฟล์ให้เราอ่านได้
1
- วิธีติดตั้งและใช้งาน Gemini CLI
ก่อนอื่นเราต้องทำความรู้จักฟีเชอร์ “Terminal” ที่คอมพิวเตอร์ทุกเครื่องทำได้กันก่อน
ฟีเชอร์ Terminal จะเป็นหน้าต่างที่เราสามารถ “พิมพ์สั่ง” เหมือนสื่อสารกับคอมพิวเตอร์ได้โดยตรง โดยมีลักษณะหน้าตาเหมือนในหนังสายลับที่ตัวละครพิมพ์โคดรัว ๆ ดูล้ำ ๆ บนหน้าจอสีดำ
1
เพราะเราจะต้องเปิด Terminal เพื่อติดตั้ง Gemini CLI ก่อนถึงจะใช้งานได้
- สำหรับ Mac
วิธีเปิด Terminal ให้กดปุ่ม Command + Spacebar จากนั้นพิมพ์คำว่า Terminal แล้วกด Enter
- สำหรับ Windows
วิธีเปิด Terminal ให้กดปุ่ม Windows แล้วพิมพ์คำว่า PowerShell
เมื่อเราเปิด Terminal ได้แล้ว ให้เราวางคำสั่งตามนี้ “npm install -g @google/gemini-cli”
จากนั้นระบบจะทำการติดตั้ง Gemini CLI ให้เราอัตโนมัติ
เมื่อติดตั้งเสร็จแล้ว ให้เราพิมพ์คำว่า “Gemini” ลงไปใน Terminal เพื่อเปิด Gemini CLI จากนั้นให้ล็อกอินบัญชี Google
เพียงแค่นี้ เราก็จะใช้งาน Gemini CLI ได้แล้วนั่นเอง
- สำหรับวิธีการใช้งาน Gemini CLI
คือให้เราพิมพ์ Prompt เป็นภาษาพูดผ่าน Terminal ได้เลย คล้าย ๆ กับการใช้งาน Generative AI ทั่วไป
ซึ่งบนเว็บไซต์ทางการของ Google บอกเอาไว้ว่า เราสามารถสั่งการ Gemini CLI ได้หลัก ๆ 7 ประเภทการใช้งาน ได้แก่
1. จัดการไฟล์/โฟลเดอร์
เราสามารถ Prompt ให้ Gemini CLI อ่าน, เขียน, ลิสต์ชื่อไฟล์, ค้นหาไฟล์ รวมถึงแก้ไขข้อความในไฟล์ได้
2. ค้นหาข้อมูล
เราสามารถ Prompt ให้ Gemini CLI ค้นหาข้อมูลผ่าน Google แล้วไปดึงเนื้อหาจากหน้าเว็บไซต์มาสรุปให้เราอ่านได้
3. วิเคราะห์โคด/โปรเจกต์
เราสามารถ Prompt ให้ Gemini CLI วิเคราะห์โครงสร้างงานในโฟลเดอร์ เพื่อหาข้อผิดพลาดได้
4. ค้นหาเนื้อหาเชิงลึก
เราสามารถ Prompt ให้ Gemini CLI สแกนหา “คำเฉพาะ” ที่ซ่อนอยู่ในไฟล์ในเครื่องของเราได้
5. สั่งงานระบบคอมพิวเตอร์
เราสามารถ Prompt ให้ Gemini CLI รันคำสั่งคอมพิวเตอร์ได้เอง เช่น รันโปรแกรมอื่น ๆ บนคอมพิวเตอร์ได้
6. บันทึกความจำ
เราสามารถ Prompt ให้ Gemini CLI จดจำข้อมูลส่วนตัวหรือสไตล์งานของเราเอาไว้ใช้ครั้งหน้าได้
7. วางแผนงาน
เราสามารถ Prompt ให้ Gemini CLI สร้างรายการสิ่งที่ต้องทำ คล้าย ๆ To Do Lists จากสิ่งที่เราเคยคุยกับ Gemini CLI ก่อนหน้านี้ได้
ที่เจ๋งก็คือ เราจะสามารถใช้ 7 แนวทางการใช้งานตรงนี้พร้อม ๆ กันในคำสั่งเดียวได้ด้วย
ยกตัวอย่างเช่น การ Prompt ว่า ค้นหาข้อมูลบน Google เกี่ยวกับข่าวการเงินวันนี้ และบันทึกข้อมูลที่น่าสนใจไว้ในไฟล์ชื่อ finance-news-today.txt
จากนั้น Gemini CLI ก็จะรวบรวมข่าวที่น่าสนใจ และทำออกมาให้เราในไฟล์ที่เรากำหนดนั่นเอง..
นอกจากนี้ Gemini CLI ยังสามารถเชื่อมต่อไปที่เครื่องมือภายนอกต่าง ๆ เช่น Google Drive, WordPress หรือแม้แต่ Canva ได้ด้วย คล้าย ๆ ความสามารถของ Claude Cowork
ถึงตรงนี้หลายคนอาจจะสงสัยว่า พอ Gemini CLI สามารถเข้าถึงไฟล์ในเครื่องของเราได้ขนาดนี้
แล้วถ้าเกิด AI เผลอไปเปลี่ยนแปลงข้อมูลสำคัญของเราเอง จะทำอย่างไร ?
คำตอบคือ ถ้าเรามีการสั่งที่ค่อนข้างเซนซิทิฟเกี่ยวกับการทำงานของคอมพิวเตอร์ อย่าง “การสร้างโฟลเดอร์” หรือ “การเขียนไฟล์”
 
Gemini CLI จะหยุดทำงานเพื่อถามหาการอนุญาตจากเราก่อนเสมอ
ดังนั้นถ้าเราไม่อนุญาต ทาง Gemini ก็จะไม่ทำงานเกินคำสั่ง
สุดท้ายนี้ ในตอนนี้ Google จะเปิดให้เราใช้ Gemini CLI ได้ฟรี ๆ แต่จะจำกัดการประมวลผลไว้ที่ 1 ล้าน Tokens
ซึ่งปกติแล้ว ถ้าเราส่งคำถามให้ AI ประมวลผล จะต้องใช้ 1 Token ต่อ 1 ตัวอักษร (ภาษาอังกฤษ) หรือถ้ารูปแบบข้อมูลเป็นรูปภาพก็จะใช้ Token ในการประมวลผลเยอะขึ้น
หมายความว่า น่าจะสามารถส่งหนังสือเป็นเล่ม ๆ ให้ AI ประมวลผลได้แบบฟรี ๆ เลยนั่นเอง..
โฆษณา