เปรียบเทียบ AI Language Model ตัวบน: Claude 3 Opus, GPT-4 และ Gemini Ultra 1.0

Nopnithi Khaokaew (Game)
2 min readMar 17, 2024

--

Introduction

ในช่วงหนึ่งอาทิตย์ที่ผ่านมาผมได้ใช้ Claude 3 Opus อย่างเอาเป็นเอาตาย (ก็ตั้งแต่เช้ายันตี 2-3) เพื่อทดสอบความสามารถของมันในงานที่ผมทำอยู่ไม่ว่าจะเป็นด้าน development, infrastructure/DevOps และภาษา โดยเทียบกับคู่แข่งอย่าง GPT-4 และ Gemini Ultra 1.0

ตอนแรกผมคิดว่า Claude 3 Opus จะเก่งกว่า GPT-4 เฉพาะในด้านภาษาที่เป็น non-English แค่นั้น แต่เมื่อใช้งานไปเรื่อย ๆ กลับพบว่า Claude 3 Opus เก่งกว่าในมิติอื่น ๆ ด้วย สามารถทำงานได้ครอบคลุมและให้ผลลัพธ์ที่ถูกต้องตรงตาม prompt มากกว่า

ตัวอย่างการใช้งาน

  • Development (50%) เช่น Go, Python, TypeScript, Javascript, HTML, CSS, Tailwind, Astro และอื่น ๆ
  • Infrastructure/DevOps (30%) เช่น Git, GitHub Actions (CI/CD), AWS, Docker, Kubernetes และอื่น ๆ
  • ภาษา (20%) เช่น การเขียนหรือแปลระหว่างภาษาไทยกับภาษาอังกฤษ

หนึ่งในตัวอย่างจากหลักร้อยเรื่องที่ผมได้ลอง คือผมยัด project code ทั้งก้อนที่ผมกำลังพัฒนาอยู่ด้วย Astro, Typescript และ Tailwind เข้าไป และให้ AI ทั้ง 3 ช่วย convert เจ้า popup ที่ผมเคยพัฒนาด้วย HTML5, Bootstrap 5 และ Javascript มา integrate เข้ากับ project ที่ผมพัฒนาอยู่

ด้วย prompt เดียวกัน (clear and concise):

  • Claude 3 Opus สามารถได้ผลลัพธ์ตามต้องการถึง 90%
  • ขณะที่ GPT-4 ได้แค่ 60% คือได้ HTML ที่ปรับมาใช้ Tailwind แต่ไม่ได้จัดตำแหน่งให้, เพิ่ม close button เข้ามาโดยไม่จำเป็น, ไม่ได้ปรับ Javascript และยังคงใช้ CSS เดิมบางส่วนอยู่ 😅
  • ส่วน Gemini Ultra 1.0 นั้นห่างไกลจาก requirement ที่สุด

ข้อเสียของ Claude 3 Opus

นอกจากเรื่องความเร็วของมันแล้ว ผู้ใช้ทั่วไปที่ใช้งานผ่านเว็บ (chat) จะลำบากกว่าการใช้ ChatGPT หรือ Gemini มาก (Anthropic คงไม่ได้เน้น 😂) เพราะยังขาดฟีเจอร์อีกเพียบเมื่อเทียบกับ ChatGPT

แต่ถ้าใครนำ API ไปพัฒนาต่อเป็น chat หรือ tool ของตัวเองอันนี้หวานเลยครับ

Conclusion

(คงไม่ต้องพูดถึง GPT-4 ละเนอะ) หลังจากที่ผมลองใช้ Gemini Ultra 1.0 มาเป็นเวลาเดือนกว่า ผมคิดว่ายังไม่ค่อยโอเคและผมคงไม่จ่ายเงินให้หลังหมด trial

สำหรับผมข้อดีของ Gemini Ultra 1.0 มีแค่เรื่องความเร็วและการจัดโครงสร้างคำตอบได้ดีแม้เราจะใช้ prompt ไม่ดีนัก ซึ่งบน model อื่น ๆ ก็สามารถแก้ไขได้ด้วยการ craft prompt ให้ดี (หรือบน ChatGPT ก็สามารถใช้ custom instructions ช่วยได้)

ส่วน Claude 3 Opus นี่มีแนวโน้มสูงว่าผมจะยอมจ่ายเงินต่อเพื่อใช้งานคู่กับ GPT-4 ครับ แต่ขอลองในส่วนของ API ดูสักหน่อย

ความเห็นส่วนตัวของผม เรียงลำดับ model ที่ชอบจากมากไปน้อยได้ดังนี้

  1. Claude 3 Opus
  2. GPT-4
  3. Gemini Ultra 1.0

แต่หากพิจารณาถึงการใช้งานผ่านเว็บ ผมว่า ChatGPT (GPT-4) ยังเหนือกว่าเพราะมีฟีเจอร์เสริมให้ใช้งานได้หลากหลายกว่า

อย่างไรก็ตาม ไม่มี AI ตัวไหนที่เหมาะสมกับทุกงาน ผมเองก็ยังคงใช้ model ที่แตกต่างกันไปตามความเหมาะสมของงาน และที่สำคัญ อย่าเพิ่งเชื่อในสิ่งที่ผมบอกไปทั้งหมด คุณควรลองใช้ด้วยตัวเองและตัดสินใจเลือกตามความต้องการของคุณ

--

--

Nopnithi Khaokaew (Game)

Cloud Solutions Architect & Hobbyist Developer | 6x AWS Certified, CKA, CKAD, 2x HashiCorp Certified (Terraform, Vault), etc.