GPT-5 Thinking, GPT Deep Research, GPT Agent Mode … อะไรเยอะแยะเนี่ย แล้วจะใช้ตัวไหนดีล่ะ?

ภาษาอื่น / Other language: English · ไทย
หลังจากลองไปแล้วว่า GPT-5 ทำได้ดีกว่า Grok 4 และจากที่ลองใช้แบบไม่ได้เก็บ screenshot ก็ยังรู้สึกแบบนั้นนะคะ ซึ่งอาจจะเป็นเพราะว่าสไตล์การสั่งงานเราเหมาะกับ GPT-5 มากกว่าก็เป็นได้ค่ะ
ทีนี้คำถามใหม่ที่เราสงสัยคือ โอเค เราไม่ใช้ Grok 4 แต่ว่ามีทางเลือกอื่นๆ อะไรอีกบ้าง เพราะจำเป็นต้องเอามาใช้งานค่ะ จะมีผู้ช่วยใหม่ทั้งที ก็ต้องเอามาสอบบรรจุเข้าทำงานเสียก่อน ได้ผลยังไงมาดูกันค่ะ…
การทดสอบรอบนี้
แจกงาน business research ให้หาข้อมูลเกี่ยวกับบริษัทที่เราให้ไป
ผู้ร่วมทดสอบรอบนี้
- Report 1: Grok-4 (ไหนๆ สมัคร supergrok ไปแล้ว ก็ให้ทำงานสักหน่อย ตั้งใจว่าจะเทสหนักๆ ทั้งเดือนเลยค่ะ)
- Report 2: Claude Opus 4.1
- Report 3: Gemini 2.5 Pro
- Report 4: GPT Agent Mode
- Report 5: GPT Deep Research
- Report 6: GPT-5 Thinking
กรรมการผู้ให้คะแนน: Grok 3, Claude Sonnet 4, Gemini 2.5 Flash, GPT-5, DeepSeek
ถามว่าทำไมให้ตัวเล็กๆ เบาๆ มาตัดสิน … คือว่า report ที่ได้มานี่เฉลี่ยสิบกว่าหน้าค่ะ ถ้าให้ตัวคิดมากทั้งหลายมาอ่าน คงจะวิเคราะห์ไม่เสร็จ
ทีแรกเราพยายามแล้วนะคะ แต่ Grok 4 นิ่งไปเลยค่ะ, Gemini กว่าจะอ่านไฟล์เราได้ครบ ก็หมดโควต้าโปร, Claude เท่าที่ใช้มาโควต้าหมดเร็วมากค่ะ ประเมินแล้วว่าไม่พอ เลยคิดว่าใช้ Sonnet 4 แต่แรกดีกว่า
เรียกว่ากว่าจะเทียบได้นี่หมดเป็นชั่วโมงค่ะ อย่าง Grok 3 ก็ปัญหาเยอะ ให้ไฟล์ไป 10 หน้า เห็นแค่ 2 หน้า, Gemini ก็มองไม่เห็นไฟล์ ต้องมาเริ่มแชทใหม่ถึงมองเห็น
ผลการทดสอบ
🥇 GPT-5 Thinking : 9.14/10 🏆
จุดเด่น: ครอบคลุมทั้งเชิงกลยุทธ์และเชิงปฏิบัติ, จัดโครงสร้างกระชับ, แหล่งข้อมูลหลากหลายและตรวจสอบได้
เหมาะกับ: ผู้บริหารที่ต้องการรายงานเชิงกลยุทธ์สั้นแต่ครบ
🥈 Gemini 2.5 Pro : 8.88/10
จุดเด่น: การวิเคราะห์เชิงกลยุทธ์ลึก, จัดลำดับข้อมูลดี, มีการเปรียบเทียบคู่แข่งชัดเจน
เหมาะกับ: นักวิเคราะห์ตลาดและที่ปรึกษาด้านกลยุทธ์
🥉 GPT Agent Mode : 8.70/10
จุดเด่น: รายละเอียดเชิงลึกของแต่ละทรัพย์สิน, โครงสร้างรายงานมืออาชีพ, การวิเคราะห์คู่แข่งเป็นระบบ
เหมาะกับ: ที่ปรึกษาและทีมปฏิบัติการที่ต้องการข้อมูลเจาะลึก
▪️ GPT Deep Research : 8.42/10
จุดเด่น: เนื้อหาละเอียดมาก, ครอบคลุมประวัติและตลาด, วิเคราะห์แนวโน้มอนาคต
ข้อสังเกต: เนื้อหายาว อาจไม่เหมาะสำหรับผู้บริหารที่ต้องการสรุปสั้น
▪️ Claude Opus 4.1: 8.10/10
จุดเด่น: การเล่าเรื่องดี, จัดโครงสร้างสมดุล, เหมาะสำหรับนำเสนอต่อผู้บริหาร
ข้อสังเกต: ขาดข้อมูลเชิงตัวเลขเปรียบเทียบ
▪️ Grok 4: 7.02/10
จุดเด่น: ครอบคลุมข้อมูลพื้นฐาน, มีการรวบรวมตัวเลขและรางวัล
ข้อสังเกต: การวิเคราะห์ตื้น, ขาดการเชื่อมโยงข้อมูลสู่กลยุทธ์
ข้อสรุป
- เดือนหน้าเลิก supergrok
- แค่ GPT-5 Thinking หรือ Gemini 2.5 Pro ที่ไม่ได้ทำงานช้าเท่าไร ก็ทำได้ดีแล้วนะคะ ถ้าใช้งานแต่ละวันไม่เยอะ สองตัวนี้ไม่ต้องเสียเงิน ใช้ของฟรีได้
- Claude นี่แพงนะคะ ขนาดเสียเงินยังได้ใช้ opus 4.1 แค่นิดเดียวเลย แต่ว่าอันนี้อาจจะไม่ใช่จุดแข็ง มันไม่ค่อยเน้นเชิงปริมาณเท่าไรค่ะ ถ้าเป็นเชิงพรรณนามันทำได้ดีค่ะ
First Published: 10 Aug 2025


Summary by GPT-5









Research capabilities assessment