กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


Langchain ทดสอบการใช้ LLM แบบ Agentic พบ o1, o3-mini, Claude Sonnet ทำได้ดี

ข่าว Langchain ทดสอบการใช้ LLM แบบ Agentic พบ o1, o3-mini, Claude Sonnet ทำได้ดี

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Active member

สมาชิกทีมงาน
Moderator
Distributor
Thread owner
Langchain ทดสอบความสามารถการใช้งานปัญญาประดิษฐ์ LLM ที่หลายองค์กรเริ่มต้องการใช้งานแบบ agentic ที่ปัญญาประดิษฐ์สามารถเรียกใช้เครื่องมือต่างๆ ได้หลากหลาย และตัดสินใจกระบวนการทำงานเพิ่มเติมได้เอง และพบว่าบางโมเดลนั้นทำได้แย่ลงมากหากใส่เครื่องมือให้ปัญญาประดิษฐ์ใช้งานมากเกินไป

ชุดทดสอบเป็นคำสั่งสำหรับงานในหมวดการจัดการปฎิทินและการซัพพอร์ตลูกค้า อย่างละ 30 ข้อ โดยการทดสอบจะรันข้อละ 3 ครั้ง ทำให้แต่ละชุดรัน 90 ครั้ง กระบวนการทดสอบจะเริ่มจากการรันโดยใส่เฉพาะเครื่องมือที่เกี่ยวข้อง จากนั้นจะเพิ่มเครื่องมืองานด้านอื่นๆ ไปเรื่อยๆ เพื่อดูประสิทธิภาพการทำงาน

ผลการทดสอบนั้นแสดงให้เห็นว่า OpenAI o1 ทำตามคำสั่งสำเร็จสูงมาก แถมยังมีประสิทธิภาพค่อนข้างคงตัวแม้จะเพิ่มคำสั่งเข้าไปมากๆ แต่โมเดลบางตัว เช่น GPT-4o นั้นประสิทธิภาพลดลงเร็วมากเมื่อเพิ่มคำสั่งเข้าไป

โดยรวมแล้วประสิทธิภาพของการทำงานแบบ agentic นั้นแยกกันชัดเป็นสองกลุ่ม คือ o1, o3-mini, และ Claude 3.5 Sonnet ที่ประสิทธิภาพค่อนข้างดี กับ GPT-4o และ Llama-3.3 ที่ประสิทธิภาพค่อนข้างแย่ และลดลงหนักเมื่อคำสั่งยาวขึ้น

ที่มา - Langchain

Langchain ทดสอบการใช้ LLM แบบ Agentic พบ o1 o3mini Claude Sonnet ทำได้ดี-1.webp


Topics:
LLM
Artificial Intelligence

Continue reading...
 


กลับ
ยอดนิยม ด้านล่าง