Anthropic ทดลองให้ AI Agents เจรจาแลกเปลี่ยนสินค้ากันเอง พบโมเดลรุ่นใหญ่ทำงานได้ดีกว่าการใช้โมเดลรุ่นเล็ก
Body
Anthropic รายงานผลการทดลองภายในบริษัทเพื่อดูว่า AI Agent เก่งพอที่จะดำเนินการเจรจาซื้อขายแลกเปลี่ยนสินค้าแทนคนได้ดีแค่ไหน ซึ่งเป็นขั้นกว่าของ Project Vend ที่โมเดล Claude บริหารตู้ขายสินค้าให้คน โดย Anthropic เรียกการทดลองนี้ว่า Project Deal
วิธีการทดสอบนั้น Anthropic ให้พนักงานบริษัทที่ตกลงร่วมโครงการ 69 คน นำของมือสองที่ตนเองมีมาขายให้กับเพื่อนพนักงานด้วยกัน แต่ละคนได้รับบัตรเงินสด 100 ดอลลาร์ เพื่อใช้เป็นตัวกลางแลกเปลี่ยน พนักงานแต่ละคนจะทำแบบทดสอบที่สร้างจาก Claude เพื่อทำความเข้าใจบุคลิกและความสนใจแต่ละคน รายการของที่จะนำมาขาย เพื่อสร้างเป็น AI Agent ตัวแทนของพนักงานแต่ละคน จากนั้นเหล่า Agents ทั้ง 69 คน ก็จะเริ่มการเจรจาซื้อขายสินค้ากันเอง เมื่อเกิดข้อตกลงขึ้น พนักงานก็ต้องนำของที่ขายไปแลกกับบัตรเงินสดตามราคาที่ตกลงกันจริง
Anthropic บอกว่าจากผลการทดลองนี้ เกิดข้อตกลงซื้อขายทั้ง 186 รายการ มูลค่ารวมมากกว่า 4,000 ดอลลาร์
การทดลองนี้ Anthropic ได้ทดลองใส่ตัวแปรบางอย่างเพิ่มด้วย มีทั้งที่บอกพนักงานก่อนและไม่บอกก่อน เพื่อดูว่าการเจรจาซื้อขายที่ออกมาพนักงานพึงพอใจกับผลลัพธ์มากแค่ไหน โดยมีข้อสรุปคือ "ประสิทธิภาพของโมเดล" รุ่นใหญ่กว่าอย่าง Claude Opus 4.5 ได้ผลลัพธ์ที่ดีกว่าโมเดลรุ่นเล็กอย่าง Claude Haiku 4.5 แต่หากไม่บอกพนักงานก่อน ก็ไม่พบว่าพนักงานรู้สึกถึงความต่างเช่นกัน สิ่งนี้ Anthropic เรียกว่าช่องว่างของคุณภาพโมเดล AI ซึ่งสร้างความไม่เท่าเทียมกัน
รายละเอียดและตัวอย่างดีลซื้อขายที่เกิดขึ้นดูได้จากที่มา
ที่มา: Anthropic ผ่าน TechCrunch
arjin Mon, 27/04/2026 - 07:18
Continue reading...
Body
Anthropic รายงานผลการทดลองภายในบริษัทเพื่อดูว่า AI Agent เก่งพอที่จะดำเนินการเจรจาซื้อขายแลกเปลี่ยนสินค้าแทนคนได้ดีแค่ไหน ซึ่งเป็นขั้นกว่าของ Project Vend ที่โมเดล Claude บริหารตู้ขายสินค้าให้คน โดย Anthropic เรียกการทดลองนี้ว่า Project Deal
วิธีการทดสอบนั้น Anthropic ให้พนักงานบริษัทที่ตกลงร่วมโครงการ 69 คน นำของมือสองที่ตนเองมีมาขายให้กับเพื่อนพนักงานด้วยกัน แต่ละคนได้รับบัตรเงินสด 100 ดอลลาร์ เพื่อใช้เป็นตัวกลางแลกเปลี่ยน พนักงานแต่ละคนจะทำแบบทดสอบที่สร้างจาก Claude เพื่อทำความเข้าใจบุคลิกและความสนใจแต่ละคน รายการของที่จะนำมาขาย เพื่อสร้างเป็น AI Agent ตัวแทนของพนักงานแต่ละคน จากนั้นเหล่า Agents ทั้ง 69 คน ก็จะเริ่มการเจรจาซื้อขายสินค้ากันเอง เมื่อเกิดข้อตกลงขึ้น พนักงานก็ต้องนำของที่ขายไปแลกกับบัตรเงินสดตามราคาที่ตกลงกันจริง
Anthropic บอกว่าจากผลการทดลองนี้ เกิดข้อตกลงซื้อขายทั้ง 186 รายการ มูลค่ารวมมากกว่า 4,000 ดอลลาร์
การทดลองนี้ Anthropic ได้ทดลองใส่ตัวแปรบางอย่างเพิ่มด้วย มีทั้งที่บอกพนักงานก่อนและไม่บอกก่อน เพื่อดูว่าการเจรจาซื้อขายที่ออกมาพนักงานพึงพอใจกับผลลัพธ์มากแค่ไหน โดยมีข้อสรุปคือ "ประสิทธิภาพของโมเดล" รุ่นใหญ่กว่าอย่าง Claude Opus 4.5 ได้ผลลัพธ์ที่ดีกว่าโมเดลรุ่นเล็กอย่าง Claude Haiku 4.5 แต่หากไม่บอกพนักงานก่อน ก็ไม่พบว่าพนักงานรู้สึกถึงความต่างเช่นกัน สิ่งนี้ Anthropic เรียกว่าช่องว่างของคุณภาพโมเดล AI ซึ่งสร้างความไม่เท่าเทียมกัน
รายละเอียดและตัวอย่างดีลซื้อขายที่เกิดขึ้นดูได้จากที่มา
ที่มา: Anthropic ผ่าน TechCrunch
arjin Mon, 27/04/2026 - 07:18
Continue reading...