Anthropic ทดลองนำ Claude มาใช้กับตู้ขายสินค้า โดยให้ตัดสินใจเองทั้งหมด
Body
ประเด็นเรื่อง AI เข้ามาเปลี่ยนแปลงวิธีการทำงานนั้นคงไม่มีใครปฏิเสธกันแล้ว แต่คำถามคือในตอนนี้ความสามารถ AI เข้ามาจัดการได้ขนาดไหนในโลกความจริง Anthropic เลยทดลองเรื่องนี้โดยร่วมมือกับ Andon Labs ที่เป็นบริษัทประเมินความปลอดภัย AI นำโมเดล Claude Sonnet 3.7 มาบริหารจัดการตู้ขายสินค้าขนาดเล็กแบบอัตโนมัติภายในสำนักงาน Anthropic ที่ซานฟรานซิสโก
โครงการนี้ชื่อว่า Project Vend การทำงานเริ่มด้วยการ prompt เข้าไปในระบบว่าโมเดลกำลังบริหารจัดการตู้ขายสินค้า บนเงื่อนไขมีสินค้า 10 อย่าง สต็อกได้ไม่เกิน 30 หน่วยต่อรายการ ต้องบริหารจัดการสั่งของมาเติม ตั้งราคาขายเอง และทำให้มีกำไร ระบบจึงมีเรื่องต้องคิดมากกว่าเป็นตู้ขายสินค้าอัตโนมัติทั่วไป
ผลการทดสอบหลังให้ Project Vend ดูแลตู้ขายสินค้าระยะเวลาหนึ่ง พบว่า Claude ทำงานได้ดีในการพยายามสั่งสินค้าน่าสนใจมาขาย, มีวิธีตอบสนองต่อคำขอพิเศษของลูกค้าทั้งแบบปกติ และรับมือกรณีลูกค้าสั่งสินค้าที่แปลกมากเกินไปได้
อย่างไรก็ตามกรณีที่ Claude ทำได้ไม่ดี (เมื่อเทียบกับถ้าเป็นคนตัดสินใจ) เช่น เมื่อได้ข้อเสนอให้หาสินค้าด้วยเงินที่สูงและสามารถทำกำไรได้ ก็เลือกปฏิเสธ, เกิดอาการหลอนเมื่อลูกค้าจ่ายเงินด้วยวิธีที่แปลกออกไป, การตัดสินใจเมื่อลูกค้าเทียบราคาสินค้าทำได้ไม่ดี และยังถูกลูกค้าหลอกล่อจนยอมยกสินค้าให้ฟรีในบางกรณีด้วย
ผลทดสอบนี้ Claude ยังทำได้ไม่ดีนัก มูลค่าเงินของร้านค้าลดลงไปเรื่อย ๆ แต่ Anthropic บอกว่าได้ข้อมูลเรียนรู้มากมายที่นำไปปรับปรุงได้ โดยเฉพาะการถูกท้าทายด้วยเงื่อนไขแปลกจากลูกค้า รายละเอียดทั้งหมดสามารถอ่านได้จากที่มา
ที่มา: Anthropic
arjin Sat, 28/06/2025 - 17:11
Continue reading...
Body
ประเด็นเรื่อง AI เข้ามาเปลี่ยนแปลงวิธีการทำงานนั้นคงไม่มีใครปฏิเสธกันแล้ว แต่คำถามคือในตอนนี้ความสามารถ AI เข้ามาจัดการได้ขนาดไหนในโลกความจริง Anthropic เลยทดลองเรื่องนี้โดยร่วมมือกับ Andon Labs ที่เป็นบริษัทประเมินความปลอดภัย AI นำโมเดล Claude Sonnet 3.7 มาบริหารจัดการตู้ขายสินค้าขนาดเล็กแบบอัตโนมัติภายในสำนักงาน Anthropic ที่ซานฟรานซิสโก
โครงการนี้ชื่อว่า Project Vend การทำงานเริ่มด้วยการ prompt เข้าไปในระบบว่าโมเดลกำลังบริหารจัดการตู้ขายสินค้า บนเงื่อนไขมีสินค้า 10 อย่าง สต็อกได้ไม่เกิน 30 หน่วยต่อรายการ ต้องบริหารจัดการสั่งของมาเติม ตั้งราคาขายเอง และทำให้มีกำไร ระบบจึงมีเรื่องต้องคิดมากกว่าเป็นตู้ขายสินค้าอัตโนมัติทั่วไป
ผลการทดสอบหลังให้ Project Vend ดูแลตู้ขายสินค้าระยะเวลาหนึ่ง พบว่า Claude ทำงานได้ดีในการพยายามสั่งสินค้าน่าสนใจมาขาย, มีวิธีตอบสนองต่อคำขอพิเศษของลูกค้าทั้งแบบปกติ และรับมือกรณีลูกค้าสั่งสินค้าที่แปลกมากเกินไปได้
อย่างไรก็ตามกรณีที่ Claude ทำได้ไม่ดี (เมื่อเทียบกับถ้าเป็นคนตัดสินใจ) เช่น เมื่อได้ข้อเสนอให้หาสินค้าด้วยเงินที่สูงและสามารถทำกำไรได้ ก็เลือกปฏิเสธ, เกิดอาการหลอนเมื่อลูกค้าจ่ายเงินด้วยวิธีที่แปลกออกไป, การตัดสินใจเมื่อลูกค้าเทียบราคาสินค้าทำได้ไม่ดี และยังถูกลูกค้าหลอกล่อจนยอมยกสินค้าให้ฟรีในบางกรณีด้วย
ผลทดสอบนี้ Claude ยังทำได้ไม่ดีนัก มูลค่าเงินของร้านค้าลดลงไปเรื่อย ๆ แต่ Anthropic บอกว่าได้ข้อมูลเรียนรู้มากมายที่นำไปปรับปรุงได้ โดยเฉพาะการถูกท้าทายด้วยเงื่อนไขแปลกจากลูกค้า รายละเอียดทั้งหมดสามารถอ่านได้จากที่มา
ที่มา: Anthropic
arjin Sat, 28/06/2025 - 17:11
Continue reading...