DeepSeek อาจใช้ข้อมูลจาก Google Gemini ในการเทรนโมเดล R1-0528
Body
DeepSeek ผู้พัฒนา AI จากจีน ที่เพิ่งอัปเดตโมเดล R1-0528 ซึ่งเน้นความสามารถด้านการให้เหตุผล (reasoning) ถูกตั้งข้อสังเกตว่า อาจได้ใช้ข้อมูลที่มาจากผลลัพธ์ของโมเดล Google Gemini มาใช้ในการเทรนโมเดลดังกล่าว
นักพัฒนาอย่าง Sam Paeach วิเคราะห์พบว่า โมเดล R1-0528 ของ DeepSeek แสดงรูปแบบการใช้คำศัพท์และสำนวนที่ใกล้เคียงกับ Google Gemini อย่างชัดเจน เช่นคำว่า “context window,” “foundation model,” หรือ “function calling” ซึ่งเป็นคำเฉพาะที่พบได้บ่อยในเอกสารและผลลัพธ์ของ Gemini
การใช้ข้อมูลจากโมเดล AI อื่นมาสร้างหรือเทรนโมเดลของตัวเอง เรียกว่า “distillation” หรือ “prompt chaining” ซึ่งหมายถึงการเก็บเอาลักษณะภาษาหรือวิธีการตอบของโมเดลหนึ่งมาเป็นข้อมูลฝึกสำหรับโมเดลใหม่ นี่จึงเป็นความเป็นไปได้อย่างมากที่ DeepSeek อาจนำผลลัพธ์จาก Gemini มาใช้ในกระบวนการพัฒนา R1-0528
ก่อนหน้านี้ DeepSeek เคยถูกจับสังเกตว่าโมเดล V3 ของพวกเขามักตอบว่าเป็น ChatGPT ซึ่งทำให้มีข้อสงสัยว่าอาจใช้ข้อมูลจาก OpenAI มาเทรนเช่นกัน ขณะที่ OpenAI เองก็เคยออกมาเปิดเผยว่าพบหลักฐานว่า DeepSeek ใช้วิธีการ distillation เพื่อสร้างโมเดลของตัวเอง
จนถึงตอนนี้ DeepSeek ยังไม่ได้ออกมาตอบหรือปฏิเสธข้อกล่าวหาอย่างเป็นทางการ แต่กระแสข่าวนี้ก็สร้างความตื่นตัวในวงการ AI ว่าการนำข้อมูลจากโมเดลคู่แข่งมาใช้เทรนโมเดลของตัวเอง อาจทำให้เกิดข้อถกเถียงเรื่องสิทธิ์และความโปร่งใสในการพัฒนาเทคโนโลยี AI
ที่มา :
TechCrunch: DeepSeek may have used Google’s Gemini to train its latest model
Fzo Fri, 06/06/2025 - 09:54
Continue reading...
Body
DeepSeek ผู้พัฒนา AI จากจีน ที่เพิ่งอัปเดตโมเดล R1-0528 ซึ่งเน้นความสามารถด้านการให้เหตุผล (reasoning) ถูกตั้งข้อสังเกตว่า อาจได้ใช้ข้อมูลที่มาจากผลลัพธ์ของโมเดล Google Gemini มาใช้ในการเทรนโมเดลดังกล่าว
นักพัฒนาอย่าง Sam Paeach วิเคราะห์พบว่า โมเดล R1-0528 ของ DeepSeek แสดงรูปแบบการใช้คำศัพท์และสำนวนที่ใกล้เคียงกับ Google Gemini อย่างชัดเจน เช่นคำว่า “context window,” “foundation model,” หรือ “function calling” ซึ่งเป็นคำเฉพาะที่พบได้บ่อยในเอกสารและผลลัพธ์ของ Gemini
การใช้ข้อมูลจากโมเดล AI อื่นมาสร้างหรือเทรนโมเดลของตัวเอง เรียกว่า “distillation” หรือ “prompt chaining” ซึ่งหมายถึงการเก็บเอาลักษณะภาษาหรือวิธีการตอบของโมเดลหนึ่งมาเป็นข้อมูลฝึกสำหรับโมเดลใหม่ นี่จึงเป็นความเป็นไปได้อย่างมากที่ DeepSeek อาจนำผลลัพธ์จาก Gemini มาใช้ในกระบวนการพัฒนา R1-0528
ก่อนหน้านี้ DeepSeek เคยถูกจับสังเกตว่าโมเดล V3 ของพวกเขามักตอบว่าเป็น ChatGPT ซึ่งทำให้มีข้อสงสัยว่าอาจใช้ข้อมูลจาก OpenAI มาเทรนเช่นกัน ขณะที่ OpenAI เองก็เคยออกมาเปิดเผยว่าพบหลักฐานว่า DeepSeek ใช้วิธีการ distillation เพื่อสร้างโมเดลของตัวเอง
จนถึงตอนนี้ DeepSeek ยังไม่ได้ออกมาตอบหรือปฏิเสธข้อกล่าวหาอย่างเป็นทางการ แต่กระแสข่าวนี้ก็สร้างความตื่นตัวในวงการ AI ว่าการนำข้อมูลจากโมเดลคู่แข่งมาใช้เทรนโมเดลของตัวเอง อาจทำให้เกิดข้อถกเถียงเรื่องสิทธิ์และความโปร่งใสในการพัฒนาเทคโนโลยี AI
If you're wondering why new deepseek r1 sounds a bit different, I think they probably switched from training on synthetic openai to synthetic gemini outputs. pic.twitter.com/Oex9roapNv
— Sam Paech (@sam_paech) May 29, 2025
ที่มา :
TechCrunch: DeepSeek may have used Google’s Gemini to train its latest model
Fzo Fri, 06/06/2025 - 09:54
Continue reading...