แอปเปิลโชว์โมเดล Apple Intelligence ตัวเล็กความฉลาดใกล้ Gemma3, Qwen 2.5 แต่ตัวใหญ่ยังตามหลังคู่แข่ง
Body
แอปเปิลรายงานถึงความคืบหน้าของการพัฒนา Apple Foundation Model (AFM) ที่เป็นโมเดลปัญญาประดิษฐ์แบบ LLM สำหรับการใช้งานใน Apple Intelligence แบ่งเป็นโมเดลสำหรับรับบนเครื่องโดยตรงและโมเดลรันบนเซิร์ฟเวอร์ (ที่แอปเปิลสร้าง private cloud compute เตรียมไว้รอ)
โมเดลทั้งสองรุ่นถูกย่อให้เหลือขนาดเล็กมาก ด้วยเทคนิค Quantization-Aware-Training (QAT) เพื่อให้คงคุณภาพเอาไว้แม้จะย่อโมเดลบนเครื่องขนาดเล็กเหลือ 2-bit และโมเดลบนเซิร์ฟเวอร์เหลือ 3.56 bit ส่วน embedding ย่อเหลือ 4 bit และส่วน KV-cache ย่อเหลือ 8 บิต
ตัวโมเดลบนโทรศัพท์มีขนาด 3B ขณะที่โมเดลบนเซิร์ฟเวอร์นั้นแอปเปิลเปิดเผยว่าขนาดพอๆ กับ LLaMa 4 Scout ซึ่งมีขนาด 17B/109B และส่วนเข้าใจภาพที่ขนาดใกล้กับ Qwen-2.5-VL
ผลการทดสอบของแอปเปิลแสดงให้เห็นว่าคะแนนทดสอบต่างๆ ของโมเดลบนโทรศัพท์อยู่ระดับเดียวโมเดลขนาดใกล้เคียงกัน แต่โมเดลของแอปเปิลนั้นความเร็วสูงกว่ามาก และกินแรมน้อยกว่าเนื่องจากใช้โมเดลรุ่นย่อแล้วมาทดสอบกับโมเดลเต็ม แต่เมื่อวัดคะแนนของโมเดลบนเซิร์ฟเวอร์ก็จะพบว่าคะแนนต่ำกว่าโมเดลคู่แข่งค่อนข้างชัด
อย่างไรก็ดี จุดขายสำคัญของ AFM คือโมเดลเหล่านี้เปิดให้นักพัฒนาบนแพลตฟอร์มแอปเปิลใช้งานได้ฟรี ทำให้เราน่าจะเห็นการใช้งานมากยิ่งขึ้นไปในอนาคต
ที่มา - Apple
lew Fri, 18/07/2025 - 11:45
Continue reading...
Body
แอปเปิลรายงานถึงความคืบหน้าของการพัฒนา Apple Foundation Model (AFM) ที่เป็นโมเดลปัญญาประดิษฐ์แบบ LLM สำหรับการใช้งานใน Apple Intelligence แบ่งเป็นโมเดลสำหรับรับบนเครื่องโดยตรงและโมเดลรันบนเซิร์ฟเวอร์ (ที่แอปเปิลสร้าง private cloud compute เตรียมไว้รอ)
โมเดลทั้งสองรุ่นถูกย่อให้เหลือขนาดเล็กมาก ด้วยเทคนิค Quantization-Aware-Training (QAT) เพื่อให้คงคุณภาพเอาไว้แม้จะย่อโมเดลบนเครื่องขนาดเล็กเหลือ 2-bit และโมเดลบนเซิร์ฟเวอร์เหลือ 3.56 bit ส่วน embedding ย่อเหลือ 4 bit และส่วน KV-cache ย่อเหลือ 8 บิต
ตัวโมเดลบนโทรศัพท์มีขนาด 3B ขณะที่โมเดลบนเซิร์ฟเวอร์นั้นแอปเปิลเปิดเผยว่าขนาดพอๆ กับ LLaMa 4 Scout ซึ่งมีขนาด 17B/109B และส่วนเข้าใจภาพที่ขนาดใกล้กับ Qwen-2.5-VL
ผลการทดสอบของแอปเปิลแสดงให้เห็นว่าคะแนนทดสอบต่างๆ ของโมเดลบนโทรศัพท์อยู่ระดับเดียวโมเดลขนาดใกล้เคียงกัน แต่โมเดลของแอปเปิลนั้นความเร็วสูงกว่ามาก และกินแรมน้อยกว่าเนื่องจากใช้โมเดลรุ่นย่อแล้วมาทดสอบกับโมเดลเต็ม แต่เมื่อวัดคะแนนของโมเดลบนเซิร์ฟเวอร์ก็จะพบว่าคะแนนต่ำกว่าโมเดลคู่แข่งค่อนข้างชัด
อย่างไรก็ดี จุดขายสำคัญของ AFM คือโมเดลเหล่านี้เปิดให้นักพัฒนาบนแพลตฟอร์มแอปเปิลใช้งานได้ฟรี ทำให้เราน่าจะเห็นการใช้งานมากยิ่งขึ้นไปในอนาคต
ที่มา - Apple
lew Fri, 18/07/2025 - 11:45
Continue reading...