Microsoft AI เปิดตัวโมเดลถอดเสียงเป็นข้อความ MAI-Transcribe-1 รองรับภาษาไทย
Body
Microsoft AI เปิดตัวโมเดลตระกูล MAI เพิ่มเติมอีก 3 ตัว ได้แก่
ที่มา - Microsoft AI, Microsoft
Continue reading...
Body
Microsoft AI เปิดตัวโมเดลตระกูล MAI เพิ่มเติมอีก 3 ตัว ได้แก่
- MAI-Transcribe-1 โมเดลถอดเสียงพูดเป็นข้อความ (speech-to-text) รองรับ 25 ภาษายอดนิยม (มีภาษาไทยด้วย) ทำคะแนนเบนช์มาร์คได้ดีกว่า GPT-Transcribe และ Gemini 3.1 Flash แถมยังทำงานได้รวดเร็ว ราคาไม่แพง เริ่มต้นที่ 0.36 ดอลลาร์ต่อชั่วโมง
- MAI-Voice-1 เป็นด้านกลับของตัวบนคือสร้างเสียงพูดจากข้อความ (text-to-speech) ให้คุณภาพเสียงที่เป็นธรรมชาติ ทำงานรวดเร็ว ประหยัดทรัพยากร สร้างเสียงพูดยาว 1 นาที ด้วยการรันบนจีพียูตัวเดียว ภายในเวลาไม่กี่วินาที ราคาเริ่มต้นที่ 22 ดอลลาร์ ต่อข้อความ 1 ล้านตัวอักษร โมเดลนี้เคยนำมาโชว์แล้วเมื่อปีที่แล้ว ตอนนี้เปิดให้ใช้งานแล้วบน Microsoft Foundry
- MAI-Image-2 โมเดลสร้างรูปภาพที่เคยเปิดตัวมาก่อนหน้านี้แล้วเช่นกัน ตอนนี้เริ่มใช้งานจริงแล้วกับ Bing และ PowerPoint มีจุดเด่นที่ต้นทุนค่ารัน 5 ดอลลาร์ ต่อ input 1 ล้าน token และ 33 ดอลลาร์ ต่อ output 1 ล้าน token
ที่มา - Microsoft AI, Microsoft
We're bringing our growing MAI model family to every developer in Foundry, including …· MAI-Transcribe-1, most accurate transcription model in world across 25 languages· MAI-Voice-1, natural, expressive speech generation· MAI-Image-2, our most capable image model yetStart… pic.twitter.com/p0DZZcAUZ4
— Satya Nadella (@satyanadella) April 2, 2026
mk Fri, 03/04/2026 - 08:54The most accurate model across 25 languages, faster transcription speeds, and stronger performance in real‑world noise. MAI‑Transcribe‑1 sets a new bar for speech recognition. Learn more + try it today: https://t.co/zBY6ZuqWMN pic.twitter.com/yC3o4slXiW
— Microsoft AI (@MicrosoftAI) April 2, 2026
Continue reading...