FFmpeg เพิ่มโมเดลแปลงเสียงเป็นข้อความ Whisper เข้าในโครงการ ทำ subtitle ได้ในตัว
Body
FFmpeg โครงการโปรแกรมแปลงไฟล์เสียงและวิดีโอ เพิ่มโค้ด Whisper โมเดลปัญญาประดิษฐ์แปลงเสียงเป็นข้อความ (speech to text) เข้ามาในตัว ทำให้เวอร์ชั่นต่อไปสามารถแปลงเสียงเป็นข้อความได้ในตัว
ตัว FFmpeg สามารถแปลงเสียงให้เป็นข้อความเปล่าๆ, แปลงเป็นไฟล์ srt สำหรับทำ subtitle, หรือเป็น json สำหรับประมวลผลอื่นๆ ต่อ
ตอนนี้สถานะของฟีเจอร์นี้โค้ดอยู่ใน git สำหรับเวอร์ชั่น 8.0 ต้องรอดูว่าไบนารีมาตรฐานจะเปิดฟีเจอร์นี้เป็นมาตรฐานหรือไม่
Whisper เป็นโมเดลแปลงเสียงเป็นข้อความจาก OpenAI (ในยุค "open") โมเดลเปิดแบบ Apache 2.0 ใช้งานได้เสรีทำให้โครงการจำนวนมากนำไปใช้งาน เช่นโครงการ Subtitle Edit ช่วยทำ subtitle ในวิดีโอ การที่ FFmpeg นำมาใช้งานก็น่าจะทำให้การแปลงเสียงเป็นข้อความกลายเป็นฟีเจอร์ที่ใช้งานกันกว้างขวางมากขึ้น
ที่มา - FFmpeg
lew Wed, 13/08/2025 - 22:36
Continue reading...
Body
FFmpeg โครงการโปรแกรมแปลงไฟล์เสียงและวิดีโอ เพิ่มโค้ด Whisper โมเดลปัญญาประดิษฐ์แปลงเสียงเป็นข้อความ (speech to text) เข้ามาในตัว ทำให้เวอร์ชั่นต่อไปสามารถแปลงเสียงเป็นข้อความได้ในตัว
ตัว FFmpeg สามารถแปลงเสียงให้เป็นข้อความเปล่าๆ, แปลงเป็นไฟล์ srt สำหรับทำ subtitle, หรือเป็น json สำหรับประมวลผลอื่นๆ ต่อ
ตอนนี้สถานะของฟีเจอร์นี้โค้ดอยู่ใน git สำหรับเวอร์ชั่น 8.0 ต้องรอดูว่าไบนารีมาตรฐานจะเปิดฟีเจอร์นี้เป็นมาตรฐานหรือไม่
Whisper เป็นโมเดลแปลงเสียงเป็นข้อความจาก OpenAI (ในยุค "open") โมเดลเปิดแบบ Apache 2.0 ใช้งานได้เสรีทำให้โครงการจำนวนมากนำไปใช้งาน เช่นโครงการ Subtitle Edit ช่วยทำ subtitle ในวิดีโอ การที่ FFmpeg นำมาใช้งานก็น่าจะทำให้การแปลงเสียงเป็นข้อความกลายเป็นฟีเจอร์ที่ใช้งานกันกว้างขวางมากขึ้น
ที่มา - FFmpeg
lew Wed, 13/08/2025 - 22:36
Continue reading...