Meta เปิดตัว AI ‘Voicebox’ ใหม่ สร้างเสียงจากข้อความเป็นคำพูด , เลียนเสียงโดยใช้ตัวอย่างแค่ 3 วินาที

Meta AI เพิ่งเปิดตัว Voicebox เครื่องมือสร้างข้อความเป็นคำพูด (text-to-speech : TTS) ซึ่งอ้างว่าสร้างผลลัพธ์ได้เร็วกว่าโมเดลปัญญาประดิษฐ์ที่ล้ำสมัยถึง 20 เท่า พร้อมประสิทธิภาพที่เทียบเท่ากัน 

ระบบใหม่นี้มีชื่อว่า Voicebox โดยละทิ้งสถาปัตยกรรม TTS แบบดั้งเดิม และหันไปใช้โมเดลที่คล้ายกับ ChatGPT ของ OpenAI หรือ Bard ของ Google

ตามที่ Meta AI ระบุไว้ในบล็อกโพสต์เมื่อวันที่ 16 มิถุนายนว่า Voicebox เป็น “รุ่นแรกที่สามารถพูดคุยทั่วไปกับงานสร้างเสียงพูด โดย Voicebox สามารถแปลข้อความเป็นคำพูด ลบเสียงรบกวนที่ไม่ต้องการด้วยการสังเคราะห์เสียงพูดแทน และแม้แต่ใช้เสียงของผู้พูดกับเอาต์พุตภาษาต่างๆ”

ระบบ Voicebox ใช้เพียงข้อความเอาต์พุตที่ต้องการและคลิปเสียงตัวอย่างความยาวสามวินาที

Meta ยังพัฒนาเครื่องมือสำหรับพิจารณาว่าเสียงพูดถูกสร้างขึ้นโดยตัวมันหรือไม่ และบริษัทอ้างว่าสามารถ “ตรวจจับได้เล็กน้อย” ความแตกต่างระหว่างเสียงจริงและเสียงปลอม 

“เช่นเดียวกับนวัตกรรม AI ใหม่ที่ทรงพลังอื่น ๆ เราตระหนักดีว่าเทคโนโลยีนี้ทำให้เกิดการใช้งานในทางที่ผิดและเป็นอันตรายโดยไม่ได้ตั้งใจ  ซึ่งในบทความของเรา เราได้ลงรายละเอียดว่าเราสร้างเครื่องมือสำหรับพิจารณาที่มีประสิทธิภาพสูง ซึ่งสามารถแยกความแตกต่างระหว่างเสียงพูดและเสียงจริงที่สร้างด้วย Voicebox เพื่อลดความเสี่ยงที่อาจเกิดขึ้นในอนาคตได้อย่างไร”

อ้างอิง : LINK
ภาพ LINK

Share on facebook
Share on twitter
Share on linkedin

Radius

ผู้เชี่ยวชาญการเขียนข่าว บทความ ที่เกี่ยวข้องกับ Bitcoin , คริปโตเคอเรนซี่ และ Blockchain ทั้งในไทยและต่างประเทศ อัพเดทราคา มุมมองการลงทุน ใหม่ล่าสุดทุกวัน
ข่าวต่อไป