OpenVoiceOS Foundation หรือ OVOS Foundation เป็นองค์กรไม่แสวงหาผลกำไรที่มุ่งพัฒนาเทคโนโลยี voice assistant แบบโอเพ่นซอร์ส และนำเสนอทางเลือกแบบโอเพ่นซอร์สที่เน้นความเป็นส่วนตัว แทน voice assistant จากบริษัทใหญ่ เช่น Amazon, Google และ Apple
Peter Steenbergen (j1nx) หนึ่งในผู้ก่อตั้ง อธิบายว่าเริ่มต้นเมื่อเขาอ่านบทความใน CNX Software เกี่ยวกับ Mycroft Mark II voice assistant hardware บน CNX Software ในปี 2018 เขามีส่วนร่วมในโครงการและสร้าง “MycroftOS” ซึ่งภายหลังเปลี่ยนชื่อเป็น “OpenVoiceOS – Mycroft Edition” เป็นระบบปฏิบัติการที่ใช้ Buildroot และทำงานบน Mark II ในบางช่วงเวลาเกิดความตึงเครียดในกลุ่ม open-source community และโครงการ Mycroft ก็เริ่มไปในทิศทางที่ไม่ดีจนบริษัทต้องปิดตัวลงในปี 2023
ในที่สุด OpenVoiceOS ได้เข้าควบคุมฐานรหัส (codebase) ของ Mycroft A.I. และสามารถรวม PR ที่ค้างอยู่จากกลุ่ม open-source community ได้สำเร็จ ร่วมกับ NEON A.I. โดยได้ดูแลฟอรัมกลุ่ม Mycroft A.I. community ซึ่งปัจจุบันย้ายไปอยู่ที่ https://community.openconversational.ai/ และในปี 2024 Peter ตัดสินใจก่อตั้งOpenVoiceOS Foundation ร่วมกับพันธมิตร ซึ่งเพิ่งได้รับการอนุมัติจากรัฐบาลเนเธอร์แลนด์เมื่อไม่นานมานี้ คุณสามารถอ่านเพิ่มเติมเกี่ยวกับประวัติของโครงการได้ในส่วน “About” บนเว็บไซต์
ปัจจุบัน OpenVoiceOS ได้ถูกแบ่งออกเป็นหลายโมดูล ได้แก่:
- ovos-messagebus – BUS ที่ใช้ในการสื่อสารระหว่างโมดูลต่าง ๆ
- ovos-core –ระบบหลักที่จัดการกับทุกทักษะ (skills) โดยเปรียบเสมือน “สมอง” ของระบบ และรองรับทักษะของ Mycroft A.I. อย่างสมบูรณ์
- ovos-listener – โมดูลที่เข้าถึงไมโครโฟนและจัดการกับคีย์เวิร์ด, STT (การแปลงเสียงพูดเป็นข้อความ) ฯลฯ ซึ่งเป็นระบบที่สามารถปรับแต่งได้ผ่านปลั๊กอิน ผู้ใช้สามารถเลือกปลั๊กอินสำหรับ wake-word ได้ตามต้องการ (ค่าเริ่มต้นยังคงเป็น “Hey Mycroft”) และสามารถเลือกปลั๊กอิน STT ได้ ไม่ว่าจะเป็นแบบรันบนอุปกรณ์, ในเครือข่ายองค์กร (on-premises) หรือแบบออนไลน์
- ovos-audio – โมดูลที่เข้าถึงลำโพง โดยเป็นระบบที่ใช้ปลั๊กอินเพื่อให้ผู้ใช้สามารถเลือก TTS (การแปลงข้อความเป็นเสียง) ได้ตามต้องการ ไม่ว่าจะเป็นแบบรันบนอุปกรณ์, ในเครือข่ายองค์กร หรือแบบออนไลน์ ซึ่งรวมทุกอย่างที่เกี่ยวข้องกับเอาต์พุตเสียง
- ovos-phal –Platform/Hardware Abstraction Layer (ชั้นเชื่อมต่อฮาร์ดแวร์/แพลตฟอร์ม) เป็นระบบที่ใช้ปลั๊กอินเพื่อรองรับและจัดการการเชื่อมต่อฮาร์ดแวร์ เช่น HATs, อุปกรณ์ Mycroft A.I. Mark 1, Mark 2 ฯลฯ รวมถึงการเชื่อมต่อกับระบบอื่น ๆ เช่น Network Manager, คีย์บอร์ด, กล้อง และอื่นๆ
- ovos-gui – ส่วนติดต่อผู้ใช้แบบกราฟิก (GUI) ซึ่งถูกแบ่งออกเป็นสองระบบ ได้แก่ บัสที่ใช้ขยาย messagebus สำหรับการสื่อสารที่เกี่ยวข้องกับ GUI และตัว GUI เอง ค่าเริ่มต้นยังคงเป็น GUI ที่พัฒนาด้วย KDE Qt อย่างไรก็ตาม การพัฒนาส่วนนี้ชะลอตัวลงเนื่องจาก AIX ซึ่งเป็นนักพัฒนาหลักได้ย้ายไปทำโปรเจกต์อื่น และปัจจุบันไม่มีนักพัฒนา Qt ในกลุ่ม community อีกแล้ว ขณะนี้มีการพัฒนา GUI เวอร์ชัน HTMX เป็นทางเลือกที่เบากว่า และ GUI สามารถรันบนอุปกรณ์อื่นที่แยกจากกันได้หากต้องการ
โมดูลสามารถเลือกใช้ได้ตามต้องการ ดังนั้นหากคุณต้องการอุปกรณ์แบบไม่มีหน้าจอ (headless) และต้องการสร้างอุปกรณ์ที่คล้ายกับ Google Home Mini คุณสามารถละเว้น GUI ได้ หรือหากต้องการสร้างเพียงกล่องแชท (chat box) หรือเว็บแชท (webchat) ก็เพียงใช้แค่ messagebus, core และปลั๊กอินที่เกี่ยวข้องเท่านั้น OpenVoiceOS (OVOS) สามารถติดตั้งบนเครื่อง Linux ได้ทุกเครื่อง แต่ก็มีอิมเมจขั้นต่ำที่ใช้ Buildroot และอิมเมจที่ปรับแต่งให้เหมาะกับ Raspberry Pi โดยเฉพาะ
คุณสามารถพบซอร์สโค้ดของโครงการได้บน GitHub และเอกสารประกอบที่มีลิงก์ไปยังอิมเมจสำเร็จรูปพร้อมคำแนะนำบน GitHub.io
โครงการนี้ยังได้รับการเสริมด้วย HiveMind ซึ่งเป็นโปรเจกต์แยกต่างหากที่พัฒนาโดย jarbas หัวหน้านักพัฒนา Python ของ OVOS ซึ่งช่วยให้โมดูลต่าง ๆ ของ OpenVoiceOS สามารถกระจายการทำงานไปยังหลายอุปกรณ์ได้ Peter อธิบายเพิ่มเติมว่า:
ระบบนี้ช่วยขยาย message bus ให้สามารถสื่อสารผ่านเครือข่ายได้ พร้อมด้วยมาตรการรักษาความปลอดภัยที่เกี่ยวข้อง สิ่งนี้ทำให้เราสามารถถ่ายโอนภาระงานหนักไปยังเซิร์ฟเวอร์ที่ทรงพลัง ในขณะที่อุปกรณ์ขนาดเล็กที่มีทรัพยากรจำกัดสามารถทำหน้าที่เป็น ‘ดาวเทียม’ (satellite) ที่เชื่อมต่อกับเซิร์ฟเวอร์หลักได้ ตัวอย่างเช่น เราสามารถรันระบบหลักของ OVOS เช่น core และ phal บนเซิร์ฟเวอร์ประสิทธิภาพสูง ในขณะที่อุปกรณ์ขนาดเล็กจะรันเพียงแค่ listener สำหรับไมโครโฟนและ audio สำหรับเสียงตอบกลับ ตัวอย่างที่ดีที่สุดในปัจจุบันคือการรัน Home Assistant Voice เป็นเซิร์ฟเวอร์คลาวด์ และมีอุปกรณ์ Home Assistant voice satellite เป็นตัวรับ-ส่งเสียง
ในบางด้าน OpenVoiceOS Foundation เปรียบได้กับ Open Home Foundation แต่เป็นเวอร์ชันสำหรับสำหรับระบบสั่งการด้วยเสียง โดยมีเป้าหมายเพื่อปกป้องกลุ่มของนักพัฒนาและการพัฒนาทั้งหมดของเฟรมเวิร์กจากผลประโยชน์ทางการค้า ซึ่งหมายความว่าโครงการจะยังคงดำเนินต่อไปได้ แม้ว่าสปอนเซอร์หลักรายใดรายหนึ่งจะล้มละลายหรือถอนตัวไปก็ตาม พันธมิตรบางรายที่ใช้งาน OVOS ในปัจจุบัน ได้แก่ Visiolab, Royal Visio Foundation ซึ่งเป็นองค์กรสำหรับผู้พิการทางสายตาและผู้ที่มีปัญหาด้านการมองเห็น โดยได้ทดสอบโซลูชันนี้ในห้องปฏิบัติการภายในของตน, WASABI EU Project / COALA Augmented Manufacturing Analytics ซึ่งช่วยให้พนักงานโรงงานสามารถดำเนินงานที่ใช้เวลานานและต้องประมวลผลข้อมูลจำนวนมากได้อย่างมีประสิทธิภาพ
สามารถดูข้อมูลเพิ่มเติมได้บนเว็บไซต์ OpenVoiceOS
แปลจากบทความภาษาอังกฤษ : The OpenVoiceOS Foundation aims to enable open-source privacy and customization for voice assistants

บรรณาธิการข่าวและบทความภาษาไทย CNX Software ได้มีความสนใจในด้านเทคโนโลยี โดยเฉพาะ Smart Home และ IoT