โมดูลรู้จำเสียงพูดแบบออฟไลน์ รองรับการเขียนโปรแกรม Arduino และสั่งการด้วยเสียงแบบกำหนดเอง

เราได้เขียนบทความเกี่ยวกับโมดูลรู้จำเสียงพูด (Voice recognition) แบบออฟไลน์ ที่มีราคาไม่แพง ซึ่งใช้ไมโครคอนโทรลเลอร์ US516P6 หรือ TW-ASR ONE เพื่อช่วยให้สามารถเพิ่มฟังก์ชั่นอัจฉริยะไปยังโครงการโดยไม่ต้องเชื่อมต่อกับเครือข่ายเพื่อเพิ่มความเป็นส่วนตัวและลดเวลาในการส่งข้อมูล (latency)

การใช้งานดูเหมือนจะดีในทฤษฎี แต่ช่วงเวลานั้น (เมษายน 2022) มีความคิดเห็นความคิดเห็นบางส่วนในโพสต์ ไม่มีเอกสารประกอบที่ละเอียดหรือมีแต่ภาษาจีน และค่อนข้างใช้งานยาก แต่ตอนนี้ฉันเห็น DFRobot กำลังขายโมดูล “Gravity: Offline Voice Recognition Sensor – I2C & UART” พร้อมรองรับการเขียนโปรแกรม Arduino และค่อนข้างง่ายที่จะปรับเปลี่ยนไปตามที่ต้องการ

Voice Recognition DF2301QG

สเปคโมดูล Gravity Voice Recognition DF2301QG:

  • โมดูลจดจำเสียง (Voice recognition module) – โมดูล WS-2520-TR พร้อม
    • MCU – TBD
    • คำสั่งเสียงที่ใช้บ่อย 121 เสียง, คำสั่ง Wake word 1 เสียง
    • รองรับ learned Wake word 1 เสียง, คำสั่งที่กำหนดเอง User-defined 17 เสียง
    • Audio
    • เอาต์พุต – ลำโพงในตัวและอินเทอร์เฟสสำหรับลำโพงภายนอก
    • อินพุต – ไมโครโฟนคู่ที่มีความไว -28dB
  • อินเทอร์เฟสโฮสต์ – I2C (address 0x64) และ UART ผ่านตัวเชื่อมต่อ “Gravity” 4 พิน รองรับ 3.3V และ 5V
  • อื่นๆ – ไฟ LED แสดงสถานะพลังงาน (สีแดง), LED แสดงสถานะรับคำสั่งเสียง (สีน้ำเงิน)
  • แรงดันไฟฟ้า– 3.3 ถึง 5V
  • กระแสไฟสูงสุด – ≤370 mA (5V)
  • ขนาด – 49 x 32 มม.

WS 2520 TR voice recognition sensor

สิ่งที่สำคัญคือการทำงานกับโมดูลเสียงแบบออฟไลน์รุ่นนี้มีความสะดวกมากกว่าโมดูลเสียงแบบออฟไลน์รุ่นเก่า คำสั่ง Wake word ค่าเริ่มต้นคือ “Hello robot” แต่สามารถเปลี่ยนเป็นคำอื่นได้ด้วยคำสั่งเสียง “learning wake word” และต้องพูดคำสั่ง wake word ใหม่ซ้ำกัน เช่น “hello, there” สามครั้ง

โมดูลนี้มาพร้อมกับคำสั่งเสียงที่ตั้งไว้ล่วงหน้ามากกว่า 100 เสียง เช่น “เลี้ยวซ้าย 90 องศา”, “การจดจำแท็ก (Tag) ” “ลืม”, “ปิดไฟ” ฯลฯ และอื่น ๆ แต่ผู้ใช้ยังสามารถให้โมดูลเรียนรู้คำสั่งเสียงที่กำหนดเองได้ถึง 17 เสียงโดยใช้คำสั่งเสียง “Learning command word” สำหรับ ID, จะต้องพูดคำสั่งเสียงซ้ำกันสามครั้งเพื่อลงทะเบียน มีคำอธิบายทุกอย่างโดยละเอียดใน wiki

Offline Voice Recognition Arduino

โมดูลรู้จำเสียงพูดแบบออฟไลน์ DF2301QG แสดงการเชื่อมต่อกับบอร์ด Arduino clone ผ่านบอร์ด I2C แต่มันสามารถรองรับอุปกรณ์อื่นๆที่มีพอร์ต UART หรือ I2C ได้ รวมถึงบอร์ด Arduino อื่น ๆ บอร์ด Raspberry Pi หรือ SBC โมดูล ESP32 และบอร์ด ฯลฯ …

จนถึงตอนนี้เรายังไม่ได้เขียนโปรแกรมใดๆ และใช้เสียงในกำหนดค่าโมดูลเท่านั้น แต่ละ wake word และ voice  มี ID ของตัวเอง และนั่นคือสิ่งที่เราใช้ใน Arduino Sketch  ตามที่แสดงด้านล่างหลังจากติดตั้งไลบรารี DF2301Q Arduino แล้ว :


โมดูล DFRobot DF2301QG ราคา $16.90 (~580฿) ซึ่งมีราคาประมาณสองเท่าของโมดูลอื่นๆ ที่เคยเขียนบทความก่อนหน้านี้ แต่มันก็คุ้มค่าเพราะมันดูใช้งานง่ายกว่าโมดูลอื่นๆ มาก

แปลจากบทความภาษาอังกฤษ : Offline voice recognition module supports Arduino programming, custom voice commands

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
โฆษณา