ESP32 Agent Dev Kit เป็นชุดพัฒนา Voice Assistant ที่ใช้ ESP32-S3 และรองรับการเชื่อมต่อกับ Large Language Models (LLM)

ESP32 Agent Dev Kit เป็นชุดพัฒนาสำหรับ Voice Assistant ที่ใช้ ESP32-S3 ซึ่งรองรับการเชื่อมต่อกับโมเดลภาษาใหญ่ (LLM) ยอดนิยม เช่น ChatGPT, Gemini และ Claude ได้

Wireless-Tag ระบุว่าชุดพัฒนานี้เหมาะสำหรับ “95% ของแอปพลิเคชัน AIoT ตั้งแต่อุปกรณ์สมาร์ทโฮมไปจนถึงของเล่นตั้งโต๊ะ หุ่นยนต์ และเครื่องมือวัดต่าง ๆ”

ESP32 Agent Dev Kit LLM enabled voice assistant

ในบางแง่มุม ESP32 Agent Dev Kit มีความคล้ายคลึงกับ SenseCAP Watcher แต่มีจอแสดงผลขนาดใหญ่กว่าแบบไม่รองรับการสัมผัส และมีช่องอินพุตไมโครโฟนคู่ แต่ชุดพัฒนานี้ไม่รองรับโมเดลภาษาในพื้นที่ (Local Language Models) แต่มีอินเทอร์เฟซ MikroBUS มาตรฐานสำหรับการขยายระบบ

สำหรับความสามารถด้านเสียง ESP32 Dev Kit มาพร้อมไมโครโฟนตัดเสียงรบกวน 2 ตัวในตัว และลำโพงความละเอียดเสียงสูง (High-Fidelity Speaker) นอกจากนี้ยังมีเซ็นเซอร์อินฟราเรดเลเซอร์สำหรับตรวจจับระยะใกล้ ซึ่งสามารถตรวจจับการเคลื่อนไหวและความใกล้ชิดของมนุษย์ เพื่อมอบ “ประสบการณ์การโต้ตอบอัจฉริยะ”

สเปคของ ESP32 Agent Dev Kit:

  • MCU – ไมโครคอนโทรลเลอร์ ESP32-S3 Tensilica LX7 แบบ Dual-core @ 240MHz, PSRAM 8MB
  • ที่เก็บข้อมูล – flash 16MB
  • จอแสดงผล – หน้าจอสัมผัสขนาด 3.5 นิ้ว ความละเอียด 480×360
  • กล้อง – โมดูลกล้อง OmniVision OV5647 ความละเอียด 5MP มุมมองภาพ 120°
  • เสียง – ลำโพง Hi-Fi; พร้อมไมโครโฟนความไวสูง 2 ตัว
  • เครือข่าย – รองรับ Wi-Fi 2.4GHz และ Bluetooth 5 (LE) ผ่าน ESP32-S3
  • USB – 1x USB-C (สำหรับจ่ายไฟและการโปรแกรม)
  • การขยาย – อินเทอร์เฟซ MikroBUS มาตรฐาน
  • อื่นๆ – เซนเซอร์ตรวจจับระยะใกล้อินฟราเรด
  • แหล่งจ่ายไฟ – 5V DC
  • ขนาด – 94 x 62 x 13.6 มม.
  • อุณหภูมิขณะใช้งาน – 0 ถึง 60°C

ESP32 Agent Dev Kit

ESP32 Agent Dev Kit รองรับแพลตฟอร์มการพัฒนาทั้ง Arduino IDE และ ESP-IDF โดยสามารถโต้ตอบแบบเรียลไทม์ผ่าน Volcano Engine RTC และ OpenAI’s Realtime API นอกจากนี้ยังรองรับ ChatGPT, Claude และ Gemini ผ่านแพลตฟอร์ม Coze AI

แม้ว่าจะโฆษณาอุปกรณ์นี้ว่าเป็นโอเพ่นซอร์ส แต่ข้อมูลใน GitHub repository มีอยู่เพียงเล็กน้อย เฟิร์มแวร์ของผลิตภัณฑ์มีอยู่ในรูปแบบไบนารี และโค้ดไดรเวอร์ที่เขียนด้วยภาษา C ถูกจัดมาในรูปแบบไฟล์ tarball ซึ่งขัดกับวัตถุประสงค์ของการใช้ระบบควบคุมเวอร์ชัน (Version Control System) อย่าง git

แคมเปญระดมทุนของ ESP32 Agent Dev Kit เปิดตัวบน Kickstarter และสามารถระดมทุนได้เกินเป้าหมาย $1,668 (~56,000฿) ภายในระยะเวลาไม่กี่วันก่อนที่แคมเปญจะสิ้นสุด โดยสินค้านี้มีราคาเริ่มต้นที่ $40 (~1,300฿) บน Kickstarter และตั้งราคาในตลาดที่ $69(~2,300฿) ซึ่งถูกกว่าผลิตภัณฑ์ SenseCAP Watcher ที่กล่าวถึงก่อนหน้านี้ แต่มีคุณสมบัติเด่นน้อยกว่า การจัดส่งสินค้ามีกำหนดเริ่มต้นในเดือนมีนาคม 2025

แปลจากบทความภาษาอังกฤษ : ESP32 Agent Dev Kit is an LLM-powered voice assistant built on the ESP32-S3 platform (Crowdfunding)

Subscribe
Notify of
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
โฆษณา