# xiaozhi-esp32-server

> 本项目为xiaozhi-esp32提供后端服务，帮助您快速搭建ESP32设备控制服务器。Backend service for xiaozhi-esp32, helps you quickly build an ESP32 device control server.

- **URL**: https://www.freshcrate.ai/projects/xiaozhi-esp32-server
- **Author**: xinnan-tech
- **Category**: MCP Servers
- **Latest version**: `v0.9.4` (2026-06-03)
- **License**: MIT
- **Source**: https://github.com/xinnan-tech/xiaozhi-esp32-server
- **Homepage**: http://xiaozhi.biz
- **Language**: JavaScript
- **GitHub**: 9,342 stars, 3,180 forks
- **Registry**: github
- **Tags**: `dify`, `esp32`, `javascript`, `mcp-server`, `xiaozhi`, `xiaozhi-ai`, `xiaozhi-esp32`, `xiaozhi-server`

## Description

本项目为xiaozhi-esp32提供后端服务，帮助您快速搭建ESP32设备控制服务器。Backend service for xiaozhi-esp32, helps you quickly build an ESP32 device control server.

## Recent releases

| Version | Date | Urgency | Changes |
| --- | --- | --- | --- |
| `v0.9.4` | 2026-06-03 | High | - 增加设备之间相互呼叫，`网络电话`功能 - 新增了`web_search`联网搜索工具 - 将原来的测试页面`test_page`独立成`digital-human`数字人模块，该模块具备`唤醒对话`功能 - 修复了一些bug |
| `v0.9.3` | 2026-04-27 | High | - 新增`豆包ASRv2`语音识别和`豆包TTS2`语音合成，**更省钱** - 更新基础提示词，去除啰嗦感，强化智能体身份定位 - 智控台增加小型语言模型(SLM)的支持，目前用于聊天会话总结标题，后期可以加速唤醒答复 - 新增记忆模式: 新增"仅上报聊天记录不总结记忆"(mem_report_only)供应器 - 修复其他一些已知bug |
| `v0.9.2` | 2026-03-14 | Medium | - 可调整智能体音色 `语种`、`语调`、`语速` - 新增智能体`标签`功能 - 新增登陆页的`用户协议`和`隐私政策` - 优化`知识库`与`RAG架构` - 修复一些已知bug |
| `v0.9.1` | 2026-01-28 | Low | - 增加FunASR、FunASRServer两个ASR情绪和语种返回，给到LLM - 在部署mqtt-udp网关后，可以在智控台自定义esp32盒子的表情，在线烧录自定义表情 - test_page页面增加虚拟人物，配置ota地址后，可直接和虚拟人物在页面上打电话聊天 - 调整xiaozhi-server默认的播放音频采样率为24000，与虾哥平台保持一致 - 修复一些已知的bug |
| `v0.8.11` | 2026-01-02 | Low | - `全模块部署`记忆总结迁移到`manager-api`模块，用于解决`原websocket`关闭时因记忆总结占用时长久，导致关闭时间延长的问题。 -  `单模块部署`也支持ota固件自动升级，详细使用方法，[参考这里](https://github.com/xinnan-tech/xiaozhi-esp32-server/blob/main/docs/ota-upgrade-guide.md) - 增加`阿里百炼Paraformer实时语音识别服务` - `提示词上下文`按需获取位置、天气 |
| `v0.8.10` | 2025-12-13 | Low | - 修复长按设备vad自动打断的bug - 扩展智能体【上下文源】功能，使用说明[点击这里](https://github.com/xinnan-tech/xiaozhi-esp32-server/blob/main/docs/context-provider-integration.md) - 智控台可配置websocket接口认证`server.auth.enabled` - 加强未授权设备的连接管理、初始化管理。 |
| `v0.8.9` | 2025-12-01 | Low | - 优化websocket连接时内存回收 - 增强 LLM 工具调用能力，多工具并行调用 |
| `v0.8.8` | 2025-11-16 | Low | - 支持本地知识库，集成方法参照[这里](https://github.com/xinnan-tech/xiaozhi-esp32-server/blob/main/docs/ragflow-integration.md) - 重构`test_page.html` |
| `v0.8.6` | 2025-11-01 | Low | - 服务端MCP新增支持Streamable HTTP传输协议 - 默认版本不提供设备ID敏感信息，按需开启 - 暂时下架智控台远程控制设备，待逻辑成熟后再恢复该功能 - 修复一些bug |
| `v0.8.5` | 2025-10-19 | Low | - 在智控台可克隆音色，详细教程[见这里](https://github.com/xinnan-tech/xiaozhi-esp32-server/blob/main/docs/huoshan-streamTTS-voice-cloning.md) - 调整mcp接入点，在调用mcp方法时携带mac地址参数 - 增强单模块部署时token生成及校验 - 修复多智能体用同一款音色时，缓存唤醒音频串乱的bug |

## Citation

- HTML: https://www.freshcrate.ai/projects/xiaozhi-esp32-server
- Markdown: https://www.freshcrate.ai/projects/xiaozhi-esp32-server.md
- Dependencies JSON: https://www.freshcrate.ai/api/projects/xiaozhi-esp32-server/deps

_Generated by freshcrate.ai. Indexes github releases for AI-agent ecosystem packages._