📄️ 后端架构概览
核心组件交互流程
📄️ 配置文件
下图是 v1.0.0 版本 配置文件的基本结构。
📄️ 语音识别 (ASR)
语音识别 (ASR, Automatic Speech Recognition) 将用户的语音转换成文字。本项目支持多个语音识别模型的实现。
📄️ 语言模型 (LLM)
本项目支持多种大语言模型后端与模型。
📄️ 智能体 (Agent)
智能体 (Agent) 是包含记忆,工具,人格的 LLM 系统。当前版本的预设选项是 basicmemoryagent。
📄️ 语音合成 (TTS)
安装所需的依赖并在 conf.yaml 进行配置后后,通过修改 conf.yaml 中的 TTS_MODEL 选项来启用相应的语音合成引擎。
📄️ 翻译
翻译功能
📄️ Docker 部署
由于重构幅度较大,Docker 镜像暂时还没有更新到 v1.0.0 版本,但是很快会更新。