📄️ 后端架构概览
核心组件交互流程 (v1.0.0)
📄️ 配置文件 (Config)
下图是 v1.0.0 版本 配置文件的基本结构。
📄️ 语音识别 (ASR)
语音识别 (ASR, Automatic Speech Recognition) 将用户的语音转换成文字。本项目支持多个语音识别模型的实现。
📄️ 语言模型 (LLM)
本项目支持多种大语言模型后端与模型。
📄️ 智能体 (Agent)
智能体 (Agent) 是包含记忆,工具,人格的 LLM 系统。当前版本的预设选项是 basicmemoryagent。
📄️ 语音合成 (TTS)
安装所需的依赖并在 conf.yaml 进行配置后后,通过修改 conf.yaml 中的 TTS_MODEL 选项来启用相应的语音合成引擎。
📄️ 翻译 (Translate)
翻译功能
📄️ Docker 部署
由于重构幅度较大,Docker 镜像暂时还没有更新到 v1.0.0 版本,但是很快会更新。
📄️ 角色设定 & 提示词
Open-LLM-VTuber 项目支持你修改角色的人格提示词,同时支持添加多个不同的角色,在前端切换。
📄️ 远程部署与跨设备访问指南
本指南适用于以下场景: