跳到主要内容

后端用户指南

📄️ 后端架构概览

核心组件交互流程 (v1.0.0)

📄️ 配置文件 (Config)

下图是 v1.0.0 版本配置文件的基本结构。

📄️ 语音识别 (ASR)

语音识别 (ASR, Automatic Speech Recognition) 将用户的语音转换成文字。本项目支持多个语音识别模型的实现。

📄️ 语言模型 (LLM)

本项目支持多种大语言模型后端与模型。

📄️ 智能体 (Agent)

智能体 (Agent) 是包含记忆，工具，人格的 LLM 系统。当前版本的预设选项是 basicmemoryagent。

📄️ 语音合成 (TTS)

安装所需的依赖并在 conf.yaml 进行配置后后，通过修改 conf.yaml 中的 TTS_MODEL 选项来启用相应的语音合成引擎。

📄️ 翻译 (Translate)

翻译功能

📄️ Docker 部署

由于重构幅度较大，Docker 镜像暂时还没有更新到 v1.0.0 版本，但是很快会更新。

📄️ 角色设定 & 提示词

Open-LLM-VTuber 项目支持你修改角色的人格提示词，同时支持添加多个不同的角色，在前端切换。

📄️ 远程部署与跨设备访问指南

本指南适用于以下场景：