提示工程(Prompt Engineering)是一门较新的学科,关注提示词开发和优化,帮助用户将大语言模型(Large Language Model, LLM)用于各场景和研究领域。

ReadMore »



对于语音合成项目,数据预处理对最终合成效果至关重要,这里总结梳理下常用音频编辑软件数据处理方法。

ReadMore »



FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。它提供了录制、转换以及流化音视频的完整解决方案。

ReadMore »



ChatGPT是一种基于 GPT 3 语言模型的对话系统技术。它使用了GPT-3模型中的一个子集,能够在回答问题的同时进行上下文延伸,表现出较好的人类化特征。

ChatGPT 技术可以应用于客服聊天机器人、智能问答系统、语音语义理解等领域。它能够根据用户输入的文本返回人类化的响应,提高用户体验。

ReadMore »



语音合成技术主要包含文本前端(Text Frontend)、声学模型(Acoustic Model) 和声码器(Vocoder)三个主要模块。

ReadMore »