web pages

This commit is contained in:
游雁 2023-11-19 00:10:58 +08:00
parent 3f4dc26442
commit 273386c147

View File

@ -26,14 +26,18 @@ html设计可以参考whisper https://openai.com/research/whisper
Paraformer模型结构图已有
文字描述
文字描述:
Paraformer是一种非自回归端到端语音识别模型。非自回归模型相比于目前主流的自回归模型可以并行的对整条句子输出目标文字特别适合利用GPU进行并行推理。Paraformer是目前已知的首个在工业大数据上可以获得和自回归端到端模型相同性能的非自回归模型。配合GPU推理可以将推理效率提升10倍从而将语音识别云服务的机器成本降低接近10倍。
4、离线文件转写服务
原理图
文字介绍
文字介绍:
FunASR离线文件转写软件包提供了一款功能强大的语音离线文件转写服务。拥有完整的语音识别链路结合了语音端点检测、语音识别、标点等模型可以将几十个小时的长音频与视频识别成带标点的文字而且支持上百路请求同时进行转写。输出为带标点的文字含有字级别时间戳支持ITN与用户自定义热词等。服务端集成有ffmpeg支持各种音视频格式输入。软件包提供有html、python、c++、java与c#等多种编程语言客户端,用户可以直接使用与进一步开发。
安装
使用
@ -44,7 +48,9 @@ html设计可以参考whisper https://openai.com/research/whisper
原理图
文字介绍
文字介绍:
FunASR实时语音听写软件包集成了实时版本的语音端点检测模型、语音识别、语音识别、标点预测模型等。采用多模型协同既可以实时的进行语音转文字也可以在说话句尾用高精度转写文字修正输出输出文字带有标点支持多路请求。依据使用者场景不同支持实时语音听写服务online、非实时一句话转写offline与实时与非实时一体化协同2pass3种服务模式。软件包提供有html、python、c++、java与c#等多种编程语言客户端,用户可以直接使用与进一步开发。
安装