mirror of
https://github.com/modelscope/FunASR
synced 2025-09-15 14:48:36 +08:00
62 lines
1.4 KiB
Markdown
62 lines
1.4 KiB
Markdown
此目录是为了建设www.funasr.com网站,目前已经有了域名与公网服务器,欢迎社区用户参与建设,主要从3方面:
|
||
|
||
- http服务器搭建
|
||
- html网页设计
|
||
- funasr相关材料
|
||
|
||
其中,http服务器,不限制编程语言,推荐python-http(可维护性好?)?
|
||
|
||
html设计可以参考whisper( https://openai.com/research/whisper )
|
||
|
||
需要展示内容:
|
||
|
||
1、funasr介绍
|
||
|
||
可以AIGC生成个语音相关的炫酷配图
|
||
|
||
配上文字介绍
|
||
|
||
FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型的研究和生产,并推动语音识别生态的发展。让语音识别更有趣!
|
||
|
||
2、核心功能
|
||
|
||
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。
|
||
|
||
3、Paraformer模型介绍
|
||
|
||
Paraformer模型结构图(已有)
|
||
|
||
文字描述
|
||
|
||
4、离线文件转写服务
|
||
|
||
原理图
|
||
|
||
文字介绍
|
||
|
||
安装
|
||
|
||
使用
|
||
|
||
视频教程链接
|
||
|
||
5、实时听写
|
||
|
||
原理图
|
||
|
||
文字介绍
|
||
|
||
安装
|
||
|
||
使用
|
||
|
||
视频教程链接
|
||
|
||
6、github
|
||
|
||
https://github.com/alibaba-damo-academy/FunASR
|
||
|
||
7、社区交流
|
||
|
||
|