长音频离线流式识别 · 生成字幕

📅 2026/6/26 3:27:02
长音频离线流式识别 · 生成字幕
FireRedASR 大模型 manyspeech asr -t offline --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -m chunk --format srt --threads 2 -i file -f /path/to/0.wav # FunASR 轻量模型 manyspeech asr -t offline --model Fun-ASR-Nano-2512-LLM-int8-onnx -m chunk --format srt --threads 2 -i file -f /path/to/0.wav2. 麦克风离线流式识别 · 生成字幕manyspeech asr -t offline --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -m chunk --format srt --threads 2 -i mic manyspeech asr -t offline --model Fun-ASR-Nano-2512-LLM-int8-onnx -m chunk --format srt --threads 2 -i mic3. 麦克风实时流式识别 · 实时生成字幕manyspeech asr -t online --model paraformer-large-zh-en-int8-onnx-online -m chunk --format srt --threads 2 -i mic manyspeech asr -t online --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630 -m chunk --format srt --threads 2 -i mic manyspeech asr -t online --model k2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630 -m chunk --format srt --threads 2 -i mic4. VAD 语音端点检测 · 剔除音频或录音的静音噪声等部分# 麦克风在线检测 manyspeech vad -t online -i mic # 音频文件离线检测剔除静音 manyspeech vad -t offline -f meeting.wav # 指定输出格式 manyspeech vad -t offline --format wav -f noisy_speech.wav5. 标点符号恢复 · 为文本自动标点或重新标点支持中英文# 直接输入文本 manyspeech punc --text 今天天气不错一起去郊游吧 # 从文件读取 manyspeech punc -f transcript.txt # 指定输出JSON格式 manyspeech punc --text hello world --format json # 交互输入 manyspeech punc