语音转文字

📅 2026/7/1 2:24:43
语音转文字
import os import dashscope # 以下为华北2北京地域的URL调用时请将WorkspaceId替换为真实的业务空间ID各地域的URL不同。 dashscope.base_http_api_url https://ws-t6feqeqjdpbi7po1.cn-beijing.maas.aliyuncs.com/api/v1 # 请用您的本地音频的绝对路径替换 ABSOLUTE_PATH/welcome.mp3 # audio_file_path D:\program\bigmodel\week2\day12\test.wav audio_file_path rD:\program\bigmodel\week2\day12\录音 (3).mp3 messages [ {role: user, content: [{audio: audio_file_path}]} ] response dashscope.MultiModalConversation.call( # 新加坡/美国地域和北京地域的API Key不同。获取API Keyhttps://help.aliyun.com/zh/model-studio/get-api-key # 若没有配置环境变量请用阿里云百炼API Key将下行替换为api_key sk-xxx, api_keyos.getenv(DASHSCOPE_API_KEY), # 若使用美国地域的模型需在模型后面加上“-us”后缀例如qwen3-asr-flash-us modelqwen3-asr-flash, # audio_formatwav, # 文件是wav这里才填wav messagesmessages, result_formatmessage, asr_options{ # language: zh, # 可选若已知音频的语种可通过该参数指定待识别语种以提升识别准确率 enable_itn:False } ) print(response.output.choices)