当前位置:首页 > 行业动态 > 正文

modelscope-funasr中命令行用法 如何生成带时间戳的结果?

modelscopefunasr 命令行工具概述

modelscopefunasr 是一个针对自动语音识别(ASR)的命令行工具,它能够将音频文件转换为文本,该工具通常用于处理需要快速准确转录的场景,例如会议记录、讲座内容等,其特点包括支持多种语言、高准确率和实时性等。

生成带时间戳的结果

要生成带有时间戳的识别结果,我们需要了解几个关键参数及其含义:

outputformat:定义输出文件的格式,可以是 plain(纯文本)、json 或 json_with_time。

timestamp:指定是否在输出中包含时间戳信息。

timeformat:自定义时间戳的格式,默认为 %H:%M:%S.%f

使用这些参数时,基本的命令行格式如下:

modelscopefunasr input AUDIO_FILE output OUTPUT_FILE [outputformat FORMAT] [timestamp] [timeformat TIME_FORMAT]

AUDIO_FILE 是待转录的音频文件路径,OUTPUT_FILE 是转录结果的输出文件路径。

示例

假设我们有一个名为 sample.wav 的音频文件,我们希望将其转换为带有时间戳的 JSON 格式文本,时间格式为小时:分钟:秒.毫秒,可以使用以下命令:

modelscopefunasr input sample.wav output result.json outputformat json timestamp timeformat %H:%M:%S.%f

执行上述命令后,result.json 文件中会包含每个句子开始的时间戳,以及对应的识别文本。

结果分析

假设 result.json 的内容如下:

[
    {
        "start": "00:01:23.456",
        "end": "00:01:25.789",
        "text": "Hello, how are you?"
    },
    {
        "start": "00:01:25.789",
        "end": "00:01:28.123",
        "text": "I'm fine, thank you."
    }
]

在这个例子中,我们可以看到两个对话片段及其精确的开始和结束时间,第一个片段从 00:01:23.456 开始到 00:01:25.789 结束,第二个片段紧接着开始,并在 00:01:28.123 结束。

相关问答 FAQs

Q1: 如果我希望只获取文本结果,不包含时间戳,应该如何操作?

A1: 如果你不需要时间戳,只需省略 timestamp 参数即可,以下命令将生成不带时间戳的纯文本输出:

modelscopefunasr input sample.wav output result.txt

Q2: 我能否自定义时间戳的精度?

A2: 是的,你可以通过 timeformat 参数自定义时间戳的精度,如果你想让时间戳精确到秒,可以使用 %H:%M:%S 作为时间格式,下面是一个相应的命令行示例:

modelscopefunasr input sample.wav output result.json outputformat json timestamp timeformat %H:%M:%S

这样,输出的时间戳将只包含到秒级别的信息。

0