正如我们在其他文章中看到的,自动语音识别 ( ASR )技术使用设备和软件来识别和处理口头语言,就像它可以用来通过声音验证一个人的身份一样。自动语音识别 (ASR) 无处不在,从 YouTube 上的自动字幕到Assistant 和 Alexa 等虚拟助手。 然而,尽管近年来这项技术取得了重大进展,但它并不总能提供准确的结果。在语音识别过程及其随后的文本翻译过程中,某些单词可能会被遗漏或错误翻译。简而言之,这就是“单词错误率”(WER),在西班牙语中可以翻译为“单词错误率”。 在本文中,我们将详细定义 WER 是什么以及为什么在准确评估。
高则意味话时犯
您考虑在呼叫中心实施的 ASR 系统时应考虑它。 什么是错误? 词错误率 (WER) 是衡量语音到文本准确性的常用指标。WER 评估语音识别的准确性,它是转录中发生的错误数量相对于所说单词总数的指标。 要计算 WER,请将错误总数(替换、插入和删 巴哈马电话号码数据 除的总和)除以所说的单词总数。此度量基于Levenshtein 距离,它衡量转录本中两个单词字符串之间的差异。例如,如果一份 36 字的电话通话记录有 9 个错误,则 WER 将为 25%。较低的 WER 通常表示 ASR 软件的精度较高,而较高的 WER 表示精度较低。 然而,WER 有几个局限性。
着系统在转录对
因为它没有考虑错误的来源,例如录音质量、背景噪音、麦克风质量、行业特定或技术术语以及说话者发音。此外,WER没有考虑到单词对于转录的特定目的的重要性。尽管一份成绩单的 WER 可能较低,但如果省略相关关键字进行分析,它可能用处不大,就像一些 WER 相对较高的系统可能会在特定上下文中产生有用的数据一样。因此,重要的是要考虑语音识映您和倡 加拿大人 导专别工具将如何处理数据以及哪些词对于转录目的很重要。 WER 如何减少呼叫错误? 为了减少呼叫中心的呼叫错误,可以使用 WER 来监控语音识别系统的准确性。如果 WER 很了很多错误。