近日,科技媒体 macstories 通过一项实测,揭示了苹果公司全新推出的 Speech API 的强大性能。通过转录一段长达34分钟、大小为7GB 的4K 视频,该技术仅用时45秒完成转录,速度之快令人惊叹。
这项技术的推出是在2025年 WWDC 全球开发者大会上宣布的,其中包括两个重要模块:SpeechAnalyzer 和 SpeechTranscriber。macstories 团队使用了基于这些模块开发的 Yap 应用工具,对其转录性能进行了详细测试。结果显示,Yap 在处理视频时展现出了显著的速度优势,远超目前市场上其他主流转录工具。

在与竞争对手的对比中,Yap 完成转录所需时间为45秒,而 OpenAI 的 Whisper(MacWhisper V3Turbo 版本)则需要101秒,速度慢了55%。其他工具如 VidCap 和 MacWhisper V2的转录时间分别为1分55秒和3分55秒,这进一步突显了 Yap 的优势。
尽管所有工具在专有名词识别方面存在一定误差,比如在转录 “AppStories” 时的识别不准确,但 Yap 的本地化运算能力使其在处理速度上具有无可比拟的优势。这意味着,如果用户每周处理多段视频,使用 Yap 将节省大量时间,提升工作效率。

苹果在转录技术领域的这一创新不仅提高了效率,也为创作者、教育工作者和内容制作者带来了便利。随着这项技术的普及,未来我们可能会看到更多企业在视频处理和内容生成方面的应用。总之,苹果的这项新技术标志着语音转录领域的一次革命,未来的内容生产将因其而变得更加高效与智能。
# ["SpeechAPI" # "苹果" # "Yap" # "Whisper"]