通过 Azure 认知服务的智能语音功能[1],用户可以使用语音 SDK 开发工具包快速构建支持语音交互的各种应用。将语音转录为准确的文本 (STT,或语音识别)或者将文本转换成生动的语音 (TTS,或语言合成),从未像今天如此简单。这些工程和产品的创新,来自于各行各业的需求和启发,这其中也包括游戏行业。
在游戏中如何使用 AI 语音?
人工智能在游戏中的运用可以赋能更加灵活和快速反应的视频游戏体验。随着技术的不断变化和发展,AI 语音创新可以为游戏带来先锋性的巨大行业优势。
以下是三个典型用例:
AI 语音在游戏行业的用例
使用文本转语音开发游戏对话原型:缩短产品开发时间并节省开发费用,更快地将游戏推向市场。设计师和制作人可以使用不同的情感声音[2]快速切换对话台词,并实时地听到不同的声音效果,以确保台词的准确性。
通过语音转文本、翻译和文本转语音提高游戏可及性:使游戏更易于访问,并且可以通过单一接口[3]为游戏供多种声音功能。譬如,有声的游戏说明指引可以帮助无法阅读文本或理解某种语言的用户访问游戏;有声故事线可以帮助有视力障碍的玩家或尚未学会阅读的年幼玩家理解游戏。
可扩展的非玩家角色(NPC)声音以及有声交互:轻松地生成质量稳定、说话风格一致[4]并符合品牌需求的声音角色。游戏开发者可以将情感、口音、音调的细微差别、笑声或其他辅助语言的音效及表情添加到玩家游戏角色和 NPC 非玩家角色中,由这些角色来发起或参与游戏对话。
AI 语音在游戏行业的典型客户
模拟飞行:微软自己的游戏开发者正在使用 AI 语音改善用户体验。模拟飞行是微软历史上运行时间最长的游戏,尤其它的最新版本广受好评。这一版本不仅继承了其悠久的历史传统,而且进一步突破界限成为了有史以来技术最先进的模拟游戏。通过添加逼真的空中交通管制员声音这一项小功能,模拟飞行强力提升了游戏玩家体验。如果要预录制地球上每个机场的空中交通管制员的声音,这无疑是一项艰巨的任务 ——而 AI 语音则很好地解决了这一问题。Azure 文本转语音服务可以极速处理动态内容,低延迟、高可用、安全又可扩展。这个模拟飞行体验的游戏视频[5]展示了 Azure 语音服务为空中交通管制员提供的神经网络定制声音。
Undead Labs:Undead Labs 工作室正在将游戏推向大胆的新方向。他们是《腐烂国度》系列的制作者,已经将 Azure 神经网络语音合成使用在了游戏开发过程中。
Double Fine:Double Fine 是许多流行游戏包括 Psychonauts 意航员的生产商。他们正在利用 Azure 神经网络语音合成来制作未来的游戏项目原型。
你可以在 2022 年微软游戏开发者大会上查看我们的用例演示[6],了解更多详情。
开始使用
即刻开始使用 Azure 文本转语音[7]和语音转文本服务[8]来构建新的用户体验。此外,神经网络声音定制功能[9]可以为你定制多语言多风格的独特品牌声音。
[1]:https://azure.microsoft.com/en-us/products/cognitive-services/speech-services/
[2]:https://azure.microsoft.com/en-us/blog/announcing-new-voices-and-emotions-to-azure-neural-text-to-speech/
[3]:https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-synthesis-markup?tabs=csharp#adjust-speaking-languages
[4]:https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-synthesis-markup?tabs=csharp#adjust-speaking-styles
[5]:https://www.youtube.com/watch?v=PufwLrwOefA