微软发布用于人脸和语音的真实感复制的AI工具

针对Azure AI Speech只是“deepfakes创建者”的批评,微软表示已实施了保障措施。

6048

微软在本周的开发者大会上宣布了其对人工智能竞赛的最新贡献:该软件可以生成新的化身和声音,或者复制用户现有的外观和语音,这引发了人们的担忧,即它可能会加速deepfakes的创建,deepfake是人工智能制作的事件视频,但没有发生。

Azure AI Speech在微软Ignite 2023上发布,它使用人类图像进行训练,允许用户输入脚本,然后由人工智能创建的逼真化身大声“朗读”。用户可以选择预装的微软头像,也可以上传想要复制其声音和肖像的人的视频。微软在周三发布的一篇博客文章中表示,该工具可用于构建“对话代理、虚拟助理、聊天机器人等”。

帖子写道:“客户可以为他们的化身选择预先构建的或自定义的神经语音。如果自定义神经语音和自定义文本到语音化身都使用同一个人的声音和肖像,那么化身将与此人非常相似。”

该公司表示,新的文本到语音软件发布时有各种限制和保护措施,以防止滥用。该公司表示:“作为微软对负责任人工智能承诺的一部分,文本到语音化身的设计旨在保护个人和社会的权利,促进透明的人机交互,并遏制有害的deepfakes和误导性内容的扩散。”。

博客文章写道:“客户可以上传自己的化身达人视频记录,该功能用于训练自定义化身说话的合成视频。”。“阿凡达天才”是一个人在人工智能众所周知的相机前摆姿势。

这一宣布很快引发了批评,称微软推出了一个“deepfakes创建者”,这将更容易复制一个人的肖像,并让他说出和做他没有说过或做过的事情。微软自己的总裁在5月份表示,在人工智能的崛起中,deepfakes是他“最担心的”。

该公司在一份声明中反驳了这一批评,称定制的头像现在是一种“有限访问”工具,客户必须申请并获得微软的批准。用户还将被要求披露人工智能何时被用于创建合成语音或化身。

微软负责人工智能工程部门的Sarah Bird在一份声明中表示:“有了这些保障措施,我们有助于限制潜在风险,并使客户能够以透明和安全的方式将先进的语音和语音功能注入他们的人工智能应用程序。”。

随着各大科技公司竞相利用近年来的人工智能热潮,文本到语音化身制造商是最新的工具。在微软支持的OpenAI公司推出的ChatGPT大受欢迎之后,Meta和谷歌等公司将自己的人工智能工具推向了市场。

随着人工智能的兴起,人们越来越担心这项技术的能力,OpenAI首席执行官Sam Altman警告国会,它可能被用于干预选举,必须实施保障措施。

专家表示,当涉及到选举干预时,Deepfakes尤其危险。本月早些时候,微软推出了一款工具,允许政客和竞选活动对他们的视频进行认证和水印,以验证其合法性,并防止deepfakes的传播。Meta本周宣布了一项政策,要求披露人工智能在政治广告中的使用,并禁止竞选活动使用Meta自己的生成人工智能工具进行广告。

微海报