微软发布可逼真复制人脸和声音的AI工具，引发对加剧深度伪造的担忧-科技让生活更美好

站长之家(ChinaZ.com)11月20日消息:在上周的开发者大会上，微软公布了其对人工智能竞赛的最新贡献:一款可以生成新头像和声音，或者复制用户现有外貌和声音的软件，这引起了人们对其可能加剧深度伪造创作的担忧。深度伪造是指使用AI从未发生过的视频。

2023年微软Ignite大会上宣布的Azure AI Speech由人类图像训练，允许用户输入脚本，然后这些脚本可以被人工智能创建的逼真化身“阅读”。用户可以选择预装的微软头像，或者上传他们想要模仿的人的声音和长相的视频。在微软上周三发布的博文中，工具可以用来构建“对话代理、虚拟助理、聊天机器人等。”。

文章写道:“客户可以为他们的头像选择预先构建或定制的神经声音。如果用同一个人的声音和外貌来定制神经语音和文语转换头像，头像会和那个人很像。」

微软表示，新的文本到语音转换软件发布时有各种限制和保护措施，以防止滥用。“作为微软对负责任的人工智能承诺的一部分，文本到语音化身旨在保护个人和社会的权利，促进透明的人机交互，并抵制有害的深度伪造和误导内容的扩散，”该公司表示。

“客户可以上传他们自己的《阿凡达》达人视频，这些视频用于训练定制化身说话的合成视频，”博客帖子写道。“《阿凡达》达人”是为艾的具象相机摆姿势的人。

这一声明很快招致批评，称微软发布了一款“深度伪造器”，它可以让一个人的外表更容易被复制，并让他说和做这个人从未说过或做过的事情。微软自己的总裁在5月份表示，深度伪造是他对人工智能崛起的“最大担忧”。

在一份声明中，微软反驳了这些批评，称定制头像现在是一种“限制访问”的工具，客户必须申请并获得微软的批准。用户还将被要求透露在创建合成语音或头像时使用了AI。

微软负责人工智能工程部门的莎拉·伯德(Sarah Bird)在一份声明中表示:“通过这些保障措施，我们可以帮助限制潜在风险，并使客户能够以透明和安全的方式将高级语音和语音功能集成到他们的人工智能应用中。」

文字转语音头像制造工具是近年来各大科技公司抢占人工智能热潮的最新工具之一。在微软支持的公司OpenAI推出的ChatGPT大受欢迎之后，Meta和Google这样的公司也推出了自己的人工智能工具。

随着AI的兴起，人们越来越担心这项技术的能力。OpenAI首席执行官萨姆·奥特曼警告国会，它可能被用于干预选举，必须实施保护措施。

专家表示，深度造假在选举干预中尤其危险。本月早些时候，微软推出了一款工具，允许政治家和选举活动对他们的视频进行认证和水印，以验证其合法性并防止深度伪造的传播。Meta本周宣布了一项政策，公开AI在政治广告中的使用，并禁止竞选团队使用Meta自己的AI生成工具进行广告宣传。

未经允许不得转载：科技让生活更美好 » 微软发布可逼真复制人脸和声音的AI工具，引发对加剧深度伪造的担忧

微软发布可逼真复制人脸和声音的AI工具，引发对加剧深度伪造的担忧

作者：pu

相关推荐