哈里斯说“ 拜登在辩论中暴露了自己是个老糊涂”?!人工智能将操控政治?
近日,埃隆·马斯克最近分享了一段经过修改的视频,视频中模仿了美国副总统卡马拉·哈里斯的声音。
在距离美国大选的选举日倒数几个月之时,这一事件引发了公众对人工智能技术可能操控政治选举的广泛担忧。
虚假操控
马斯克在X上发布的这段视频,使用了许多与民主党总统候选人哈里斯发布的竞选广告中相同的视觉效果,但视频将画外音换成了另一个令人信服的哈里斯模仿者的声音。
视频中的声音说道:“我,卡玛拉·哈里斯,是你们的民主党总统候选人,因为乔·拜登终于在辩论中暴露了自己是个老糊涂。”视频声称哈里斯是“折中的选择”,因为她是一名女性和有色人种,并说她“对管理国家一无所知”。视频还添加了哈里斯的一些真实过往片段。
哈里斯竞选团队发言人米娅·埃伦伯格在给媒体的一封电子邮件中表示:“我们相信美国人民想要哈里斯副总统提供的真正的自由、机会和安全,而不是埃隆·马斯克和唐纳德·特朗普虚假的、被操纵的谎言。”
这段被广泛分享的视频是一个例子,表明随着美国总统大选的临近,逼真的人工智能生成的图像、视频或音频片段如何被用来调侃和误导政治。
这也揭示了一个事实:尽管高质量的人工智能工具越来越容易获得,但迄今为止联邦政府仍未采取重大行动来规范它们的使用,指导人工智能在政治领域的规则主要由各州和社交媒体平台制定。
混淆视听
该视频还引发了一些问题:即如何更好地处理模糊人工智能适当使用界限的内容,特别是如果它属于讽刺类别。
发布该视频的原始用户是一位名为“Mr Reagan”的YouTuber,他在YouTube和X 都披露,该视频是恶搞。但根据平台的数据,马斯克的帖子已被观看超过1.23亿次,而帖子只包含一个标题“这太棒了”,并带有一个笑脸表情符号。
熟悉该平台的X用户可能知道,点击马斯克的帖子可以看到原始用户的帖子,在那里可以看到披露的内容。马斯克的标题并没有指导网友这样做。
一些在线用户质疑马斯克的帖子是否违反了X的政策,该政策规定用户“不得分享合成的、被操纵的或脱离上下文的媒体,这些媒体可能会欺骗或混淆人们并导致伤害。”
但是,该政策对讽刺作品有一个例外,只要它们不会“引起对媒体真实性的严重混淆”。
本月初,马斯克公开表示支持共和党候选人、前总统唐纳德·特朗普竞选美国总统。
重大分歧
研究称,X上与美国大选相关的虚假账户激增。而美国选举官员对政治广告中人工智能的使用规则存在分歧。
两位专门研究人工智能生成媒体的专家审查了虚假广告的音频,并证实其中大部分内容是使用人工智能技术生成的。
加州大学伯克利分校的数字取证专家哈尼·法里德 (Hany Farid) 表示,该视频展示了生成式人工智能和深度伪造的威力。“人工智能生成的声音非常好,”他在一封电子邮件中说道。“尽管大多数人不会相信这是副总统哈里斯的声音,但当视频中的文字以她的声音表达时,其震撼力会更强。”
Farid说,向公众提供语音克隆工具和其他人工智能工具的人工智能公司应该做得更好,以确保他们的服务不会被以伤害人民或民主的方式使用。
公民权利倡导组织联合主席Rob Weissman不同意Farid的观点,他认为很多人会被这段视频愚弄。
“我不认为这是个玩笑,”Weissman在接受采访时说。“我敢肯定,大多数人看到它时都不会认为这是个玩笑。视频质量不是很好,但已经足够好了。而且正是因为它符合当下的热门主题,大多数人才会相信这是真的。”
Weissman的组织一直倡导国会、联邦机构和各州对生成性人工智能进行监管,他表示这段视频是“我们一直警告的那种东西”。
但国会尚未通过关于政治领域人工智能的立法,联邦机构也只采取了有限的措施,大部分现行的美国法规都由各州自行制定。据全国州议会会议(National Conference of State Legislatures,NCSL)称,超过三分之一的州已经制定了自己的法律,规范人工智能在竞选和选举中的使用。
除了X,其他社交媒体公司也制定了针对其平台上分享的合成和操纵媒体的政策。例如,视频平台YouTube上的用户必须披露他们是否使用生成人工智能制作视频,否则将被停止更新。
AI的“死穴”
另一份报告还揭示了一个有趣的现象:人工智能很难理解纽约、新泽西和长岛的口音。
报告称,虽然人工智能越来越受欢迎,各种应用程序都利用该技术来制作图片、视频等。然而,随着人工智能的发展,它仍然面临着理解人类一切(包括口音)的挑战。
纽约市的口音包括多种变体,尤其是布鲁克林和皇后区的口音,其独特的发音和语调常常难以被AI系统准确理解。
新泽西口音也对人工智能(AI)系统构成挑战。新泽西的口音有其独特的特征,尤其是在某些区域,例如北新泽西和南新泽西,口音会有明显的差异。
例如:元音的变化,“coffee”发音更接近“cawfee”,“water”发音更接近“wooder”;
r音的处理,在某些词语中,r音的发音可能会有所变化。
鼻音化,一些发音具有独特的鼻音化特征。
快节奏,新泽西的口音通常语速较快,发音清晰但节奏紧凑。
“我们不同地区的方言可以追溯到早期的定居模式,”纽约大学语言学系助理教授劳雷尔·麦肯齐博士说。“不同的地区由不同的群体定居。最初的定居者奠定了方言模式,这些模式已经延续了数百年,直到今天。”
北泽西人与纽约人和波士顿人一样,以省略“R”而闻名,例如在“park”、“car”和“New York”等词中。
麦肯齐解释说,如今波士顿人会省略“R”,而费城人却不会,这是因为 17 世纪英国方言之间存在着地域差异。她说,英格兰南部人会省略“R”,而英格兰北部人则不会。
“波士顿的定居者是来自英格兰南部的人,而费城的定居者是来自英格兰北部的人,”麦肯齐说。“如今纽约市和费城方言之间最大的差异之一就是纽约人会省略‘R’,而费城人则不会。”
其原因可以追溯到 17 世纪,当时第一批定居者从英国来到东海岸。
“纽约市也是由来自英格兰北部的人定居的,这意味着 300 年前的纽约人会把 R 发成音,”她说。“然而,在 19 世纪,受波士顿的影响,纽约口音开始去 R 音。这种影响从未传到费城,因此费城人一直把 R 发成音。”
我们说话的方式在很大程度上体现了我们的身份。就像费城人不喜欢被误认为是纽约人一样,南泽西人也不喜欢被误认为是北泽西人,反之亦然。
ref: