人工智能图像识别技术-灰度图像人体识别
摆出两张照片,让你分辨其中哪一张是 AI 生成的;给你两分钟时间,让你判断网线另一头同你聊天的是 AI 还是人类。无论答对还是答错,抉择时的摇摆说明了一切:AI 突进,但你还没有做好准备。
一张由 Midjourney 5.1 版本生成,另一张则是真照片。
抖音 5 月 9 日发布关于人工智能生成内容的平台规范暨行业倡议。其中提到,发布者应对人工智能生成内容进行显著标识人工智能图像识别技术,帮助其他用户区分虚拟与现实,特别是易混淆场景。若发布者利用生成式 AI 技术创作、发布侵权内容,造谣传谣,一经发现,平台将严格处罚。
“如果用户在平台上发布的人工智能生成的假视频、假消息造成了不良的影响,第一责任人肯定是用户。”上海大邦律师事务所高级合伙人游云庭接受澎湃新闻记者采访时表示:“平台现在是触发式监管,比如说浏览量在 500 次以下的,哪怕有问题,他也不担责。但是浏览量到了一定程度,比如说上了热搜人工智能图像识别技术,平台是需要进行人工审核的。这个时候平台就要承担责任了。”
游云庭补充道:“监管的操作第一线肯定是平台。”
同时,各国政府都在考虑加大对 AI 的监管力度。4 月 27 日,欧盟达成《人工智能法(The AI Act)》协议,为世界上第一部综合性人工智能法律铺平道路。
科技公司担起责任,用技术制衡 AI 滥用。5 月 11 日,谷歌在 Google I/O 大会上公布了它的 AI 生成图像识别工具,你可以通过上传来源不明的图片、执行反向图片搜索,了解到这张图片被谷歌初次收录的时间、最早出现的网站。如果一张带有新闻机构水印的图片首次出现在搞笑网站,那它很有可能是伪造的。
谷歌还宣布,它自己的生成式 AI 工具将在每张图片中包含元数据、嵌入水印,以表明这是 AI 生成的图像,而不是真实照片。谷歌的博客文章写道,Midjourney、Shutterstock 和其他公司将在 “未来几个月”推出这种标记。
AI 野蛮生长的时代,科技是最快的解法。
科技解法一:
AI 生成内容识别器
在线课程供应商 Study.com 向 1000 名 18 岁以上的学生发起调查,结果表明超过 89%的学生使用 ChatGPT 来完成家庭作业。如果靠人力一条条地去分辨 AI 生成的痕迹,实在太过劳心劳力。
所以,最直接的想法是,不如让 AI 来辨别内容是否由 AI 生成。2 月 1 日,OpenAI 团队推出“AI 生成内容识别器”,旨在识别文本是由电脑自动生成还是人类撰写,其本质上是一个区别真实内容和 AI 生成内容的分类器。不过,OpenAI 在博客中指出,此识别器对 AI 撰写内容的检出成功率仅为 26%。
科技网站 TechCrunch 曾在 2 月份用类似 ChatGPT 的聊天机器人 Claude 生成了 7 段不同风格的文字,来测试几个比较流行的 AI 文本检测器的“侦查能力”。结果,没有 AI 检测器能够通关。
然而,随着 AI 的能力越来越强,绕过 AI 检测器也变得越来越容易。
拿上述表现最佳的 GPTZero 来说,澎湃新闻记者用 GPT-4 生成的一段 250 字的小说,被其判定为“有可能完全出自人类之手”。
GPT-4 生成的文字被 GPTZero 判定为“有可能完全出自人类之手”
科技解法二:数字水印
数字水印指,AI 生成时,以用户肉眼不可察的方式,在内容中插入一些信息,打上“此文章(此图)由 AI 生成”的隐秘水印。
AI 生成内容识别器失败之后,OpenAI 开始考虑在生成的文本中加入数字水印。OpenAI 对齐团队(Alignment Team,主要负责提高系统安全性)负责人 Jan Leike 对《纽约时报》透露,OpenAI 正在探索的水印方法类似于马里兰大学研究人员最近发表的一篇论文中描述的方法。
然而这种新方法的局限之处在于,水印只有从一开始就嵌入到大语言模型才有效。若要广泛运用,人工智能领域的公司必须就水印的实施标准达成共识。
OpenAI 的 CEO,Sam Altman 接受《StrictlyVC》采访时表示,不存在一个完美的 AI 生成文字识别工具。“人们总会弄清楚他们要修改多少文字,还会出现修改输出文本的其他工具。”
通过嵌入“元数据”,图像可以强硬地把“AI”写在作者栏。但 AI 生成文字还在等一个可行的解法。
编辑| 舒怡尔
设计| 卫瑶