当前位置: 主页 > 技术方案

人工智能自动生成文本-一键清理垃圾 bat生成txt文本

发布时间:2023-05-31 10:10   浏览次数:次   作者:佚名

【内容提要】ChatGPT的爆红在获得国际社会高度关注的同时,也引发了对其国际传播能力的探讨,以及对可能造成的潜在风险的担忧。事实上,ChatGPT基于无所不能的智能生产能力,有可能使用户养成不假思索的使用习惯,产生不由自主的态度认可,最终形成不容置疑的认知依赖。其已超越单一的渠道和平台角色,成为国际传播生态中的独立传播者,存在沦为舆论认知战工具、延宕国际冲突、成为极端言论新管道、危害网络与数据安全、加剧全球数字不平等、削弱人类文化多样性的潜在风险,至少应从持续追踪、主动探索、凝聚共识、联合治理等四个方面探讨应对生成式人工智能国际传播潜在风险的可行路径。

【关键词】ChatGPT 国际传播 风险治理

人工智能自动生成文本_一键清理垃圾 bat生成txt文本_文件目录生成文本

近期,美国人工智能公司OpenAI推出的聊天机器人聊天生成预训练转换器(Generative Pre-trained Transformer,ChatGPT)备受关注。该程序基于大型语言模型,具有较强的内容生产与学习强化能力,可以承担多轮文本对话问答。随着GPT-4的发布迭代,其对复杂语言的理解和多模态内容生产能力有显著提升,不仅能解答更复杂的问题,还新增了辨识图像的功能,可以为一些扩展应用程序提供支持,具有更广泛的常识和解决问题的能力,未来或将延伸出更加智能的图片、视频等多模态功能。专家预测其具有强大的潜力,可以升级互联网基础性应用,如更迭搜索引擎;可以改变互联网内容运营模式如社交媒体账号运营;还可以影响互联网智能化决策,如电商购物决策。从信息传播角度来看,以ChatGPT为代表的人工智能自动生成内容技术(AIGC)正在重构信息生产、流通、消费流程。它揭开了智能传播大规模应用的序幕,同时也引发了国际社会对隐蔽于技术之后的偏见歧视、违规滥用、有意欺诈、政治造谣、伪造身份等问题的担忧。从国际传播角度来看,生成式人工智能所拥有的传播能力将改变国际传播生态:一方面将带来内容生产的潜在机遇,另一方面也将引致认知重塑、价值固化的风险。从全球治理角度来看人工智能自动生成文本,它还对国际冲突、网络安全、数字平等等提出了挑战。

一、生成式人工智能的国际传播能力

从互联网信息生产和传播关系的历史演进看,无论是专业生产内容PGC、用户生产内容UGC,还是二者的混合模式PUGC,信息生产主体都是人。但在以ChatGPT为代表的AIGC时代,网络信息的生产主体、内容文本和传播渠道实现了深度一体化,标志着以人工智能为底层支撑的网络传播进入到一个智能融合新阶段。ChatGPT已超越单一的渠道和平台角色,成为独立的传播者。它已经展现出并正逐渐发展出信息生产能力、接近用户能力、固化倾向能力和塑造认知能力,这将对国际传播生态产生深刻影响。

(一)无所不能的智能生产

生成式人工智能拥有人工书写难以匹敌的信息生产能效。在国际新闻供给方面,可以有效减少国际资讯检索难度和语际转换压力,大规模应用后能够以较低的成本、极高的效率面向全球多语种受众群体开展一对一传播。在新闻形式创新方面,能有机整合数据、图表、交互程序等,进一步加快数据新闻、新闻游戏等新闻范式兴起,增强新闻产品的新颖性与吸引力。在亲密情感互动方面,能够展现出人格化特征,如积极主动、有责任心、可沟通性等,不仅能满足用户的信息使用需求,还能培养情感依赖。通过上述高效率、多模态、人格化的信息供给,使得生成式人工智能看上去无所不能。

(二)不加思索的使用习惯

文件目录生成文本_人工智能自动生成文本_一键清理垃圾 bat生成txt文本

与过往的智能语言助手等产品形态相比,ChatGPT拥有更为拟人化的互动感,可以通过实时对话精准、动态地对接用户信息需求,其多语种沟通技术也能为用户的跨国信息交往提供便利,天然具备接近用户的能力。以ChatGPT为代表生成式人工智能的传播,不同于从“传者本位”出发强调因国而异、因时而异和因事而异,注重分众化和适用性的精准传播,而是直接进入到“受众本位”的一对一服务模式,介入性更强,控制力也更强,更容易培养用户的信息接触路径依赖。其未来有望成为人机交互的第一入口,导致用户不假思索地使用。长此以往其或将形成新的渠道垄断与智能鸿沟,引致新的数字霸权。

(三)不由自主的态度认可

在信息呈现方面,ChatGPT能够多角度、多维度回答提问,能为具有初步信息需求的用户提供充足内容,也能为具有深度信息需求的用户提供具有启发性的架构。一旦形成用户使用依赖,极有可能通过提供看似不带情感、纯粹基于技术的信息整合和阐释架构,隐蔽其预设立场、固化倾向的能力。事实上,ChatGPT生成的内容基于对大量互联网语料的汲取学习。据统计,在全球访问量前一百万的互联网网站中,有将近60%的内容是英文的,中文内容还不到1.5%,其中简体中文内容更少。不难推测,ChatGPT在自主训练过程中使用的语料大部分是英语。另一方面,互联网简体中文内容存在的洗稿以及广告泛滥等问题,非常不利于ChatGPT学习和运用。尽管ChatGPT有意回避自我表态,在被问及需要阐释个人意见、预测未来事件走向时,往往答道:“ChatGPT作为一个语言模型,无法表达意见或情绪,也没有能力预测未来。”但其学习的对象决定了它的信息检索和整合不可避免带有来源信息的预设立场和价值观,回答本身就是对某些价值立场的传达和固化,会令忠实用户的认知和态度不由自主受其影响。如有网友发现,在询问新冠病毒起源时,ChatGPT的回答是“起源于中国武汉”,然而这并不符合事实。

(四)不容置疑的认知依赖

算法推荐是在对用户行为数据收集分析后进行的个性化、定制化信息推送,而这在本质上是一种被动的“个性化”。用户只能被动地接受算法推荐,被动地让算法收集自己的数据,被动地让算法告诉自己什么是自己需要的、喜欢的服务与信息,这致使公众对隐私泄漏的担忧与日俱增。“大数据杀熟”、信息茧房等次生问题,也引发了舆论关注。360公司大安全情报局发布的算法推荐调研数据报告《感觉被算法算计了》显示,近半数的参与调查者对算法推荐十分疲惫,甚至有些反感,也有部分网友感觉自己被算法“算计”了,57.07%表示自己渴望逃脱算法束缚。与之形成鲜明对比的是,人们对ChatGPT的使用是在用户自我需求驱使下的主动行为。主动获取的信息会被用户认为是“我想要的”“我认可的”,而不是“让我看的”“我质疑的”,长期接收包含价值偏向的信息,可能令用户形成对ChatGPT生成内容不容置疑的认知依赖。

二、生成式人工智能对国际传播的潜在风险

瑞银集团的研究报告显示,ChatGPT在2022年11月底推出后,到2023年1月的月活跃用户数预计已达1亿人,成为历史上用户增长最快的消费应用。在如此短的时间积聚起庞大活跃的全球用户群体,使生成式人工智能有可能成为“灰犀牛”,引发虚假信息泛滥、干扰舆论导向、危害网络安全、挑动价值对立、制造新的不平等等风险。

一键清理垃圾 bat生成txt文本_文件目录生成文本_人工智能自动生成文本

(一)成为舆论认知战工具

科技追求向善,但对技术的运用可能会让ChatGPT有武器化的风险。结合前文所述,ChatGPT具有先进的深度神经网络技术架构和智能化、拟人化的互动真实感,存在被用作国际信息战、舆论战、认知战新工具的隐忧。首先,ChatGPT具备强大的信息生产和结构文本的能力,能源源不断地生产各类真假难辨的信息,影响国际舆论。美国新闻可信度评估与研究机构NewsGuard发现,如果对ChatGPT提出充斥阴谋论和误导性叙述的问题,它能在几秒钟内改编信息,产生大量具有逻辑、令人信服却无明确信源的内容;其次,ChatGPT的回答基于对国际互联网已有语料的学习,来自欧美发达国家的英语信息占据主导地位,因此ChatGPT的回答不可避免是对某些价值观的强化,无法提供价值观的竞争。如有网友询问ChatGPT,中国的民用气球飘到美国时,美国可不可以将其击落?回答是“可以”;而当询问美国的民用气球飘到中国时,中国能否将其击落时,回答则变成了“不可以”,表现出典型的“双标”立场。

(二)延宕国际冲突

国际互联网中充斥着海量未经过滤、包含偏见的信息,其中以种族歧视和性别歧视居多。ChatGPT的回答基于对互联网信息和受众反馈的学习,不但影响认知,而且强化用户的偏见。例如,英国媒体Insider报道称“ChatGPT曾告诉用户可以折磨某些少数民族人士”。由于目前没有办法对ChatGPT的回答进行前置性审核,在海量回答中,包含有严重错误的答案很容易逃逸。偏见性信息如果通过生成式人工智能在世界范围内大量生产和流动,将会加剧分裂主义、种族偏见等国际冲突。尽管AI界已经意识到这一产品弊端,但当前的不良信息过滤技术还无法实现绝对可靠。过滤模型的迭代更新仍然依靠旧有数据,随着更多数据被投喂至ChatGPT,制造偏见和遏制偏见将成为一场持久的追赶游戏。

(三)成为极端言论新管道

ChatGPT在输出端所展现的内容生产能力和人机互动能力,都要基于输入端源源不断的数据投喂和学习训练,在汲取海量网络语料过程中,给极端主义者、宗教原教旨主义者、恐怖分子等制造极端信息,通过人为“数据投毒”来训练AI模型留下了可乘之机,最终可能让ChatGPT演变为输出极端言论的新渠道。此前环球网曾报道,在谷歌翻译的英文对话框输入“艾滋病毒”等相关词汇,对应的中文翻译会出现恶毒攻击中国的词汇。究其原因,是由于谷歌翻译数据池被恶意污染,训练模型被人为干扰。尽管相关方进行了及时补救,但不法之徒制造影响的目的已然达到。如何摆脱事后补救的被动式应对,探索建立相匹配的前端数据识别监察机制,从源头上加强对极端仇恨言论、虚假不实信息的筛选过滤,是人工智能自动生成内容技术(AIGC)亟待解决的一个重要问题。

(四)危害网络与数据安全

一键清理垃圾 bat生成txt文本_文件目录生成文本_人工智能自动生成文本

ChatGPT兼具强大的数据汲取能力和文本写作能力,可能会成为加剧黑客攻击和危害网络安全的推手。首先是窃取用户信息。ChatGPT的底层工作逻辑是对海量互联网数据的搜集分析。随着语料库的持续扩大,更多用户信息将被窃取并倾注其中。私营公司垄断消费者数据客观存在用户信息泄漏风险,从2022年底脸书被曝泄露5亿用户数据事件中就可见一斑;其次是助推黑客犯罪。ChatGPT能够迅速编写钓鱼邮件和恶意代码,极易沦为黑客的武器化工具。据美国网络安全新闻网站Dark Reading报道,黑客正在借ChatGPT窃取大型公司数据,微软、贝宝、谷歌和奈飞等著名跨国企业已经成为其目标。然而,当前网络监管工具未能实时跟上AI技术的发展步伐,让黑客有了侥幸之机;再次,数据已成为各国维系国家安全和发展的战略性资源,也是研发新一代人工智能技术的支撑基础。ChatGPT及其背后的利益相关方有可能通过大数据汲取技术或人机交互等手段,有针对性地收集中文互联网的核心数据信息,导致优质中文网络数据资源外泄,形成赢家通吃、强者愈强的马太效应,对我国数据安全构成威胁。

(五)加剧全球数字不平等

ChatGPT的普及在巩固欧美跨国巨头市场主导地位的同时,极可能进一步拉大南北国家间的数字鸿沟差距,并造成新的国际信息传播不平等和数字剥削。一方面,ChatGPT作为西方科技与资本的混合产物,其发展有利于巩固并扩大西方的国际话语权。其创造者人工智能企业OpenAI位于美国旧金山,该公司联合创始人中包括特斯拉创始人马斯克(Elon Musk)。此外,据澎湃新闻报道,微软正在洽谈向OpenAI投资100亿美元,打造在搜索领域的新增长点;另一方面,ChatGPT也正在制造新的数字剥削现象。据美国《时代周刊》报道,为了训练ChatGPT,OpenAI雇佣了时薪不到2美元的肯尼亚外包劳工对庞大的数据库进行手动标注,他们平均每小时最多要阅读和标注超2万个单词。

另外,伴随ChatGPT的持续升级迭代和大规模应用,还可能带来双重的“可能霸权”。首先是模型的训练升级需要呈指数级增长的巨额资金、人才、算力和能源等的长期投入,这是绝大部分新兴市场所不能负担的,其技术发展天然地倾向于本就实力雄厚的发达国家和跨国科技巨头。据报道,微软前后三次投资ChatGPT,总投资额近900亿人民币。OpenAI预计人工智能科学研究要想取得突破,所需要消耗的计算资源每3—4个月就要翻一倍,资金也需要通过指数级增长获得匹配。在算力方面,GPT-3.5的总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640天),这背后所需要的能源更是天文数字;其次是对ChatGPT类人工智能产品的市场追捧已传导到上游科研领域,越来越多的人力物力开始集中到以ChatGPT为代表的AI技术发展路线上来,成为无限量吞噬资金、人才、算力等科研资源的黑洞,这就容易形成一家独大的技术霸权地位。而在总体科研资源有限的情况下,这将极大地挤占其他前瞻性、替代性技术方案的生存和发展空间,不利于对未来技术的全面探索。

(六)削弱人类文化多样性

从跨文化传播角度看,ChatGPT为文化产品提供了高速快捷的产出通道,文化创作将不再依赖于人本身。一旦掌握了通用人工智能,技术驱动下的文化产出或将成为未来趋势。然而,ChatGPT的文化创造是以现有文化资源为蓝本,这也使得在高速输出中,原本传播声量更高的文化产品将被继续加强,为强势文化同化弱势文化提供了一条异常便捷的道路。在国际社会中,文化产品的市场份额及市场规模是国家竞争力和国际地位的体现。拥有强势文化的国家利用数字化技术和数字平台大量倾销文化产品成为可以预见的未来。因此,掌握人工智能技术的国家或组织机构在高效率的文化创作中将不断加强文化影响力,与技术弱国和文化弱国相比具有压倒性优势。长此以往,全球文化或将面临文化多样性、丰富性、复杂性降低的风险,这对保持文化多样性和文化创新活力都极为不利。

三、对生成式人工智能潜在国际传播风险的应对

一键清理垃圾 bat生成txt文本_文件目录生成文本_人工智能自动生成文本

约瑟夫·熊彼特(Joseph Alois Schumpeter)认为,每一次巨大的创新都会对旧的技术和生产体系产生巨大的冲击,即“创造性破坏”。基于上文的预判不难发现,面对以ChatGPT为代表的生成式人工智能的挑战,一方面需防范自动生成内容与虚假信息的泛滥,密切关注国际传播格局的趋势走向,号召全球共同应对认知塑造的风险挑战;另一方面应扶持本土企业开发人工智能内容生成平台,借助新科技打开言说中国和认知争夺的突破口,同时加强对国内民众的引导,预防技术冲击带来的舆论危机。

(一)持续追踪,加强技术安全风险预判能力

麦克卢汉(Marshall McLuhan)指出,“任何媒介的‘内容’都是另一种媒介”。他认为“媒介的影响之所以非常强烈,恰恰是另一种媒介变成了它的‘内容’”。从媒介关系的角度来看,新旧技术之间不是“你死我活”的替代关系,而是彼此间的相互联系。因此,既往技术如大数据、云计算、虚拟现实技术、推荐算法在应用和发展的过程中,都伴随着对其内在风险讨论和防范措施的制定,这些经验同样可以运用在分析ChatGPT和相关人工智能技术驱动的自然语言处理工具上。首先,需要对相关技术及其应用的发展进行持续追踪,研判模拟ChatGPT下一步发展趋势,对其在国际传播领域的潜在负面影响和发展机遇进行战略性分析;其次,要强化对技术安全风险的预判能力,提高探查国际传播安全风险的频次,追踪ChatGPT等相关产品在全球应用的更新情况,对其引起的舆情波动进行预警,做到态势可知、威胁可察、风险可控。

(二)主动探索,提升对国际传播新平台的驾驭能力

面对智能时代的国际传播,有学者提出应当“树立‘技术对等传播’的技术思维”,加强对新型技术的理解和掌握,因地制宜地提升实践应用能力。ChatGPT作为新型国际传播平台的巨大应用潜力不容忽视,在防范化解风险挑战的同时,也应当加强能力建设,主动探索新型平台如何为我所用的实践路径。一方面,如前文所述,当前国际互联网中简体中文信息数量相对稀少,存在洗稿以及广告泛滥等问题,非常不利于ChatGPT对简体中文信息的学习和运用。可以通过持续加大中央主流媒体等优质内容生产者的国际信息供给,通过提问和反馈训练调试ChatGPT的语料库,探索从源头逐步纠偏ChatGPT价值立场的可能性,将其转化为可供使用的“外脑”和提高中国对外传播内容生产效率的新渠道、新工具;另一方面,鼓励和扶持国内有实力的企业开发同类产品,打造自主传播新阵地。

(三)凝聚共识,提升社会大众信息认知素养

ChatGPT的流行和暴露出的问题,已经引发国内外不少关注讨论,其中一个主要原因在于用户理解和适应人工智能的能力迟滞于AI技术的现实发展,提升公众的AI素养已尤为迫切。一方面,应在科学研究和媒体报道中加大对技术平台的持续分析,促进人们对各类AI智能媒体的了解掌握;另一方面,还需进一步挖掘平台公司和技术发展的政治因素、经济因素,引导公众超越文本,全面理解智能传播全流程,更好把握技术、资本、国家民族、意识形态等不同要素在其中的角色作用。未来要持续对ChatGPT可能造成的风险隐忧进行深入的学理研究和调查报道,鼓励有关学者、媒体记者研究和报道其制造和传播虚假信息、侵犯版权隐私、精巧隐藏价值立场等问题,提示其存在的认知重塑、价值观固化、散播偏见等风险,进一步帮助用户理解ChatGPT文本写作的基本逻辑,这样能够在感知ChatGPT算法的基础上实现技术“祛魅”,提升普通公众的信息辨别能力和AI算法素养。

一键清理垃圾 bat生成txt文本_文件目录生成文本_人工智能自动生成文本

(四)联合全球治理力量,谋划公平解决方案

随着人工智能、大数据、5G等新型信息技术的快速发展,智能传播面临的全球治理问题日益突出。此次ChatGPT的风险挑战已经引发国际社会的普遍担忧,已具备联合全球治理力量的坚实基础。因此,对以ChatGPT为代表的生成式人工智能风险防范不能依靠一国之力,应坚持推动构建网络空间命运共同体人工智能自动生成文本,聚合全球多元力量,采取协同治理方式,以顺应信息时代发展潮流和人类社会发展大势,回应网络空间风险挑战。具体来看,中国应在其中展现大国责任与担当,牵头组织国际研讨,成立多主体治理联合体,为有关人工智能平台的全球治理贡献中国方案,推动建立国际多边互联网监管机构,并将网络信息治理纳入以联合国为核心的国际体系之中。同时,充分发挥新组建的国家数据局在数据管理、开发、利用方面的职能,切实保障数据安全与数据资源的整合共享和开发利用。另外,也应积极推动新技术新应用向上向善,加强数字产品创新供给,为全球提供公平、开放、平等的人工智能公共产品,以实际行动弥合数字鸿沟,让更多国家和民众搭乘信息时代的快车,共享互联网发展成果,为落实《联合国2030年可持续发展议程》作出积极贡献,22推动国际社会在新一轮的人工智能革新中实现共赢共享。

周亭系中国传媒大学政府与公共事务学院院长,教授、博士生导师;蒲成系中国传媒大学国际传播白杨班博士研究生

文件目录生成文本_一键清理垃圾 bat生成txt文本_人工智能自动生成文本

关注获取更多信息

文件目录生成文本_一键清理垃圾 bat生成txt文本_人工智能自动生成文本

文件目录生成文本_一键清理垃圾 bat生成txt文本_人工智能自动生成文本

扫码订刊

文件目录生成文本_一键清理垃圾 bat生成txt文本_人工智能自动生成文本

一键清理垃圾 bat生成txt文本_人工智能自动生成文本_文件目录生成文本