首页 >要闻 > > 正文

如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》

ZAKER科技 2023-06-07 18:37:53

机器之心发布

作者:之江实验室


(相关资料图)

当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。

今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anthropic 等 AI 公司的 CEO 们召开集体会议,针对 AI 生成技术的爆发,讨论技术背后隐藏的风险、如何负责任地开发人工智能系统,以及制定有效的监管措施。国内的生成式大模型技术也正在发展之中,但是同时也需要先对安全问题进行相应的分析以便双管齐下,避免生成式大模型这把双刃剑带来的隐藏危害。

为此,之江实验室基础理论研究院人工智能与安全团队首次全面总结了 ChatGPT 为代表的生成式大模型的安全与隐私问题白皮书,希望能够为从事安全问题研究的技术人员指明方向,同时也为 AI 相关政策的制定者提供依据。

白皮书链接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy

生成式大模型的发展与重要应用

这份白皮书首先总结了 ChatGPT 与 GPT4 等生成式大模型的发展历程,以及其带来的各种令人惊叹的能力和社会变革、社会应用等。作者列举了 ChatGPT 和 GPT4 出现之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特点以及缺点,这些缺点与 ChatGPT 和 GPT4 的强大能力形成了对比;并且,ChatGPT 和 GPT4 之后又涌现了一大批的模型,包括 LLaMa、Alpaca、文心一言、通义千问等,它们的出现使得在人机交互、资源管理、科学研究、内容创作等应用领域出现了新的、强有力的工具。但同时也出现了包括数据安全,使用规范、可信伦理、知识产权以及模型安全方面的问题。

数据安全问题

白皮书提出,数据的安全和隐私是 ChatGPT 及 GPT4 等生成式大模型使用和研发过程中一个极为重要的问题,并从「显式」和「隐式」两个方面对其进行了分析。

在显式的信息泄漏中,首先,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。

白皮书还提出了之前被大家忽略的隐式信息泄漏问题。首先,ChatGPT 体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且 ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。

使用规范问题

在白皮书中,作者提到 ChatGPT 和 GPT4 等生成式大模型强大的理解和生成能力虽然为我们的生活和生产带来了很多的便利,但是同时也存在更多的机会被恶意使用。在没有规范约束的情况下,恶意使用将带来很多的社会性问题。

其一,ChatGPT 和 GPT-4 等模型的强大能力使得某些别有用心的人想要将其作为违法活动的工具。例如用户可以利用 ChatGPT 来编写诈骗短信和钓鱼邮件,甚至开发代码,按需生成恶意软件和勒索软件等,而无需任何编码知识和犯罪经验。

其二,ChatGPT 和 GPT4 等生成式大模型没有把不同地区的法律规范考虑在内,在使用和输出的过程中可能会违反当地法律法规,因此需要一个强而有力的当地监管系统来检测其使用是否与当地法律法规相冲突。

其三,对于一些游离于安全和危险之间的灰色地带,ChatGPT 等生成式大模型的安全能力还没有得到增强。例如 ChatGPT 可能会输出一些诱导性的语句,包括跟抑郁症患者沟通时候可能会输出某些语句导致其产生轻生的心态。

可信伦理问题

ChatGPT 等生成式大模型以问答形态存在于社会层面,但其回复往往存在不可信,或者无法判断其正确的问题,会有似是而非的错误答案,甚至对现有社会伦理产生冲击。

白皮书指出,首先 ChatGPT 等生成式大模型的回复可能是在一本正经地胡说八道,语句通畅貌似合理,但其实完全大相径庭,目前模型还不能提供合理的证据进行可信性的验证。例如,ChatGPT 可能会对一些历史、科学、文化等方面的问题回答错误或者与事实相悖,甚至可能会造成误导或者误解,需要用户有自己的鉴别能力。

ChatGPT 等生成式大模型的伦理问题也在白皮书中被详细讨论。即使 OpenAI 等研发机构已经使用 ChatGPT 本身生成了他们的道德准则,但其中的道德准则是否符合我国国情的基本价值观原则,尚未有定论。作者提出其中存在传播有害意识形态、传播偏见和仇恨、影响政治正确、破坏教育公平、影响国际社会公平、加剧机器取代人类的进程、形成信息茧房阻碍正确价值观形成等问题。

知识产权问题

ChatGPT 等生成式大模型凭借强大的语言处理能力和低廉使用成本给社会方方面面带来便利的同时,也存在侵权的问题,对现存版权法体系带来冲击。例如 ChatGPT 生成的作品可能存在著作权争议:ChatGPT 虽然有着出色的语言处理能力,但是即使生成的作品符合知识产权的全部形式要求,ChatGPT 也无法成为著作权的主体,这是因为著作权主体享有权利的同时也要承担对应的社会责任,而 ChatGPT 只能作为用户强大的辅助生产力工具,它无法自主创作,更不要谈享有权利、履行义务的主体要求。

而且 ChatGPT 等生成式大模型仍无法独立创作,更没有自主思维和独立思考的能力,因而,ChatGPT 根据用户的输入生成的内容不符合作品「独创性」的要求。ChatGPT 用于模型训练的数据来自于互联网,不论多么高级的模型训练算法必然涉及到对现有智力成果的引用、分析、处理等,必然存在对他人合法知识产权的侵犯问题。

模型安全问题

从攻防技术角度来看,ChatGPT 等生成式大模型也存在着模型安全的问题。ChatGPT 本质上是基于深度学习的一个大型生成模型,也面临着人工智能安全方面的诸多威胁,包括模型窃取以及各种攻击引起输出的错误(例如包括对抗攻击、后门攻击、prompt 攻击、数据投毒等)。

例如,模型窃取指的是攻击者依靠有限次数的模型询问,从而得到一个和目标模型的功能和效果一致的本地模型。而 ChatGPT 已经开放了 API 的使用,这更为模型窃取提供了询问入口。又比如,ChatGPT 和 GPT4 作为一个分布式计算的系统,需要处理来自各方的输入数据,并且经过权威机构验证,这些数据将会被持续用于训练。那么 ChatGPT 和 GPT4 也面临着更大的数据投毒风险。攻击者可以在与 ChatGPT 和 GPT4 交互的时候,强行给 ChatGPT 和 GPT4 灌输错误的数据,或者是通过用户反馈的形式去给 ChatGPT 和 GPT4 进行错误的反馈,从而降低 ChatGPT 和 GPT4 的能力,或者给其加入特殊的后门攻击。

安全与隐私建议

最后,白皮书中对于安全和隐私等问题都进行了相应的建议,可作为之后技术研究者们的方向和政策制定者们的参考依据。

在保护隐私建议方面,白皮书提出要在增强原始数据中高敏感隐私信息的辨别和传播限制;在数据收集过程中利用差分隐私等技术进行隐私保护;对于训练数据的存储进行数据加密形式的安全保护;在模型训练过程中使用安全多方计算,同态加密以及联邦学习等技术进行数据隐私和安全保护;建立数据隐私评估和模型保护与安全认证体系,并且保护下游应用的隐私。

在模型安全问题的建议上,白皮书提出对安全与隐私信息的检测模型的训练;让不同的模型适用于不同国家的法律条款;以及针对各种对抗攻击进行防御性训练。

在模型合规问题上,白皮书提出进行可信输出的度量,信任值评价,增加模型输出的版权信息的查询功能。

总结来说,AI 生成式大模型的发展离不开安全,因此其安全问题将作为下一个技术点,值得众多研究者去攻克。而安全也是社会稳定的保障,有关部门需要尽快进行政策的制定。

THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

上一篇:动态:兴华消费精选6个月持有期混合增聘崔涛 冷文鹏离任 下一篇:最后一页
x
推荐阅读

如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》

2023-06-07

动态:兴华消费精选6个月持有期混合增聘崔涛 冷文鹏离任

2023-06-07

宋PLUS冠军版(含DM-i、EV)将于6月8日开启预售|世界速讯

2023-06-07

恒丰纸业(600356)6月7日主力资金净卖出81.55万元-全球新消息

2023-06-07

浙能电力:水系锌离子目前尚未完成结题验收,但性能测试达到项目计划书指标要求

2023-06-07

拉网线怎么拉视频_拉网线怎么拉_环球时快讯

2023-06-07

华润元大双鑫债券增聘基金经理尹华龙

2023-06-07

难破家族在线观看_处破在线第一次免费-世界新资讯

2023-06-07

广州启动一级保供电护航高考,25辆应急发电车进驻考场

2023-06-07

小商品城(600415)6月7日主力资金净买入1.53亿元 世界快资讯

2023-06-07

电动车与的士互相“别车”追尾撞劳斯莱斯,网民:卖楼够赔吗?_环球速看料

2023-06-07

干式变压器温控器使用方法_干式变压器温控器 天天快播报

2023-06-07

阴阳师五星麒麟怎么打_阴阳师五星麒麟攻略_当前热闻

2023-06-07

不和阿根廷队一同抵达!梅西官宣决定,名记曝内幕,中国球迷失落-当前最新

2023-06-07

联发股份:巨联科技公司主营业务以信息技术服务及软件开发为主

2023-06-07

全球热推荐:BandWerk 将推出 Apple Vision Pro 第三方头带:提供皮革饰面和多种颜色选择

2023-06-07

基金当天的涨跌怎么看 在哪里看|全球看热讯

2023-06-07

香港到深圳通关预约名额_香港到深圳|全球播报

2023-06-07

塞尔达传说王国之泪格鲁德之枪✨在哪里

2023-06-07

天元宠物:6月6日融资买入131.17万元,融资融券余额2873.89万元|今日热门

2023-06-07

【环球速看料】奚梦瑶港大上课被拍,生俩娃依旧超瘦,网友:这小腿比我手腕都细

2023-06-07

考点周边部署74台应急发电车_每日快播

2023-06-07

速递!windows7恢复显示屏默认分辨率_win7默认屏幕分辨率

2023-06-07

4天3板上海物贸:日常经营情况正常 相关市场环境或行业政策未发生重大变化

2023-06-07

殂殁_殂

2023-06-07

每日信息:室内装饰材料与装修施工实例教程_关于室内装饰材料与装修施工实例教程介绍

2023-06-07

天天速递!dnf连发工具有什么用_dnf连发工具h

2023-06-07

海关发票申报比对流程_海关发票

2023-06-07

囝囝侃娱乐_囝囝 天天时快讯

2023-06-07

分析师下调苹果评级,称首发头显仅仅会带来短期利好_天天热讯

2023-06-07

安德·施密卡特 世界报道

2023-06-07

全球速讯:建工修复:公司有微信公众号和视频号——“北京建工修复”以及官网为交流平台,敬请关注

2023-06-07

每日速看!侯友宜与竹苗首长议长餐叙 侯郭合作话题热

2023-06-07

高盛将2023年美国夏季天然气预测从之前的3.30美元/百万英热下调至2.85美元/百万英热,而远期价格预测为2.38美元/百万英热|世界快讯

2023-06-07

社工是什么

2023-06-07

最新消息:vikki和bechi胶原蛋白哪个好?

2023-06-07

网上竞标平台_竞标网

2023-06-07

每日视讯:外星人罗纳尔多_关于外星人罗纳尔多的介绍

2023-06-07

世界微动态丨郭超检查响水县高考准备工作

2023-06-07

环球热点评!林如高骨伤验方歌诀方解_关于林如高骨伤验方歌诀方解概略

2023-06-07

华泰证券举办数字金融科技论坛:科技驱动强化金融服务创造力-世界关注

2023-06-07

在母婴论坛卖孩子的妈妈,5万元1个还能砍价

2023-06-07

当前播报:快速响应,服务为民丨用心了解群众关切,南沙街道被频频点赞

2023-06-07

环球热推荐:首艘国产大型邮轮离开船坞

2023-06-07

qq飞车飞虎王怎么获得_qq飞车飞虎王怎么开几率大呀 我开了好久了

2023-06-07

应用场景扩围 数字人民币驶入“快车道” 焦点要闻

2023-06-06

柏诚股份(601133.SH):公司项目整体毛利率正常水平应该在12%-16%之间

2023-06-06

环球播报:tcl42寸液晶电视电源故障_tcl42寸液晶电视

2023-06-06

10t等于多少公斤_10t等于多少g_全球信息

2023-06-06

爱丽莎第二部爱丽莎结局_爱丽莎第二部_速看料

2023-06-06

天天视讯!广播电视行业市场发展现状 广播电视行业市场发展规划研究

2023-06-06

科学城高新置业7.28亿拿下重庆高新区162亩纯居住用地-全球新动态

2023-06-06

汉滨区大竹园镇大竹园九年制学校志愿服务队_关于汉滨区大竹园镇大竹园九年制学校志愿服务队简述

2023-06-06

汉深逸森医疗网络_关于汉深逸森医疗网络简述

2023-06-06

最新消息:数据分化下,哪些政策可以期待?

2023-06-06

泰来高复学校官网_泰来高复 环球报资讯

2023-06-06

天舟五号货运飞船完成与空间站组合体再次交会对接

2023-06-06

全球快资讯:400多分能够上什么大学职高

2023-06-06

天天速读:践行新时代“枫桥经验” 让人民调解工作深入人心——南沙街道开展2023年人民调解宣传月活动

2023-06-06

国药现代:“现代转债”赎回登记日为6月15日

2023-06-06

中国田径协会D级田径教练员培训班圆满结束 即时看

2023-06-06

观热点:上期所发布氧化铝期货合约及相关实施细则

2023-06-06

动态:古井贡酒: 第九届监事会第十二次会议决议

2023-06-06

双色球4注1000万元头奖,一半落佛山_天天亮点

2023-06-06

常长亭:今天这根阴线能恐吓到多数股民

2023-06-06

每日焦点!锐捷网络:随着云管理理念的不断渗透,公司在持续跟踪并实践云端技术在网络设备等领域的应用

2023-06-06

去年科幻产业总营收超870亿元

2023-06-06

全面注册制,投教“皖”美行:徽商期货公司开展投教集市线下宣传活动

2023-06-06

福州左海控股集团计划发行5亿元中期票据 期限5年-全球速递

2023-06-06

高考期间,三亚考生免费乘坐!

2023-06-06

【焦点热闻】池黄高铁全线34座隧道贯通

2023-06-06

先到先得!南京大宗消费补贴来了

2023-06-06

把农民利益放首位 多措并举能收快收 全球今头条

2023-06-06

全球热门:为人民服务主要内容50字(为人民服务主要内容)

2023-06-06

快看点丨业绩快报 | 碧桂园1-5月累计权益销售1127.6亿 金地签约金额723.5亿

2023-06-06

这条地下“大动脉”贯通!ta的“双胞胎”很多荔湾人关注……

2023-06-06

每天睡前说晚安的含义_晚安的含义 全球微动态

2023-06-06

法媒:由于伊布宣布退役,蒙扎将竭尽全力尝试签下哲科|世界热文

2023-06-06

全球今亮点!12点钟方向是什么意思_足疗店点钟是什么意思

2023-06-06

“两岸关系前瞻与思考”研讨会在京举行-焦点热议

2023-06-06

事业单位退休人员13个月工资发放规定_事业单位当年退休人员十三月工资如何发放|天天热点

2023-06-06

增值税进项税额转出情况核实函_增值税进项税额转出

2023-06-06

福岛第一核电站港湾鱼体内放射性物质超标180倍

2023-06-05

5月份中信理财博赢私享价值龙头股指2号下跌6.58% 世界热推荐

2023-06-05

全球热消息:北陆药业:6月2日公司高管宗利减持公司股份合计10000股

2023-06-05

视焦点讯!前四个月俄罗斯胶合板产量下降四分之一

2023-06-05

2023年兵团中级会计报名现场资格审核时间:6月26日-7月11日16:00

2023-06-05

天天资讯:“BMW中国文化之旅传统手工艺文创设计大赛”正式启动

2023-06-05

中国五矿:新增国家级绿色矿山5家

2023-06-05

今日国美和苏宁哪个发展潜力大_国美和苏宁那个好-当前头条

2023-06-05

“非遗点亮老家河南”系列活动之茶畔雅集成功举行|今日精选

2023-06-05

每日观察!go 实现ringbuffer以及ringbuffer使用场景介绍

2023-06-05

惊天魔盗团2 惊天魔盗团2迅雷下载电影天堂

2023-06-05

世界热点评!逼仄的空间_逼仄

2023-06-05

2023抖音旅游行业白皮书(100页下载) 最新消息

2023-06-05

法网:王欣瑜/谢淑薇晋级女双第三轮

2023-06-05

全球热推荐:头发染什么颜色好看 好看的发色推荐(棕色短发) 每日快讯

2023-06-05

爱茉莉太平洋中国发布2022可持续发展报告

2023-06-05

龙之谷黑暗复仇者加点攻略_龙之谷黑暗复仇者加点 天天最新

2023-06-05

环球看点!ST迪威迅6月5日快速回调

2023-06-05