【短讯】清华大学朱军:ChatGPT出现后安全问题越发严重 需不断提升大模型安全评测能力、构建人工智能安全靶场

来源:开利财经时间:2023-07-04 21:03:19


(资料图片仅供参考)

7月4日讯(记者 李明明) 近日,由北京市人民政府联合工业和信息化部、国家网信办、商务部、中国科协共同主办的2023全球数字经济大会人工智能高峰论坛举办。清华大学计算机系长聘教授、清华大学人工智能研究院副院长、瑞莱智慧/生数科技首席科学家朱军分享了对人工智能目前的发展状态以及安全态势的思考和探索。在朱军看来,ChatGPT的发展,可以追溯到1978年技术架构的突破和GPT系列的发展,去年年底Chat版本的发布,从根本上解决了意图理解和可用性、好用性的问题。今年的发展速度会更快。大模型的三个关键技术分为别内容学习、思维链和指令学习,还有基于人类反馈的强化学习。过去十年,人工智能最大的变化趋势就是从小模型变成大模型。“机器学习常用的模型的规模,发生了巨大的变化,呈现指数型增长的趋势。最受关注的典型成果,就是ChatGPT大语言模型的横空出世。它解决过去机器学习模型从不好用到好用,能够理解意图和上下文等等,已经成了人工智能最受关注、使用最广泛的产品。”他说。目前大众非常关注多模态发展,朱军总结:首先以大脑为参照,人是多模态感知的系统,天然希望能够处理多模态数据。其次,很多复杂工程问题中,也会遇到图像、文本、语音,甚至是触觉等等各种模态的数据,所以从应用和理论上都需要关注多模态模型的发展,可能这些是未来更强的技术基座形态。“目前来看,文本的进展是相对最成熟的,其它模态也是快速发展的过程中,图像、语音、视频、3D,甚至包括分子结构等等,大家都在尝试训练和拥抱这种大规模预训练模型。”朱军介绍,团队在探索大模型如何解决垂直领域的一些问题,即所谓的私域服务。与公域、通用域不同,私域问题的聚焦度更集中,提供的专业深度更强,对数据的要求也更高。这些都是未来比较早的布局,团队也具有一定的优势。谈及大模型的安全风险,他指出,AIGC特别是ChatGPT出现以后,安全问题越来越严重。大模型本身可能会对Prompt Injection(一种攻击技术)攻击风险,加入少量编辑就会被误导,同时也存在数据泄露的风险,ChatGPT会把很多隐私数据上传。现在还出现了用AIGC技术来提升诈骗手段,通过虚假内容来实现黑产攻击,包括代码生成实现网络攻击。而且生成的虚假内容本身是不良的,存在误导性和欺骗性。“此外,算法本身是否存在政治偏见和数字鸿沟,数据采集的过程中会不会侵犯知识产权,这些在大模型时代都在变得越来越重要和受关注。”因此,国家对人工智能相关治理非常重视,近期发布了一系列重要规定和法律,包括《AIGC服务管理办法(征求意见稿)》《深核管理规定》等等。那么,究竟有哪些思路和尝试可以解决这些问题?朱军认为,首先是从通过基础理论研究突破、提高内在安全性能来持续构建第三代人工智能。从人工智能基础尝试,针对深度学习、深度神经网络,学术界一直在探索第三代人工智能新范式,希望能够将数据和知识有机融合在一起,发展更加安全可靠的人工智能框架。其次是不断提升大模型安全评测能力。主要关注对抗攻击评测、角色扮演与诱导欺骗评测、混淆指令欺骗评测等方面。三是构建人工智能安全治理有效工具——人工智能安全靶场。前期团队对此做了探索,包括人工智能本身的安全平台,安全评测、防御和整个态势的评估,包括对抗样本这些场景,可以通过平台化方式,对人工智能的算法和服务进行评测。而特殊专业的应用场景,可专门针对对抗样本检测,伪造视频检测等等进行防护,即人脸识别的防火墙,现在金融行业也在部署和应用。

标签:

相关阅读

推荐阅读

【短讯】清华大学朱军:ChatGPT出现后安全问题越发严重 需不断提升大模型安全评测能力、构建人工智能安全靶场

【短讯】清华大学朱军:ChatGPT出现后安全问题越

【短讯】清华大学朱军:ChatGPT出现后安全问题越发严重需不断提升大模更多

2023-07-04 21:03:19
【环球播资讯】【短讯】“减肥神药”需要长期服用?行业警告美国医保体系可能难承其重

【环球播资讯】【短讯】“减肥神药”需要长期服用

【短讯】“减肥神药”需要长期服用?行业警告美国医保体系可能难承其重更多

2023-07-04 21:07:41
环球报道:【短讯】阿里辟谣重组传闻概念股行情或一日游 地产板块内部分化博弈加剧|港股风向标

环球报道:【短讯】阿里辟谣重组传闻概念股行情或

【短讯】阿里辟谣重组传闻概念股行情或一日游地产板块内部分化博弈加剧更多

2023-07-04 20:13:27
全球观焦点:【短讯】伊朗成为新成员 上合组织正式成员国增至9个

全球观焦点:【短讯】伊朗成为新成员 上合组织正

【短讯】伊朗成为新成员上合组织正式成员国增至9个。新闻资讯提供最新更多

2023-07-04 20:00:32
【短讯】上海二季度大宗交易规模翻倍 长租公寓成交占比首次超过商业

【短讯】上海二季度大宗交易规模翻倍 长租公寓成

【短讯】上海二季度大宗交易规模翻倍长租公寓成交占比首次超过商业。新更多

2023-07-04 19:58:13
【短讯】许家印:广州恒大足球俱乐部的目标是今年保级、明年冲超

【短讯】许家印:广州恒大足球俱乐部的目标是今年

【短讯】许家印:广州恒大足球俱乐部的目标是今年保级、明年冲超。新闻更多

2023-07-04 20:02:17
【短讯】医保谈判规则超预期 创新药板块大涨!多款产品将首次参与谈判

【短讯】医保谈判规则超预期 创新药板块大涨!多

【短讯】医保谈判规则超预期创新药板块大涨!多款产品将首次参与谈判。更多

2023-07-04 19:00:53
快资讯:【短讯】英伟达又一笔投资曝光 收购初创企业布局大模型轻量化

快资讯:【短讯】英伟达又一笔投资曝光 收购初创

【短讯】英伟达又一笔投资曝光收购初创企业布局大模型轻量化。新闻资讯更多

2023-07-04 18:01:33
+ 点击查看更多精彩

精彩放送

太原12个楼盘发放18张预售证 仅有3个项目为纯新盘
    今年9月,太原市房产管理局给省城12个楼盘正式发放了18张预售证。...
截至9月底 杭州共完成不动产登记988.72万件
    房产证、土地证,两证合一了!2016年6月1日,在市民之家举行的全市...
各地继续密集发布楼市宽松政策 多地支持农民进城购房
    近期以来,各地继续密集发布楼市宽松政策,其中包括长春、遵义多...
宁波:关于“带押过户”新模式的7个典型问题权威解答来了
    日前,宁波市不动产登记中心试点二手房带押过户新模式。新模式下...
多地政府大手笔回购商品房 苏州拟对10个板块回购约1万套新房
    越来越多的地方政府出手回购当地商品房。近日,一份苏州市政府部...
市场降温豪宅不冷 媒体:北上广深掀起“豪宅热”
    尽管整体市场低迷,但豪宅板块比较稳定。争取成交,忙完这一次,...
    最新见闻