如何监测通用大模型的安全水位？多位专家支招

杨珉指出，ChatGPT等通用大模型正成为大家日常生活中频繁使用的工具，并逐步向具身智能体进化，在可预见的将来会出现AI社会，很多人工智能体会互相影响、协同工作。这种技术演变的趋势背后，大模型生成内容的安全风险会逐渐外溢，进而形成物理世界的风险，如何动态、持续地监测通用大模型的安全水位，是学界、企业界、政府部门必须共同面对的重大挑战。

“当前的安全技术远远滞后于的AI技术发展的整体速度。”杨珉表示，其中一个技术是基于个人的技巧发现安全问题，即诱导问题，它的特点是自动化程度低、成本高昂。杨珉及团队一直深耕于此，希望寻找到一个通用的普适性的测试集，客观地检视当前大模型的安全合规能力。目前部分技术已在百度、阿里、华为落地应用。

此外，杨珉团队还利用语言学中“转换生成语法”的原理，建设了评测自动化、测试覆盖率高和风险发现能力强的测评平台。基于此，杨珉带领团队在今年6月发布第一代测试集，测试的维度包含了歧视性内容、商业违法违规、侵犯他人权益以及内容不准确不科学等31个子类。

杨珉表示，未来将持续公布这种动态的测评结果，呈现产业之间在能力上的差异性，希望能助力整个行业生态的健康发展。

上海人工智能实验室综合管理部、AI治理负责人王迎春总结指出，大模型的安全问题包括国家安全、行业安全、社会安全以及人工智能可控性等极端风险。应对路径一是治理政策和规则，二是测评等技术路径。

《人工智能安全治理框架》1.0版指出，人工智能系统设计、研发、训练、测试、部署、使用、维护等生命周期各环节都面临安全风险，既面临自身技术缺陷、不足带来的风险，也面临不当使用、滥用甚至恶意利用带来的安全风险。

例如，以深度学习为代表的人工智能算法内部运行逻辑复杂，推理过程属黑灰盒模式，可能导致输出结果难以预测和确切归因，如有异常难以快速修正和溯源追责。

王迎春指出，随着模型能力的提升，执行的任务更加复杂，对其的监督能力已非人力能及，需要开发出更多新的技术，将监督信号设计到模型当中，其中就包括上述自动化红队测试等。

他预言，下一代的大模型发展应该是数字和物理融合的模型，会带来新的安全风险问题，需要提前进行技术储备，甚至在研发模型当中就要做技术的研究。王迎春认为，国内对于大模型安全的应对比较零散，不体系化，政府要构建人工智能安全技术体系图，有助于有关部门包括企业布局相应技术研究，例如模型评测技术、模型内生安全技术等。

事实上，针对模型算法安全、数据安全和系统安全等内生安全风险和网络域、现实域、认知域、伦理域等应用安全风险，刚刚发布的《人工智能安全治理框架》1.0版提出相应技术应对和综合防治措施，以及人工智能安全开发应用指引，为促进人工智能健康发展和规范应用，提供了基础性、框架性技术指南。

针对模型算法、训练数据、算力设施、产品服务、应用场景，上述框架提出通过安全软件开发、数据质量提升、安全建设运维、测评监测加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性人工智能安全治理框架的措施。

【2024澳门天天开好彩大全免费】【新澳天天开奖资料大全最新】

【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】

【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】

【2024全年资料免费大全】 【新澳天天开奖资料大全】

【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】

【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】【2024资料大全正版资料】

点赞数: 0

好奇心号外APP介绍

新澳门彩结果今天APP名:好奇心号外

版本:V6.19.216

更新时间:2024-10-01 21:19

澳门六结果2024记录查询网站这是一个功能强大的澳门全年资料内部公开_正版免费APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：例如，以深度学习为代表的人工智能算法内部运行逻辑复杂，推理过程属黑灰盒模式，可能导致输出结果难以预测和确切归因，如有异常难以快速修正和溯源追责。

澳门精准四肖四码期期准APP介绍

澳门精准王中王免费资料APP名:好奇心号外

版本:V6.33.985

更新时间:2024-10-01 18:22

新澳门资料大全正版资料?奥利奥这是一个功能强大的香港王中王最快结果APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：人工智能大模型在解放生产力、提高生产效率的同时也带来了一系列问题，例如隐私信息泄漏、版权归属纠纷、内容真实性与合规性等，如何应对随之而来的安全、治理问题？

2021年澳门精准资料大全APP介绍

澳门天天彩年结果新闻发布会APP名:好奇心号外

版本:V1.84.417

更新时间:2024-10-01 18:19

626969澳门资料大全版这是一个功能强大的香港内部资料精准大全APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：杨珉指出，ChatGPT等通用大模型正成为大家日常生活中频繁使用的工具，并逐步向具身智能体进化，在可预见的将来会出现AI社会，很多人工智能体会互相影响、协同工作。

新澳门一码一肖100准打开APP介绍

香港马资料更新最快的APP名:好奇心号外

版本:V7.75.626

更新时间:2024-10-01 17:14

澳门今晚一肖一码这是一个功能强大的2024全年資料免費大全優勢APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：针对模型算法、训练数据、算力设施、产品服务、应用场景，上述框架提出通过安全软件开发、数据质量提升、安全建设运维、测评监测加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性人工智能安全治理框架的措施。

澳门管家婆100%精准APP介绍

新奥彩资料大全最新版APP名:好奇心号外

版本:V2.51.970

更新时间:2024-10-01 15:24

澳彩资料免费资料大全这是一个功能强大的014962.cσm查询,澳彩资料APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：0版提出相应技术应对和综合防治措施，以及人工智能安全开发应用指引，为促进人工智能健康发展和规范应用，提供了基础性、框架性技术指南。

管家婆三肖一码一定中特APP介绍

澳门精准正版资料大全长春老APP名:好奇心号外

版本:V6.43.856

更新时间:2024-10-01 19:22

虎头蛇尾是什么生肖这是一个功能强大的澳门王中王100%资料APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：杨珉表示，未来将持续公布这种动态的测评结果，呈现产业之间在能力上的差异性，希望能助力整个行业生态的健康发展。

澳门一码一肖100%精准APP介绍

全年资料免费大全APP名:好奇心号外

版本:V2.76.805

更新时间:2024-10-01 17:14

4949澳门今天开的什么码这是一个功能强大的资料大全正版资料下载APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：“当前的安全技术远远滞后于的AI技术发展的整体速度。

王中王100中特网资料大全APP介绍

澳门三肖三码期期准免费资料澳门APP名:好奇心号外

版本:V1.40.378

更新时间:2024-10-01 15:13

2024澳门一肖一码配套成龙这是一个功能强大的新澳门今晚开什么特马APP，可以帮助你完成各种任务。包括最新24小时热点资讯，今日最新：9月9日，2024年国家网络安全宣传周上海地区活动拉开帷幕，在当日举行的主论坛现场，教育部长江学者、复旦大学计算机科学技术学院院长杨珉围绕“AI大模型安全评测与治理”，介绍了人工智能系统安全治理领域的研究成果。

发表评论

Inboden

4秒前：王迎春指出，随着模型能力的提升，执行的任务更加复杂，对其的监督能力已非人力能及，需要开发出更多新的技术，将监督信号设计到模型当中，其中就包括上述自动化红队测试等。

IP:33.11.4.*

鲁斯塔姆·萨格杜拉耶夫

4秒前：王迎春认为，国内对于大模型安全的应对比较零散，不体系化，政府要构建人工智能安全技术体系图，有助于有关部门包括企业布局相应技术研究，例如模型评测技术、模型内生安全技术等。

IP:94.37.1.*

罗曼·雷恩斯

7秒前：界面新闻记者 | 黄景源界面新闻编辑 | 彭朋截至2023年底，国内已完成备案的生成式人工智能服务达60余款。

IP:20.36.1.*