【AI大模型】永信至诚-数字风洞-助力国产AI大模型安全生态建设

栏目导航

财经热点 > 财经资讯 > 永信至诚-数字风洞-助力国产AI大模型安全生态建设

【AI大模型】永信至诚-数字风洞-助力国产AI大模型安全生态建设

浏览次数：【142】发布日期:2024-5-16 17:48:45 文章分类：财经资讯

　　上证报中国证券网讯目前，永信至诚研发的AI大模型安全测评“数字风洞”平台，利用11类针对大模型价值观对齐的检测方法，对通义千问-72B（Qwen-72B）开源版共发起提问8891次，从核心价值观、商业非法、侵犯他人合法权益、功能说明不真实、隐私泄露、数据源判定等方面进行了详细的内容安全测评。

　　在全部8891次提问中，Qwen-72B进行合理回复4206次，占所有回复的47.31%；拒绝回复3874次，占43.57%；生成异常回复811次，占9.12%。经“数字风洞”平台测评，Qwen-72B AI大模型本测评的总得分为54.66分。

　　通义千问-72B（Qwen-72B）是通义千问AI大模型系列的720亿参数规模模型，2023年12月1日，通义千问Qwen-72B宣布正式开源。

　　测评发现，Qwen-72B“双商”在线，问题理解能力处于优秀水平，但“抗攻击”能力不足。利用检测方法将问题进行变异后，Qwen-72B生成了大量不妥甚至无益的回答，在面对“核心价值观”类“攻击测试”问题时表现较差。基于测评结果，“数字风洞”平台给予了相应建议。

　　永信至诚子公司智能永信基于“数字风洞”产品体系，结合AI春秋大模型的技术与实践能力研发了基于API的AI大模型安全检测系统——AI大模型安全测评“数字风洞”平台。平台已接入百度千帆、通义千问、月之暗面、虎博、商汤日日新、讯飞星火、360智脑、抖音云雀、紫东太初、孟子、智谱、百川等20余个AI大模型API，和2个本地搭建的开源AI大模型。

　　在内容安全测评方面，能够基于形成的100+提示检测模板、10+类检测场景和20万+测评数据集，模拟虚假信息、冤仇言论、性别歧视、暴力内容等各种复杂和边缘的内容生成场景，评估其在处理潜在敏感、违法或不合规内容时的反应，确保AI大模型输出的内容更符合社会伦理和法律法规要求。身为一个专注于AI大模型产品的安全检测平台，借助顶尖的检测插件，AI大模型安全测评“数字风洞”平台在基础设施安全和数据安全等方面也能够精确地测评出各类安全风险，并提供详尽的评分及报告。（侯利红）

手机扫码浏览该文章

● 相关资讯推荐

● 相关资讯专题

网站首页

主机域名

网站模板

网站开发

软件开发

财经资讯

金融工具

管理中心

栏目导航

关于我们

关于我们

付款方式

售后服务

主机域名

信息资讯

解决方案

网站建设

业务入口

服务支持

信息资讯

移动网站