一堵人工智能“防火墙”在中关村建起。日前,北京前瞻人工智能安全与治理研究院发布了前瞻人工智能安全评估体系与基座平台,包含人工智能安全评估框架、技术工具和价值参考等。
随着技术飞速迭代,人工智能的安全风险与日俱增,构建完善的人工智能安全评估与治理体系刻不容缓。此次发布的“前瞻安全基准”安全评估体系,不局限于传PG电子统安全评估的单一维度,而是在根植基础安全的基础上,延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度。
该院院长曾毅介绍,这套体系可覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等关键领域,重点聚焦评估和解决隐私与数据保护、滥用恶用、虚假信息防范等难题。
“前瞻·灵御”人工智能安全攻防平台通过模拟真实攻防场景,实现对模型安全性能的全面“体检”。目前,该平台支持60余种主流大模型、20余种攻击方法和10余种防御机制。
“测试发现,近几年的大模型在安全性上并没有明显提升,平台对部分新模型的攻击成功率甚至更高。”曾毅直言,人工智能模型构筑防御工事并不一定要重新训练,部署在线推理阶段的安全护栏,就能显著提升模型安全水平。而灵御平台就是通过提供针对性的防御方案和“加固”建议,实现主动防御、精准防护。
“前瞻·灵度”平台同步搭建,关注点侧重于对人工智能伦理进行智能评估与价值校准。它能在6个维度、90个细分类别中,对上百个大模型进行实时动态监控和测试。“灵度平台集成了以中国价值观为核心的大规模中文价值语料库,累计定义了25万余条规则。”曾毅说,这能有效解决现有伦理评估中文价值适应性不足、边界覆盖不全的问题。
人工智能安全评估体系和基座平台,不仅解决了“评什么、怎么评”的疑问,还回答了“怎样攻、如何防”,并明确了人工智能安全将“向何处去”的价值导向。(刘苏雅)
“火箭式”升温开启新的一周开始,河南晴朗天气维持,气温也将开启“火箭式”上升模式→比如昨天,河南大部地区最高气温不足10℃,西部、北部和东部仅有4-6℃,预计今天午后,除了西部地区在9-11℃之间以外,其他地区大都在14-16℃,西南部地区18-20℃之间。
由中央纪委国家监委宣传部与中央广播电视总台央视联合摄制的电视专题片《一步不停歇 半步不退让》,1月11日晚播出第一集《纠风治乱为民》。
【来源:河南交通广播】1月12日,河南将迎来一次气温的剧烈转折:早晨极寒,白天暴涨。12日清晨,全省气温仍处于低谷。西部山区、北部和中东部最低气温将下探至-7℃到-5℃,其他地区也仅有-4℃到-2℃。这种低温将导致早高峰期间体感异常寒冷,路面可能出现结冰现象。
阿富汗和塔吉克斯坦边境地区安全形势复杂严峻,去年11月接连发生中国公民遇袭事件,造成重大人员伤亡,不排除再次发生针对中国企业和公民的袭击事件。
2026年1月10日第六个中国人民警察节当天消息传来——武汉原民警万松当选由中央宣传部、公安部评选的2025年全国“最美基层民警”万松生前工作照。2026年1月10日,武汉公安民警纷纷表示,将以万松为榜样,矢志不渝做党和人民的忠诚卫士。
1月10日,云南省体育局通报称,近期,运动员王某实名举报云南省松茂体育训练基地主任范某某,经云南省体育局调查组认真开展核查,情况基本属实。
河南省教育厅于2025年12月31日发布《2025年撤销高校教师资格行政处罚》,依法对河南省五名高校教师作出丧失或撤销教师资格的处理。
洛阳市公开通报3起典型案例为维护良好网络舆论秩序,有效净化网络环境,洛龙公安主动出击,全面梳理摸排,网络造谣生事、恶意炒作线索,依法严厉打击整治网络谣言违法犯罪活动,切实营造清朗网络空间,现公开曝光三起打击整治网络谣言典型案例。
洛阳市人民政府关于新建焦作至平顶山铁路(洛阳市区段)建设用地拟征收土地的预通告一起来看看吧!
根据国家新闻出版署《新闻记者证管理办法》等相关规定,现将华兴时报社新闻记者职业资格考试成绩合格、符合记者证申领条件的新闻采编人员名单公示如下(共3人),公示时间:2026年1月12日至1月18日,若下列人员申报材料失实,请电话或书面向华兴时报社办公室反映。


