网易授权服务商:湖南领先网络科技有限公司
一键扫码支付开通邮箱
扫码支付开通邮箱
支付宝扫码支付
微信扫码支付
! 扫码支付请您添加支付款备注,输入您公司名称
申请试用体验
为了帮助您更好地了解和使用网易企业邮箱,在您申请成功后,将由专属邮箱顾问为您安排产品体验服务。
  • 产品解说
  • 产品配置
  • 产品体验
电话咨询
致电专属客服 咨询邮箱解决方案
400-0908-163
微信咨询
我是您的专属邮箱顾问
免费1V1服务 「邮件+」高效办公
扫码添加 | 为您1V1解答邮箱疑问
网易企业邮箱帮助中心

网易易盾亮相2024年世界互联网大会,展示全新升级的数字内容安全体系

11月19日,2024年世界互联网大会“互联网之光”博览会在乌镇隆重开幕。

“互联网之光”博览会以人工智能为重点,设置展示展览、新产品新技术发布、产业人才引智、产业合作对接、“新光”系列推介等五大活动,其中“网络空间安全治理”是新产品新技术主题发布的重要活动之一。

网易易盾作为网络空间安全治理的践行者,应大会之邀,亮相“网络空间安全治理”新产品新技术发布会,并展示全新升级的数字内容安全体系。网易易盾内容安全负责人饶晓艳从“安全服务专业化、技术升级场景化、运营经验工具化”三个方面为现场各领域的专家代表进行介绍。

图片.png

| 网易易盾内容安全负责人 饶晓艳

01
安全服务专业化
近年来,我国加快推进网络安全领域顶层设计,指导网络安全技术创新和产业发展,推动网络安全产品体系和产业链逐步完善,网络安全产业规模不断扩大。
蓬勃发展的网络安全产业为网络空间安全治理提供了强有力的基础保障。
在技术升级、消费升级、营销升级的背景下,网络空间持续向纵深发展,移动化、智能化、人性化特征愈发凸显,网络生态向好向优。然而,爆发式增长与升级所带来的弊端与问题随之凸显,尤其是受到全球新冠肺炎疫情影响,技术滥用、网络攻击、有害垃圾内容等问题受到广泛关注。网络空间安全治理亟需更加专业化、系统化的推动力。
回顾网易易盾以AI驱动的数字内容安全升级路径,将安全服务不断进行专业化是网易易盾一直在坚持的路线之一。网易易盾以评估现状差距、合规咨询与规划和安全流程实施建立了完整的服务流程。

图片.png在评估现状差距环节,网易易盾提供内容安全成熟度评估和大模型内容安全评估;在合规咨询与规划环节,网易易盾提供包括内容安全体系建设咨询、大模型上线备案、算法备案在内的安全咨询服务;在安全流程实施环节,网易易盾提供安全培训课程与安全实战考核服务。通过这些服务,网易易盾打造了一套专业的服务以覆盖企业方方面面的安全需求,形成数字内容安全“金钟罩”。

此外,网易易盾还将自身技术能力与行业进行共创共建,发挥行业智库作用,积极主动参与多地标准建设,支撑行业科学有序发展,例如与广州互联网协会联合发布的《生成式人工智能服务安全合规指引》

在此基础上,网易易盾也为客户提供安全智库服务,服务内容包括:内容安全舆情日报、重大事件专项分析、监管政策解读、行业定制情报,以自身之安全技术能力赋能客户。


02
技术升级场景化

近一个月时间,中央网信办多次部署开展清朗专项行动

2024年10月3日,中央网信办部署开展“清朗·整治违规开展互联网新闻信息服务”专项行动;2024年10月11日,中央网信办部署开展“清朗·规范网络语言文字使用”专项行动;2024年11月15日,中央网信办部署开展“清朗·同城版块信息内容问题整治”专项行动。

不难看出,中央层面部署网络空间安全治理中有关内容生态的治理行动并非广撒网式,而是集中力量对某一个场景下的疑难问题进行专项解决,力求在最短的时间内以最高效的方式完成定期的网络空间内容治理。

另一方面,在当前以大型模型为驱动力的智能化时代背景下,双向互动的增强催生了海量信息内容的产生,与此同时,也引发了更为复杂的内容违规问题。相较于过去,内容管理的难度显著增加,这使得传统的治理手段难以有效识别并应对潜在的风险及问题。
因此,数字内容安全治理的技术升级思路必须以问题产生的思路为基准,以场景化的技术能力升级对抗场景化的安全问题。

以网易易盾最新的端云一体检测链路为例:在端侧审核,提供文本、图片Lite版审核,最小200Kb,弱网/无网环境下亦可使用,sdk异常率不到万分之一;在云侧审核,可提供API快速接入,检测耗时短至50ms,提供策略7*24h更新布控,检测准确率大于99.6%;人工环节,由专业团队进行嫌疑/高危数据人审、举报投诉数据人审、多轮质检和大模型语料标注等操作;在线上巡检环节,网易易盾可提供重点板块巡检、高风险类型红蓝对抗、重要节点专项巡检、定期测评报告等增值服务。

以上4个环节共同组成的动态审核策略是网易易盾技术升级场景化的成果之一。

图片.png

在大模型内容安全场景下,网易易盾内容安全负责人饶晓艳以大模型治理大模型安全举例介绍,大模型的安全围栏有很多道,从用户输入端开始,易盾会先进行有害信息分析,并对问题进行分类,并针对部分类别提供安全回答,而正常由大模型回答的内容,在输出后也会再次进行有害内容的检测。

同时考虑到时效性,易盾提供流式切片检测,可以更早发现风险。网易易盾覆盖五大类、31小类的安全语料,也可以在大模型训练环节,提高模型本身的安全围栏能力。


03

运营经验工具化

安全运营是安全治理中非常重要但又容易被忽视的一个环节。
人员、信息、技术工具和操作流程是构建安全运营框架的四大支柱。在当前的企业安全运营中,核心目标通常包括:以识别威胁为出发点,以深入分析和有效应对为核心,以识别潜在风险为重点,以促进整体安全能力提升为目标。只有将人员、信息、技术工具和操作流程有机结合,才能真正达成安全运营的既定目标。
无论是通过流量、日志和资产之间的综合分析,还是通过部署各种安全设备,这些都只是实现目标的手段。安全运营的最终目的在于清晰掌握企业的安全状况、识别安全威胁、评估敌我双方的态势、规范安全事件的处理流程,以及提升安全团队的整体实力。通过逐步构建适合企业自身特点的安全运营体系,并借助这一成熟的体系来推动安全管理工作的质量和效率的提升。
网易易盾基于内生安全理念,打造了弹性的安全运营体系,将安全审核、运营的过往思路、经验以工具的方式沉淀下来。
例如,网易易盾提供智能审核系统,主要包含审核中台和运营中台,把数据的进审调度、多轮审核、质检、审核效率管理、策略配置、策略分析、风险监控预警等全流程贯穿起来,让内容安全的整个周期管理,可以在一个系统中解决。
图片.png
网易易盾内容安全负责人饶晓艳在介绍弹性的安全运营时提到,“内容安全,并不是在内容发布时完成审核就没有风险了”。数字内容在被消费和运营的过程中,风险程度是动态变化的,所以业务链路的各个业务环节都需要有机制可以触发风险检测,例如基于内容的传播、互动、运营等环节,可结合热度、搜索、推优等有再次触发内容审核的机制。同时,内容审核链路上,通常需要会结合本地端侧审核、SaaS云端审核、人工审核以及专项的历史数据回扫来控制风险。
互联网的世界日新月异,环境在变化,危险也在变化,作为提供安全的网易易盾也时刻在升级,全新的数字内容安全体系相信将助力中国网络内容安全治理水平更上一层楼。

文章来源:网易易盾

原文链接:https://mp.weixin.qq.com/s/Pfq-qVgln2m00cXCFT8p-w

特别声明:本文内容仅代表作者个人观点,不代表本网站观点或立场。
文章部分图片、资讯、数据均来自互联网;如不慎侵权,请联系删除。