一大早,朋友就告诉了笔者一个不好的消息:最近,他网站被网信办约谈了,需要至少关停一周,原因就是网站存在不良内容。
事实上,在最近几个月里,内容安全问题似乎已经成为了整个互联网行业的普遍现象。5月27日,好奇心日报网站和App 自 2019 年 5 月 28 日零时起停止更新 3 个月,读者评论和其他互动都将暂停;5月30日,B站、虎牙、斗鱼等直播平台相继发布了系统技术升级通知,弹幕功能将受影响。
仅仅只是在5月份,就有B站、起点文学、晋江文学网、钉钉社区发布暂停更新或直接被查处惩罚。在如今的互联网行业,使用国内的服务器并作出产品备案审核,哪怕你只是一个小平台,只要存在不良内容,那么你就有被约谈的可能。
在不断营造风清气正的互联网环境的过程中,是否配有内容安全、以及内容安全风控能力怎样,开始真正影响到一家互联网企业的发展甚至命运。
正常来说,以往出现内容安全问题的企业大多数是头部知名企业,但伴随着互联网行业的成熟,情况已经不一样了。从目前的市场态势来看,不仅是笔者朋友的小网站被约谈,从监管频率、监管力度、监管范围来看,整个互联网行业已经彻底告别简单粗暴的发展阶段,不管一个企业的融资金额、用户数据、营收数据有多好看,一旦触碰到法律法规,纵然是几亿甚至几十亿价值的产品,一样只能跟市场告别。
随着近两年营造风清气正互联网环境的决心,正把诸多在上个阶段无序发展的互联网公司弄得始料不及。
大小产品均被大范围监管 内容安全已成为互联网行业最大的隐雷
不止是5月迎来了互联网产品内容安全问题爆发季,在最近这几个月,你会发现包括雪球、今日头条、知识星球、简书在内的诸多知名APP,全部都曝出了内容安全事件,被暂停更新、甚至下架等。
其中,近期最轰动的就是晋江文学网被查处、起点中文网多个频道要求整改的消息。作为一家成立于2003年的老牌女性网络文学网站,晋江文学已经衍生出大量知名的影视IP,其中就包括了《花千骨》、《魔道祖师》、《镇魂》、《知否?知否?应是绿肥红瘦》、《香蜜沉沉烬如霜》、《芈月传》、《微微一笑很倾城》、《美人心计》、《战长沙》、《何以笙箫默》、《泡沫之夏》等火热作品。
在IP泛娱乐市场越来越大的情况下,拥有大量IP的晋江文学,本来可以迎来更迅猛发展,但因为在内容安全管理方面存在漏洞,导致晋江文学有部分内容涉嫌传播淫秽色情信息行为被北京扫黄打非部门查处,大大影响了晋江文学的发展。
同时,哪怕是最大的网文平台起点中文网,也因内容安全问题让业务受到影响。起点中文网问题突出的“都市”频道“异术超能”栏目、“女生网”频道“N次元”栏目暂停更新7天,很多火热的网文作品也受此影响不能更新甚至被封禁,大量作者跪求读者们不要下架他们作品。
这一切,归根结底还是网文平台在内容安全管理存在缺陷。包括晋江文学、起点中文在内的诸多互联网平台,他们在激烈的市场竞争都没有倒下,没想到竟然会在内容安全问题上“折戟”,这值得所有互联网从业者警惕。
同时,从去年下半年开始,包括阿里云在内的诸多域名/主机服务商,对内容审核的要求也越来越高,网站备案的难度显著提升。在备案资料方面,以前阿里云的企业备案只需要营业执照和法人身份证就行,但去年下半年开始阿里云的企业认证需要企业手持身份证和营业执照一起拍照,这让一个网站备案的时间也越来越长。
很多企业千辛万苦完成阿里云网站备案之后,结果又强制要求阿里云备案的域名就必须使用阿里云的服务器,否则在系统检测出来之后将面临停止服务器访问甚至取消备案的后果。但如果使用阿里云服务器,你就会发现阿里云服务器端的垃圾内容过滤机制开始影响到网站运营,系统总是时不时地就停止了一些网页访问,要求修改内容才能继续开启服务器提供服务。
这些举措看似的阿里云的审核趋严,本质却是整个中国互联网环境在更加正能量的发展过程中,网络基础服务平台需要配合监管部门必须去做好的一些信息工作。
与此同时,不止是中国对内容安全监管趋严。国外也对内容安全开始加强监管。新西兰总理Jacinda Ardern之前表示,科技公司应被视为“出版商,而非只是邮递员”,而澳大利亚总理Scott Morrison也曾表示:“把互联网当作一个无人管理的空间是不可接受的。”
法律层面,国外也开始不断立法。澳大利亚今年通过一项新法律,严控在社交媒体上传播暴力内容,如果社交媒体平台没有快速删除平台上暴力恐怖内容,公司高管可能被判入狱3年,而社交媒体平台也将面临高达其年营业额10%的罚款。而在同一个时间段,欧盟也通过草案:如果无法在一小时内删除恐怖主义内容,企业将面临最高达全球营业额4%的罚款。
内容安全问题也发生在其他国家。比如抖音国际版TikTok 在印度非常火热,但前段时间也因为内容问题遭受封禁。同时,著名游戏平台Steam也被印尼政府封禁过,印尼甚至还要求过Google、Facebook对一些违规内容进行下线删除。
从这来看,不论是国内还是国外,内容安全已成互联网企业标配风控项,而且基本涵盖所有的互联网行业。
不管你是不是内容产品,哪怕你是一个服务型产品,但你产品里有评论和展示内容,你就一样有可能会遭遇内容爆雷的风险。这样一来,内容安全就必须是标配。
在这个具备一定门槛的市场中,创业不仅要考虑用户、资金、资源从哪里来,还必须重视监管层面的问题,真正地承担起主体责任,才能守住一家互联网公司的生命线。
如何排除内容安全这颗雷?思维、技术、策略都需要突破
怎么办?生活再残酷,也还得继续。
尽管互联网行业不再是可以简单粗暴获得流量然后变现的时代,对于内容和服务的要求也越来越高,但这某种意义上也是一个大浪淘沙的过程,是真正将劣质的信息驱除出去的一个过程,这也是互联网创业者必经的一个过程。
那么,面对这样所有互联网企业都不得不去重视的生命线,大家又应该怎么办?我认为,最核心是其实就是要从思维、技术、策略三个层面进行再升级、再突破。
(1)对于内容安全,笔者认为很多人需要从思维上进行突破。其实在很多年前,就有很多互联网企业在做跟内容安全相关的事情,其中最简单粗暴的方式就是关键词文字过滤。
尤其是对于媒体和社区来说,建立一个违规关键词数据库,然后用文字一对一地进行判断识别,然后对带有违禁词的内容进行屏蔽,这是一个哪怕到现在还还在沿用的一种内容安全管理方式。
在过去,很多企业也许在内容安全管理方面就做了这么一件事情,然后也安稳度过了很多时间,这让很多人认为内容安全其实就是做关键词屏蔽,导致有一些企业对于内容安全不够重视。
事实上,大家要从思维上重新认识内容安全。过去很多公司觉得从监管部门或者其他渠道拿到了一些关键词列表加入到数据库中进行屏蔽,内容安全就搞定了,这导致很多企业一度都不舍得再升级技术和招聘内容审核人员。
事实上,时代已经发生了变化。这是一个富媒体时代,图片、视频、音频的内容安全远比文本处理要复杂,早已进入到了人工智能不断迭代+人工审核补充的时代。从最近这两年的多起内容安全事故之后,以百度、腾讯、阿里、今日头条为首的诸多公司都纷纷加大了内容审核人员和技术的投入力度。
从这个角度来看,尤其是在行业处于中上地位的企业,格外要重视从思维上进行升级。
有些互联网企业在内容安全上出问题,跟他们此前的思维落后有些关系。只有首先从思维上对内容安全重视、对内容安全给予持续的投入,才能真正从管理执行方面解决内容安全问题。
(2)那么,策略方面大家应该如何做呢?巨头和中小公司的策略显然不一样,并且内容安全管理和整体的运营策略也已经关联非常紧密,如何做好新时代的内容安全管理,还得结合实际情况来看。
对于有一定数据规模和数据沉淀的大企业来说,如果本身技术实力还可以,那么人工+自建体系+内容安全服务商三重方式去做,是最稳妥的。如果拥有政策法规解读能力再加上得当的运营策略制订,以及能持续不断地投入算(物)力、人力,也可以采用人工+自建体系。
但对于大多数本身数据和公司规模都不大的中小企业来说,由于数据沉淀不及巨头,且很难及时、正确地解读政策法规,那么自建体系这个部分或许就只能换成寻找靠谱的内容安全服务商。
为什么这么说呢?一方面,自建体系如果没有强大数据做沉淀,其整个体系的训练模型也很难达到预期效果,导致投入了还是会出现内容安全问题;另外一方面,自建内容安全体系成本并不小,如果不能持续的重金投入,最后也可能达不到自用的预期。
那么,第三方内容安全服务商应该如何选择?市场主要也就是两类服务商,一类是专门一直做技术类服务商的企业,他们跟上了这个时代的技术步伐,能够提供一些技术解决方案,另一类就是不仅拥有技术实力,还拥有大量数据沉淀和自身也有内容安全需求的大公司,这一类公司的内容安全服务从效果、价格以及服务及时性、业务场景的覆盖等维度来看综合效益最好。
比较典型的是网易易盾,它拥有21年专业内容安全防护经验及大数据积累,其次也服务了小米、花椒、VIVO、OPPO、网易新闻、网易云音乐等多款用户过亿的产品。根据它的官网显示,易盾的第三代内容安全服务提供鉴黄、涉政、暴恐、广告等数十大类上千小类的有害内容智能识别过滤服务,智能识别精准率超过99.8%。最近,网易易盾还推出了内容安全月活动,能够通过历史数据专项策略布控、快速清洗、全面检测,及时帮助中小企业降低内容安全隐患。
这种服务,其实本质是源自于网易内部自身使用的技术解决方案和数据模型。网络上有公开资料显示,网易易盾是如今已达20+“高龄”的网易安全部在2016年,将其自身的技术沉淀和实践云化并对外提供服务的结果。
如果说能够获得一个大公司自身使用的内容安全解决方案,那么这样的体系确实在实用性方面会更强。不过,选择服务商也好,自建体系也罢,不容忽视的就是一定要在技术上有所突破。
(3)技术方面,其实最大的挑战在于数据训练模型和音频、视频处理的技术突破——如何高效、准确地处理不良内容,这非常考验技术体系的实力。
比如在短视频和直播这两年用户激增后,很多主流平台都因不良内容被监管部门处罚,音频和视频如何有效处理不良内容一度成为一个难点。业内是如何解决的?网易易盾饶晓艳此前就在接受雷锋网采访的时候有简单分享过相关做法。
首先,他们结合政策法规和舆情分析团队的策略、20多年的数据和技术沉淀,配合关键特征提取和识别训练强化机器的训练能力,让内容安全系统能够利用人工智能技术实现视频和音频的有害信息识别与筛选。
后来,他们还会根据新事物、新特征不断迭代内容安全技术。比如短视频中的呻吟声或者娇喘声,以及ASMR场景下的违规音频。这是用传统手段无法识别的,网易易盾进行了技术迭代,使用了声纹检测技术,并在内容安全类目上新增了娇喘呻吟类。
从这个案例去看,不管是自建体系还是找服务商,最核心的一定是技术迭代速度要快,要及时跟进违法违规团队的操作手段进行识别和处理,才有可能真正符合当前的监管要求。
总体而言,内容安全是如今所有互联网公司都需要迈过去的一个门槛,只要在思维上有所突破,不管采用怎样的策略去完善这块的漏洞,在持续研究或者选择前沿有效技术去解决问题之后,内容安全的排雷工作自然也差不多完成了。
监管更严的趋势不可逆不重视内容安全的公司注定被淘汰
1月份“扫黄打非”部门开展学习类APP专项整治工作;
3月全国“扫黄打非”办公室在全国范围内开展“净网2019”、“护苗2019”、“秋风2019”等专项行动,持续净化社会文化环境;
4月份,全国“扫黄打非”办公室又组织开展网上低俗信息专项整治活动。
一系列的监管动作,让大量的互联网产品进入自查自纠或监管部门强制要求整改状态,这已经凸显出监管部门要打造风清气正的互联网环境的决心是足够坚定的。
在未来的中国、甚至国际的互联网环境中,对内容强监管的趋势,是不可逆的,因为守住公序良俗和道德底线,创造青少年健康成长的互联网环境是所与人的共识。尽管这样的趋势会淘汰掉一大批互联网企业,但互联网终归就是一个充满了竞争】的商业生态。
监管部门从规矩上为用户们提供一个良好、健康、正能量的环境,只有真正可以承担起主体责任的公司,才有可能在这样一个新时代更好的生存下去。现在互联网行业一切都和内容有关,在监管更严的情况下,如果还不重视内容安全,也许这样的企业也只剩下被淘汰了。
作者介绍:小谦,小谦笔记(http://xiaoqianbiji.com/)创始人,互联网观察员,数十家科技媒体专栏作者,微信请联系net1996