测试数据收集

研究人员对恶意id及言论进行了2组数据对照。

第一组

第一组数据由122,000名恶意ID用户数据和122,000名中性id用户组组成，总计采样了24.4万名用户在2020年2月12日到2月22日期间的发言情况。

第二组

第二组数据由207万名恶意id用户和207万名友好id用户组成，总计采样414万名用户在2020年6月20日到7月9号之间的某个时段发言情况。

研究人员给系统设置了特殊的筛选条件用来判断这些用户的发言是否是恶意或者是友好的，包括人身攻击、性骚扰、猥亵等等。

最后从数据组汇总随机筛选出50k个恶意id，50k个友好id的发言数据，来获得相对合理的数据对照。

调查结果

恶意id：总体而言恶意id依旧在发表恶意言论

中性id：只比恶意id发表的恶意言论少38%

——-

恶意id的发言数据：

脏话最多的用户：比整体恶意id发言多出45%

性暗示最多的用户：比整体恶意id发言高出250%

为什么有些用户可以这么追逐低俗？

这项研究虽然没有对用户id发言动机做出判定，但还是提出了几个假设。

1、人格障碍

作为一个高度冲突的人或者是人格障碍的人，会迫切地想要攻击其他人。

2、年龄较小

年轻的用户通常喜欢取一个具有挑衅意味的id来表现自己的个性，并在网上表现出破坏性行为。

3、表现不佳者

在网站发表评论没有获得点赞或者收到否定的人，会更加具备报复攻击。

4、用户名具有争议

用户名容易引来黑粉攻击，从而产生网络互喷。

总结：恶意内容是由少数用户产生

在总体发言数据中，其中58%-65%的恶意id用户发言是友好的，70%的中性id用户发言同样如此。

这类用户只是顶着一个恶意id，但发言和友好id用户没有什么区别。

当然，这可能是系统存在判断错误。

研究人员称：因为系统提取的关键词为恶意词，所以用户真实表达的内容如果不涉及到恶意词，无法进行有效的检测。

这也就是说，阴阳怪气地说话并不会被系统检测为恶意发言。

而一些恶意词在某些社区属于特有符号，发表某些恶意词汇并不会让人觉得是恶意行为，比如某些社区就是为了嘲讽别人而创建，即使是采样了几百万的数据，也难以精确。

从系统的角度来看，恶意id以及言论始终是没有办法避免的事情，庞大的用户体量很难实现实时的言论监控。

不过，看到恶意言论，点击举报还是有效果的哦~

天赐佳名网，国学周易八字百分美名，大师人工一对一起名添加微信：stura998 备注：起名！

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 wg0318@163.com 举报，一经查实，本站将立刻删除。
如若转载，请注明出处：https://www.tcjm99.com/2470.html