童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

浅谈反垃圾策略:如何营造一个良好的内容环境?

5月25日 斩情道投稿
  做UGC产品常碰见的难题是什么?那就是如何筛选与过滤垃圾信息,为社区塑造良好的产品调性与氛围,为用户提供良好的产品体验。本文中,笔者也结合了自己的思考,为我们介绍了信息发布的流程以及如何筛选垃圾信息的判断。
  垃圾信息几乎是每个产品不可避免的问题,尤其是以UGC为主的产品。
  如果无法对这群水军、营销者加以控制,那么不光产品本身氛围,甚至可能带来恶性循环。比如在一个社区里,充斥着大量低劣的广告,则新用户也很难提起兴致去参与讨论。
  所以,本文主要来探讨在这种敌明我暗的互联网环境中,该如何反垃圾信息,拥护一个良好的环境,同时避免误伤到我们的真实用户。
  一、什么是垃圾信息
  在探讨反垃圾策略之前,我们先将互联网上的垃圾信息做下简单的归类。
  1。广告
  最常见的必然是广告,只要我们的产品具有一定的用户量,那么必然像水果吸引苍蝇一样,引来不少各类营销者前来蹭流量。
  他们通常会在评论区、弹幕、公屏等能够和他人交流的地方疯狂刷屏。
  2。低质内容
  因为太过广泛,所以这类信息其实我也不知该如何定义。
  它可以理解为水贴,这类低质量的内容对用户没有什么吸引力,甚至泛滥的时候影响到了产品的内容生态、制度的公正性。
  比如知乎里大量简短无意义的回答,豆瓣里被水军恶意差评过的电影等。
  3。违法信息
  这类政治敏感、黄赌毒等信息,不光对用户有所影响,甚至国家政策也在严控。若不能有效控制,则产品本身运营也存在风险,此前有不少APP就因此被关停整改了。
  二、发布信息的流程
  了解完何为垃圾信息后,我们再来看下这些信息是如何被生产出来的,以便思考该怎么样制定相应的策略防范它们的产生。
  我们以一个最常见的发表评论为例:
  如图所示,我画了一个相当简单的流程图:
  第一步:用户触发
  我们也可以称之为行为门槛,什么类型的用户才允许发表评论?
  相信大家可能经常遇到这样的情况,当你看完一篇文章后,兴冲冲要发表点想法时,系统会冰冷地弹出一个窗口,让你先登录;而在登录之后,又要求你绑定手机号;绑定完后,还要等待注册时长满24小时
  诸如此类,越是成熟活跃的社区,它可能宁愿降低新用户的体验,也要保证新内容的质量。
  第二步:撰写评论
  可能不同的产品千差万别,但笼络地归纳起来,其实就是内容形式和限制条件。
  评论内容是纯文字还是带图片?字数限制多少?图片最多允许几张?只有明确了用户将产生哪些信息,我们才能够有效地针对处理。
  第三步:确认发表
  这一步其实是继准入门槛之后的延伸,我把它称为内容门槛,可以对发表的评论先做一个简单的校验。
  比如空内容、纯字符、大段重复等明显垃圾信息,我们可以将它拦截在这里,都无需进入审核。
  第四步:评论审核
  审核可以分成人工、机器。
  在评论量特别大的产品里,如果靠人在审核将是特别大的工作量,也很可能出现遗漏。而机器审核虽然效率高,却对一些经过包装粉饰的垃圾信息难以识别。
  所以我们通常会选择两者结合,下面会进一步探讨。
  第五步:展示屏蔽
  在经过重重机制之后,我们才最终得出结论:用户刚发布的这条评论是留是去。
  补充一点,现在很多产品即便在判定此条评论为垃圾信息后,也不会简单粗暴地删除,而是选择对外隐藏,但对发布的用户还显示。
  这样的做法当然并不是对垃圾信息的宽容,而是为了避免伤害到被误判的用户。
  额外说明,在这个流程里举例是先审后发,但也有很多先发后审,或者像直播那种边审边播的场景,这里先不赘述。
  三、该如何防范垃圾信息的产生
  直到这里,我们可以开始探讨除了耗时耗力去逐一人工审核外,我们在产品逻辑、算法机制上如何应对这些垃圾信息吧。
  我个人将反垃圾策略分为五个维度,如图所示:
  1。用户属性
  顾名思义,用户属性其实就是我们这款产品对TA的一个身份定义,可以涵盖的有很多,比如:
  注册时长
  有无头像
  是否绑定了手机号
  是否充值消费过
  这些属性代表了这个用户在产品上的价值,也可以从侧面观测出TA是否真的在使用这款产品。
  想也知道,那些为发广告而来的人肯定不会愿意投入太多精力在这些琐碎的过程上,所以,我们就可以在上面大做文章,比如需绑定了手机号的用户才能发布新内容等等。
  同时,我们还可以建立白、黑名单机制,当某个用户频繁发垃圾信息或被举报后,我们可以禁止他再次发布内容。
  2。操作行为
  根据数据观察,正常的用户和滥发垃圾信息的用户他们的操作行为有很大不同,而且有部分甚至是采用脚本或软件进行群发。
  像那些发广告的人为追求效率,他们总是频繁地复制黏贴重复一个流程,每次发布新内容的时间间隔都很短,我们自然也可以在上面做相应限制。
  比如,同一个设备号IP账号ID的用户在3分钟内最多发1条新的内容。
  该如何制定这项相关的策略,其实在于我们对真、假用户的行为判定,你去想想哪些行为真的用户不屑于做,而假的用户又在频繁操作那么很快就会明白了。
  像大家都知道,微信的安全策略特别高,经常封号,因为它会经常检测出那些具有频繁添加好友、地理位置不变变动异常、时常群发等行为特质的违规用户进行处理。
  3。内容信息
  通过检查内容本身来判定这条信息是否符合要求,是反垃圾中的一个最常见策略,也是机器算法不断在深入研究的一个方向,只可惜这项技术本身看着不错,但在实际应用时往往不尽如人意。
  如果你曾做过防垃圾相关的工作,那么你会发现“上有政策、下有对策”。
  中华汉字的文化博大精深,比如我们不希望内容信息里出现“公众号”这类带有引流特性的词语,那么很快就会衍生出“gongzhonghao”“厷众号”“gong众呺”这类夹杂着拼音、火星体的来替代。
  而且这些垃圾信息在不断地被屏蔽、被封号中也在进化,广告越来越软,暗示越来越隐晦。
  像淘宝在微信圈的分享文案一直是行业内的一个笑话,如果你作为微信的PM,让你去堵住这种信息,是不是也很头疼?
  不过泼完冷水,我们还是要继续探讨下该用什么规则去判断这条内容信息能否过审?
  我个人觉得主意有以下这两个维度:
  (1)违禁词库
  其实就是将所有不希望用户发布的内容穷举出来,比如“加微信”“招兼职”这类词语,当用户的内容中包括了这些词语,并达到了某个频率,我们可以将这条内容判定为垃圾信息。
  (2)重复率
  绝大多数情况中,垃圾信息并非偶例,而是成批出现;且因为那个用户的目的通常为一个,所以TA产生的内容会有所重复。
  因为为了宣传效率,TA不太可能每次发布内容都重新编写一套话语。
  所以我们通常可以将用户新发的内容将TA的历史记录做比较,若重复率极高且频繁,那TA可能正在制造大量的垃圾信息。
  4。大数据库
  垃圾信息几乎是所有产品的深受其扰的问题之一,所以现在也有不少可供接入使用的反垃圾系统,它们的价值核心就在于有海量的大数据样本,且在不断扩充,对不同领域的垃圾信息都能很好的识别。
  利用大数据的最大好处就是,全网共享信息,比如某个微信用户在平台A被禁了,那么平台B也能够知晓这个消息,对这个用户严防以待。
  5。抬高成本
  因为垃圾信息是由人产生的,我们在看到表象的同时,也可以换个角度去思考这些人的动机。
  比如说广告,一个微商为了卖出TA的产品,就希望引来客流关注,TA的动机是为了赚钱,而在发布广告信息时,TA其实也存在成本,精力和金钱。
  我们规定必须绑定过手机号的用户才可以发内容,TA就需要多花两分钟去绑定;我们规定必须消费过的用户才可以点评,那TA就需要花一定的金额才能点评
  这些规定其实都是在提升滥发垃圾信息的人的成本,当TA在我们产品上发布成本大于所能获得的回报时,那么TA也没理由再继续这个行为了。
  有一项应用在反垃圾邮件中比较有效的策略就是,当用户发送一封新邮件时,需要消耗TA的设备资源进行一些计算,这对于个人来说微不可察。但对于频繁发送垃圾邮件的人来说,将是不少负担。
  当然,规定绝非越严越好,因为我们还得考虑正常用户,如果要求太严苛,将大多数用户拒之门外,也不是件好事。
  四、举个实例
  讲完枯燥的理论,最后举个例子吧。
  以《QQ阅读》产品为例,根据书籍的评论区这一功能,我们该如何防止垃圾评论的产生?
  首先,还是基于原来画的那个简单的流程图,然后运用上述策略做扩展。
  用户触发撰写评论确认发表评论审核展示屏蔽
  1。首先是用户触发的门槛。为了保证多数用户的体验,可以先做个用户分群,因为垃圾信息通常是由新用户产生,所以在发布评论上,新用户的要求将比老用户更高,比如:
  2。其次,在撰写评论时,我们可以对用户做一些基本的约束,比如:
  3。然后,在确认发表时,我们需判断下是否让用户发表,进入下一流程,在这个流程上其实也可以宽松一些,比如只判断正文内容是否为空。
  4。接下来,可以调下原流程图的顺序,将原来的先审后发改为先发后审。
  因为这样能够让用户发表完成后,即时看到TA的内容,体验更佳。但为了防止垃圾信息对别的用户造成影响,所以可以在此之间加入一条规则用户发表后的内容在初次审核之前,暂时只对TA自己可见。
  也就是说,当用户写了一条书评后,当TA点下“发表”,就立刻能在信息流里看到;但这个书评在未审核完成前,除TA之外的人是看不到的。
  这种做法两边兼顾,既给了用户良好的反馈又防止了垃圾信息带来的影响。
  5。而审核方面,可以同时接入人工和机器审核。其实第4步所说的初审核,也是机器审核,只要初略判断用户发布的评论没大问题,就可以对外开放给其他人。机器审核的耗时较短,可能用户都不会察觉到。
  6。同时,因为考虑到人工审核是件极费人力的事情,可以再加入举报机制、黑名单机制,来帮助运营人员更快的去处理垃圾信息。
  最后,附上一个完整的流程图,以便更好的理解。
  关于反垃圾策略,暂时就只探讨这么多,毕竟个人经验有限,还希望对大家能有所帮助。
  另外,其实上文中很多内容其实针对都是广告类的垃圾信息,并不适用于低质内容。
  而在一个产品中如何提升UGC的内容质量,应该是另一套策略了。比如,定下产品调性、引入核心用户、激励政策、内容再传播等,希望有机会再一起探讨。
投诉 评论

浅谈反垃圾策略:如何营造一个良好的内容环境?做UGC产品常碰见的难题是什么?那就是如何筛选与过滤垃圾信息,为社区塑造良好的产品调性与氛围,为用户提供良好的产品体验。本文中,笔者也结合了自己的思考,为我们介绍了信息发布的流……抓住私域流量的玩家,才是站在新风口的人后流量时代,抓住私域流量的玩家,才是站在新风口的人。私域流量虽不是流量市场的终点,但却是流量战争中能帮我们提升自我战斗力的一把利器。前两天在和一位短视频电商玩家谈起私域流……“中国YouTube”发展史YouTube从最初的籍籍无名到现在国外的主流视频渠道,你知道它的前世今生吗?你了解它是如何发展到现在的头部地位吗?而在中国,有与YouTube比肩对应的视频网站吗,它又是如何……二手书电商中的多抓鱼,还是那颗闪耀的星在二手书电商中,多抓鱼正稳步发展着。与此同时,它也在积极寻找业务方向的扩张与转变,比如扩大二手交易范围以及融合社交属性。最近一年二手书电商市场的变动特别多,多抓鱼已经完成……互联网新商业:众安保险如何重塑传统保险价值链新商业的本质是用新技术或新体验重构传统商业的要素,传统行业和互联网行业都是如此。过去2年一直在公路物流保险领域,深刻感受到互联网技术给传统保险领域带来的新机遇,众安保险就是保险……Vlog是个筐,新瓶旧酒都能装对于很多人来说,所谓Vlog真正的意义、形式已经不是那么重要,无论短视频、网综、营销内容,稍微修改、调整后,就可以都成了全新的Vlog作品。从某种意义上来讲,这也无可厚非,就当……网金与传统电子银行到底有什么本质区别?银行网络金融战略,看似像一片黑森林,主要原因多来自于庞大存量业务体系带来的意识牵绊,导致很多时候我们顾左右而言他,前进而思回撤。因为干扰项太多,道听途说的道理诱惑也太多,所以既……视频监控那些事儿你对视频监控了解多少?其实当前视频监控已经融入到生活的方方面面之中了,从最初的安防所需,发展到现在,监控已经开始扮演起更多的角色。最近刚加入新的创业团队,开始着手布局一个……从平安好医生看大健康生态切入姿势:从边缘人群的边缘需求开始早期的平安好医生在选择切入点上做对了什么?又遗漏了什么?这些动作对我们构建大健康生态的启示是什么?以下是数字化转型的分享线路图,您现在所在的位置为序号的分享:保险业生态建……从社交货币到临时型社交货币社交货币的定义一直存在分歧,而本文对社交货币的定义是用户中能引导触发其他用户产生有价值行为的信息。并基于这一定义,笔者结合临时型社交货币的案例展开具体的分析。社交货币的分……Stories:Facebook的第五次增长接力棒尝试先来思考这样几个问题:Stoies究竟是一种怎样的功能?Facebook全面转向Stories的推动因素?Stories又对Facebook有着怎样的拉动?Faceb……2019中国消费金融市场数字化进程分析2018年,随着我国经济的持续发展、居民收入水平的持续提高和储蓄率的稳定下降,我国消费金融市场规模持续走高,狭义消费信贷余额达到11。27万亿元;另一方面,监管的趋严、各方面成……
国内头部虚拟女团“翻车”,行业该何去何从?谁能想到,被视为“元宇宙”概念后继者的“虚拟人”概念,会突然跌一个跟头。Z世代直播用户想必不会对ASOUL这几个字陌生,这是艺人管理公司乐华娱乐在2020年年末推出的虚拟……5G千元机新成员!荣耀畅玩30开启预订:对称镜头太抢眼5月10日消息,今日,荣耀商城官微宣布,拥有5000mAh大电池、128GB大存储的荣耀畅玩30正式开启预订,下单限量抽赠荣耀耳机。目前新机价格暂未公布,荣耀畅玩30预订……推5G裸眼3D云视讯、翼家智话,贵州电信数字业务再添猛将随着5G发展,3D视频、VRAR成为消费者期待的应用。但昂贵的头显设备,复杂的连接操作,让许多人不得不放弃。与此同时,老人多使用老年机,无法与远在千里之外的打工者视频通话。……居家办公,带火了我的生意今天,你居家办公了吗?疫情防控下,部分城市开启居家办公模式。家原本是生活休息的地方,现在也成为了工作的场所。时间久了,打工人也开始注重家中办公及生活的舒适度,买新座椅、添……头一次见!小米首款随身路由曝光:支持5G转WiFi6相当特别日前,xiaomiui在IMEI数据库中发现了型号为CB0401的产品,报道称这将是小米首款5GCPEPro设备。所谓5GCPE实际上就是随身WiFi或者说移动路由,它除……三星发布6G白皮书6G可能比5G快50倍站长之家(ChinaZ。com)5月11日消息:就在最近,三星电子发布了一份新的白皮书,展示了其下一代网络标准6G的计划。它分享了一篇题为“6GSpectrum:Expandi……华为与中国电信发布超级时频折叠5GAdvanced技术:上行站长之家(ChinaZ。com)5月11日消息:华为与中国电信日前联合举办超级时频折叠5GAdvanced创新技术发布会,并演示了相关技术实验室测试验证结果。据介绍,中国……笔记本喜迎5GHz16核心!Intel发布12代酷睿HX:一H45、P28、U15、U9四大系列之后,Intel今天正式推出了12酷睿移动版的顶级序列AlderLakeHX”(简称HX55),为笔记本带来了桌面级的豪华规格,核心数、频率……联发科发布Genio1200旗舰智能物联网平台集成WiFi6站长之家(ChinaZ。com)5月11日消息:联发科宣布推出新款旗舰智能物联网平台Genio1200,标榜能协助开发者打造具有差异化的智能物联网设备,同时也能确保连接安全,预……索尼推出Xperia10IV5G新机小巧机身塞入5000mA转眼间,索尼Xperia10智能机家族已经迎来了第四代新成员。虽然外形方面变化不大,但与更高端的Xperia1IV机型一样,Xperia10IV也在内部规格上迎来了较大的改进。……Intel推便携式5G基站:手提箱大小、随时随地5G上网5G网络已经在全球上百个国家部署了,信号好坏要取决于5G基站的覆盖程度,某些地区如果不方便部署固定基站,那可以考虑Intel推出的便携性5G基站,仅有手提箱大小,容易携带,信号……韩国电信5G用户达660万连续五个季度实现ARPU同比增长C114讯北京时间5月13日午间消息(蒋均牧)韩国电信(KT)连续五个季度实现ARPU同比增长,5G用户的新增抵消了移动用户总数的下滑。在第一季度财报电话会议上,该运营商……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界