童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

网站内容评分模型

5月17日 程染筱投稿
  我们可以看到目前很多的网站都会有内容评分,无论是电子商务、信息分享还是内容下载。内容的评分主要分为两类,一类是用户对内容的评分,主要针对用户的使用感受,如电子商务网站的商品评分,内容分享网站的内容评分等,这个也是目前最普遍的评分模式,而内容的综合评分的计算也相对比较简单,大多是取所有用户评分的均值;另一种评分方式就是网站自身对内容的评分,主要针对用户的历史行为数据,如通过用户对内容的访问情况评价内容的热门程度等。
  这里要介绍的网站内容评分模型主要针对第二类的评分方式,因为评分的分值是相对固定的,100分制、10分制还是5分制,而用户相对于每个内容所产生的行为数据的数值却千差万别,可能是千数量级,也可能是万数量级,甚至是百万数量级,如何将这些数据转化成标准的评分体制,并让最终的分值分布更加合理化、有效化,从而让真正优质的内容获得较高的评分,并推荐给用户,是这里重点要解决的问题。
  内容评分实例
  介绍应用的案例前,先要说明下应用的环境和具体的需求:假设有一个内容分享网站,需要将网站中的内容进行评分,以5分制的形式展现,即每个内容的评分只可能出现15这5个分值,目的是展现出网站中每个内容的热门程度,为用户的选择和阅读提供参考。
  这是一个最简单的内容评分的应用,上面已经非常明确的说明了评分的目的区分内容的热门度,以及最终的数据展现以5分制的形式展现。对于这样一个明确了的数据需求,我们就可以选择指标、搭建模型、并最终输出结果。
  1、选择指标
  评价内容的热门度,貌似挺简单的,直接用内容浏览量(PV)作为评定指标不就行了?确实,PV是个不错的选择,也是最简单的一种选择,但其实还有更好的选择,访问数(Visits),访问用户数(UV),这两个指标能剔除同一个用户短时间内连续刷新同一内容的情况,所以我们不妨选择访问用户数UV来作为评价指标。
  2、构建评分模型
  现在开始才是文章的关键内容,显然,需要对内容的热门程度进行评价首先要消除指标的度量单位,并把分值的分布区间控制在要求的范围内15分。
  消除度量单位?也许你已经想到了,是的,还是数据的标准化,这篇文章中的方法已经在多处使用,可以说是很多数据分析和数据挖掘的基础步骤。
  MinMax归一化评分
  MinMax是最常用的数据归一化方法(详见数据标准化这篇文章的描述),处理后的数据分布在〔0,1〕的区间内,接下来只要把01的数值转化15这5个分值就行。很简单,先乘以4使数据落在〔0,4〕的分布区间,四舍五入,是不是只剩下04这5分分值了,再加1就可以得到我们想要的结果了。我们来看看处理后的各分值内容分布情况的示例:
  根据上面各分值内容分布图可以看出MinMax的评分结果的每个分值的内容数量分布是不可控的,一般会跟网站中热门内容和冷门内容的比例直接相关,所以当某些网站的热门内容只占网站所有内容的20,并且这些内容的访问量异常高,占据了所有网站访问量的80,也就是我们平常说的符合二八法则。那么可能出现的情况就是大部分的内容评分集中在1分,小部分集中在5分,而中间的2、3、4分的内容分布非常少,其实上图就有点偏向这个趋势,但其实很多时候我们期望的内容分布可以偏向正态,也就是大部分内容能分布在中间分值,两端分值的内容数据相对较少,于是就有了下面的另一种评分模型:
  Z标准化评分
  如果你的网站的内容数量很多,那么就可以使用Z标准化(详细描述还是参见数据标准化那篇文章,这里不重复了)。Z标准化的好处是可以让数据呈现正态分布的趋势(不是正是我们想要的吗),标准化后的数据趋于N(0,1)的正态分布,也就是整体的均值为0,标准差为1。再想想办法让他们变成只是15这5个分值,当标准化后的数值:
  小于等于1。5(即1。5)时:1分
  大于1。5(即1。5)小于等于0。5(即0。5)时:2分
  大于0。5(即0。5)小于0。5(即0。5)时:3分
  小于等于0。5(即0。5)小于1。5(即1。5)时:4分
  大于等于1。5(即1。5)时:5分
  如果数据符合标准正态分布,那每个分值的比例大概是,1分和5分的内容分别占7,2分和4分的内容分别占23,3分的内容占40。我们再来看看用这个方法得到的评分结果的分布情况:
  是不是看到你想要的结果了?
  3、输出结果
  当然内容评分的展现方式有很多,下面是几个网站的评分截图,其实都不错。
  上面介绍的主要是针对单一指标的内容评分体系,其实在很多情况下内容的评分是诸多指标共同影响的结果,那么内容的评分应该考虑所有这些影响因子,应该构建相应的模型计算内容的综合评分,这里不展开,之后有机会再介绍。
  本文采用BYNCSA协议,转载请注明来源:网站数据分析《网站内容评分模型》
投诉 评论 转载

网站内容评分模型我们可以看到目前很多的网站都会有内容评分,无论是电子商务、信息分享还是内容下载。内容的评分主要分为两类,一类是用户对内容的评分,主要针对用户的使用感受,如电子商务网站的商品评分……网页中空格的烦恼相信认真做过网页设计(WebDesign),或者关注过页面设计的同行都对“空格”不陌生。“空格”属于一类细节,很容易被忽略,但又比较影响效果,更麻烦是很不好控制。此问题总结的想……Google用户体验设计准则谷歌的愿景Googl用户体验团队致力于创建有用的(useful)、快速的(fast)、简单的(simple)、有吸引力的(engaging)、创新的(innov……微软的翻身仗是怎么打的?通过IE看WP7设计关于WP7刚开始想写一篇全面地关于交互的文章,写着写着发现怎么也摆脱不了零散与空洞,也难怪,想表达的面太广必然挖掘的深度会变浅,最后下定决心与其在大而全上纠结不如专心解读一个应……按钮的去与留在产品设计的过程中,更多的考虑往往并不是还需要新增什么功能。在开发的过程中,总能想到各种各样的新功能,新的想法也不断涌现,偶尔也会遇到一些想当出色的想法。但对于一个产品而言,太……交互设计的理性Vs。多样的感性用户和一位视觉设计师讨论UED分工的时候,他说:“交互设计做的就是逻辑。”听起来似乎没错:互联网交互做得最多的就是点击、跳转。无论target到另一个page是self还是blan……手机界面常用导航设计分析所谓的交互设计,其实设计的就是人如何向机器发送指令,机器如何向人传达信息,一来一往是为交互。当要传达的信息量很少时,好办,就想Google的搜索框那样,往白底上一放就行了。但当……互联网产品品质指标思考1、什么是好的互联网产品?什么是好的互联网产品呢?对于这样开放性的问题,答案肯定是形形色色的。例如:1)、用户数多的产品是好的互联网产品2)、赚钱多的产品是好……搜索引擎如何实现用户图片检索的需求满足一、什么是需求满足1。1什么是需求满足用户来搜索“章鱼保罗”,就文本相关性而言,搜索引擎只要返回和“章鱼保罗”内容相关的结果就可以了,这样用户是否满意呢?用户……为未来的网页做设计(为移动设备一致体验做设计)原文designingforthefutureweb:http:www。smashingmagazine。com20110329designingforthefutu……不同平台下菜单的交互设计探析菜单的交互类型:平行结构线性结构(菜单层级沿x、y任一轴向平行展开。)纵深结构(菜单层级沿z轴纵深递进,一个界面只显示一个菜单层级。)十字结构菜单……造成需求产品视觉差异的原因反思最早看到下面这张图的时候,还觉得能产生这个不可思议,因为当时是在创业型公司,而且之前经历的即使是大公司也都是创业型的产品,小团队的好处就是勤沟通,常交流,从设计到开发阶段,每个……
《seo学习网》网站seo初期要解决的问题如何优化网站,网站优化从那些方面入手南京seo顾问讲解网站seo内容页面如何设计优化体验电子商务网站:如何做SEO优化Lily4。0快捷启动工具西风seo谈如何在涪陵找到一个好的搜索引擎优化公司seo入门教程那么多,依旧做不好seo《百中seo》seo全会,但排名还是上不去?整站优化:导出链接、外链建设、移动站及适配的关系怎样优化网站,分析SEO与网站收录情况最为重要seo分析:seo日常网站日志如何分析商丘seo教程:大型网站seo规划排名思路

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界