童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

SocialNetwork社交网络分析

2月2日 失了心投稿
  SNA(SocialNetworkAnalysis)社交网络分析已经成为一个关键技术,也是一项热门的研究,在现代社会学、人类学、社会语言学、地理、社会心理学、通讯研究、资讯科学、组织研究、经济学,以及生物学领域。
  一:什么是SNA社交网络分析
  社交网络分析的威力何在?我想几个案例来说明。
  案例1:对一个毫无了解的组织(这个组织可以是一个公司,亦或是一个组织),如果能够拿到这个组织成员之间的信息流动记录(例如通话记录或邮件记录),那么通过SNA可以分析出谁是这个组织的实际控制者(要知道有必要加上实际二字),谁是这些成员中有影响力的人,那些成员更倾向于聚集在一起。对上述问题的回答可以用来做公关把精力用在对的人身上;用来处理组织架构;用来游说获得支持关系紧密的人会更倾向于支持同一种意见,一方面是由于观点相同所以关系紧密,另一方面你的大部分朋友都支持的事情你总不会下脸来做那个少数派吧。
  案例2:举个现实中的例子吧,鹅厂刚推出朋友圈的时候我对这个产品的印象非常好,因为它给我推荐的朋友有一些是很多年都没有联系,不特意提起都想不起来名字的“朋友”。包括人人网推荐的好友也是很精准的。这些产品的背后就是用的SNA朋友的朋友也是我的朋友,敌人的朋友是我的敌人,敌人的敌人是我的朋友,朋友的敌人是我的敌人。
  这两个案例是直观印象中的社交网络分析,网络中的节点是人。如果把SNA只用在人身上那就太狭隘了。相同的思想完全可以用在物身上。例如:
  案例3:豆瓣FM也是我很喜欢的一款产品与你喜欢的音乐不期而遇。一些歌曲是我对某一个时期的感觉印记,有些印记记忆犹新,有些印记逐渐模糊。时不时就能在豆瓣FM和这些或清晰或模糊的印记不期而遇,让人惊喜。为什么豆瓣FM能做到这点那?是它对歌曲按照什么节奏曲调风格歌词做了分类吗?如果你这样认为那就太傻太天真了。这里的SNA每一首歌就是网络中的每个节点,而你的喜欢或不再播放就给你听过的歌曲之间加强减弱了联系。
  经过上面三个案例,可以对SNA有个初步了解。
  二:我的好友圈
  一般来说有两大途径来获得好友圈:1)社交应用社交网站,比如人人微博微信。2)通信记录电话邮件短信。后者数据都掌握在相应的运营商,前者的数据可以从应用开放的API或者简单粗暴一点自己写蜘蛛爬。
  我采用写爬虫的方式得到了人人的好友圈。抓了两层好友,即我的好友,和我好友的好友。其实这个层数可以自己设定,用递归函数很容易实现。唯一消耗的是运行时间和存储。即使只抓两层好友圈,用我的笔记本也跑了15分钟。
  接下来该networkx登场了。一通运算之后得到如下结果:
  1)两层好友圈
  这是对7169个好友关系的做图。当然最中心的点是我自己。可以看到周围一圈是相对孤立的“云”,那是因为我只抓了两层的原因。
  七千多个好友,这么多层关系,如何分析?别担心,社交网络分析不是一个新兴的领域,看米国文献说这个领域从六七十年代就有了,只不过是近十年火起来的。所以有一大堆现成的算法来基本搞定你的大部分需求。
  对七千多个好友的基本分析如下:
  2014060821时32分16秒开始整体分析
  社交网总共有7169个好友
  排名前10的好友数
  1徐希文909
  2刘杉607
  3李超505
  4colipso405
  5吕秀芳343
  6藏新汀336
  7王大舸312
  8王卉卉258
  9孙昊255
  10杨子旭248
  2014060821时32分16秒开始受欢迎指数分析(基于closenescentrality)
  受欢迎指数排名前10的好友为
  1colipso0。51
  2马佳0。50
  3徐希文0。40
  4贾丽娜0。40
  5洛锋0。39
  6张伟0。39
  7陈欣0。39
  8王蕴杰0。39
  9孙峰0。39
  10张宁0。38
  2014060821时35分15秒开始枢纽指数分析(基于Betweennesscentrality算法)
  处于枢纽节点的前10好友为
  1徐希文0。21
  2colipso0。20
  3刘杉0。14
  4马佳0。12
  5李超0。11
  6吕秀芳0。08
  7藏新汀0。08
  8王大舸0。08
  9王卉卉0。06
  10陈欣0。05
  2014060821时49分07秒开始幕后黑手指数分析(基于Eigenvectorcentrality算法)
  Notdefinedformultigraphs。
  2014060821时49分07秒开始GooglePageRank指数分析(基于GooglePageRank算法)
  pagerank()notdefinedforgraphswithmultiedges。
  对一些词解释下:
  枢纽:一个人同时属于两个不怎么想干的群体,那么这个人就处于枢纽的位置。
  幕后黑手:顾名思义,一个人不怎么和大部分人联系,只和关键人物发生联系,通过关键人来影响群体。
  在分析中后两个算法因为底层数据构造的社交网络为无向网络,所以在这一个具体分析中不适用。
  2)核心交往圈
  扯那么多基本人我不可能都认识,networkx还提供了分析某人的核心交往圈的算法,还是以我为例:
  2014060821时20分39秒开始整体分析
  社交网总共有502个好友
  其他的分析因为是用同一个模块来实现的,和上面相同,就不重复了。
  3)圈里圈外
  上面的还只是宏观层面的结果,从微观层面看,在大群体中也总是少不了一个一个的小圈子,这个圈子里的人关系更为紧密,有着共同的话题,一般对圈子之外的人有一定的排斥性,而对圈子里的人信任度会很高,正所谓圈里圈外。
  对于一门发展了将近半个世纪的学科,还是那句话,你想到的东西早就有人想到了。
  比如我的好友圈中:
  第45个小圈子为:崔文英殷渤涛郑新玉孙昊陈欣张辰星陆伯文这是我的一帮高中同学。
  4)最短路径
  已经有非常成熟的算法来寻找社交网络中的两个节点之间的最短路径。也就是所谓的六度空间。即我如果想认识某某,那么应该找那些最少的中间人来达到目的?
  举一反三一下,如果是由各种书籍来组成的一个网络,书是节点,一个人如果读过两本书,那么这两本书就有个连线。问题来了,在各种小说APP上,如果一个人读了两本书,如何给他推荐第三本书?这两本书最短路径上的其它书嘛,有人会问,这不是两本书已经有连线了,路径不是最短了吗?这就涉及到了路径的权重问题,有了权重,直接的连线就不一定最短咯。权重如何得到?Well,Itdepands。
  由于我只抓了两层好友,so,最短路径不会超过2。
  随便找一个:colipso谷雨范文卓我想认识范,那么找谷雨就对了。
  5)三人行
  对于任意三个人,可以有如下16种关系:
  比如对于012C这种类型,作为中间人,是不是可以介绍另外两人认识那?
  看看我的交往圈里面这16种类型各占多少:
  201类型的三节点有94109个
  021C类型的三节点有0个
  021D类型的三节点有0个
  210类型的三节点有0个
  120U类型的三节点有0个
  030C类型的三节点有0个
  003类型的三节点有19747819个
  300类型的三节点有3605个
  012类型的三节点有0个
  021U类型的三节点有0个
  120D类型的三节点有0个
  102类型的三节点有1112967个
  111U类型的三节点有0个
  030T类型的三节点有0个
  120C类型的三节点有0个
  111D类型的三节点有0个
  当然,因为我只抓了两层交往圈,可以说还是比较核心的交往圈,所以很多三节点类型都没有出现,如果抓取的层数更多,结果会更显著。
  仍然是举一反三,网络中的节点无论是人还是物,对于16种结构中的每一种其实都可以制定一定的策略来达到一定的目的。上述分析已经完成了行动的第一步,识别目标。
  三:乱七八糟的一些想法
  1)传统统计和现代分析
  最近同时在研究R和社交网络分析,发现传统统计分析方法和现代分析方法还是有一些差别的。
  传统统计分析方法起源于19世纪,无论是点估计区间估计假设检验都是依赖于一定的分布假设前提,更不要提贝叶斯统计,有大量的学术研究搞定了小样本下检验整体的方法,目的是想方设法降低计算量。但问题是现在的环境用户偏好变化非常快,也就是分布变化快。用传统统计方法在分析的群体变化,分析的参数变化下还是有一定局限。
  而现代的分析方法无论是蒙特卡洛模拟还是社交网络分析都是基于密集计算,管你什么分布,模拟100次不够,那就模拟10000次,100000次。根据大数定律,结果跑也跑出来了,八九不离十。
  2)工具
  上面的所有分析都是用python和networkx模块完成。Python的灵活数据结构,大量的开源模块(numpyscipymatplotlibnetworkxwebpy等等)可以说是居家旅行,数据分析的必备良药。清晰的语言规范也避免了括号风暴。我很欣赏。
投诉 评论 转载

蓝港王峰:我们在手游设计中的用户体验真的好么?注:自2013年初正式进入移动游戏市场以来,蓝港相继推出《王者之剑》、《苍穹之剑》及《神之刃》三款质量较为出色的中重度手游,并取得了较好的收入。与其他依靠单款爆品手游模式不同的……想让你的app美丽起来?没有用户体验是不行的最近,每个app都是“美丽的”。如果你读了最近的技术新闻,你会发现这场盛况:美丽的图表,美丽的故事,美丽的短消息,美丽的笔记本,美丽的电池信息。在我们的设计里最求漂亮是值……高校外卖派送亲身体验小结熟悉我的朋友都知道我这小半年的时间都在参与一个第三方众包外卖项目,具体可参考以前的一篇文章外卖模式来人:http:www。woshipm。compd80458。html简……小白用户的小米手环体验报告上次有机会以嘉宾的身份参加了MIUIV6发布会,令人尴尬的是嘉宾的地位不如米粉,米粉在当场就能领取到手环,而嘉宾却没有这个待遇。把粉丝放在第一位,或许就是小米真正牛逼的地方。……用户体验读书笔记之潜移默化有的时候做设计,有想法而缺少方法。接到项目的时候,想要开始设计却找不到合适的切入点。开始画原型之前,知道需要思考分析,可是又不知道从何开始,左想一下,右想一下,思路不清,不成体……网页设计中的色彩心理学笑天涯说:为什么Facebook的主题色是蓝色的?为什么淘宝的主题色是橙色的?如何在网页设计时,正确地使用色彩?欲知个中缘由和方法,且看本文分解!作者是位顾问,曾帮多家公……设计师版式宝典!从零开始教你掌握网格系统【Martin导读】有很多刚入门的设计师并不了解网格系统,也不会利用网格系统来让画面更加有条理,更可以让内容更易读,实际上它是超级实用的工具,今天转载的一篇基础教程,手把手带你……搞懂数据可视化的五虎将,做热门信息图!【Martin导读】数据可视化(DataVisualization)技术指的是运用计算机图形学和图像处理技术,将数据换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和……用户体验为王Android设计师TaylorLing访谈这篇文章译自SquirrelP的文章UserExperienceisKing,作者是NINORAPIN,由于我已经很久没翻译过文章了,英文能……SocialNetwork社交网络分析SNA(SocialNetworkAnalysis)社交网络分析已经成为一个关键技术,也是一项热门的研究,在现代社会学、人类学、社会语言学、地理、社会心理学、通讯研究、资讯科学……iPhone屏幕变大后,应用会如何变化笑天涯说:苹果推出大屏的iPhone6和iPhone6plus,必将引起诸多应用的适配问题,当然也会为应用的设计带来诸多变化。到底该怎么设计才能让用户有更好的用户体验呢?本文的……11个索尼失败产品:技术领先的公司是如何做蠢事的索尼于6月19日举行了股东大会,CEO平井一夫表示“虽然将电子业务作为努力的最重要课题,但却违背了股东们的期待,十分对不起。”自平井一夫2012年4月上任以来,东证股价指数已经……
找人做网站时不得不慎重考虑的因素有哪些建商城网站如何使客户青睐建网站企业不能忽视对颜色的搭配建网站公司在内容方面要做些什么怎样建网站能容易使客户信任搭建网站为了后期排名要规避哪些问题设计网页时一些不被重视的小细节前端页面设计需要规避的一些问题网页排版设计的重点在哪里设计网站如何才能符合人们的需要设计公司网站要特别关注的细节网站的设计需要被重视的地方
烧胎起步真的能更快吗2条小众赚钱路子,在家也可轻松上任!你在上海虹桥火车站能看到什么?没错,就是咱通化旅游宣传片!电话可以查酒店的入住记录(怎么查一个人酒店登记记录)种薯技术要点小学梦想作文700字热文聚热点网 处女情结男那层膜关乎尊严本年度让我感动的人把身份证装进手机卡,移动数字身份来了有关英雄联盟经典语录春天的味道如何做公众号的引流呢?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界