专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

Python3对球员做大数据降维(因子分析得分),为C罗找到

  众所周知,尤文图斯需要一座欧冠奖杯,C罗也还想再拿一座欧冠奖杯,为自己的荣誉簙上锦上添花。意甲霸主在意甲虽然风生水起,予取予求,但是在今年欧冠18决赛赛场上,被法甲球队里昂所淘汰,痛定思痛,球队解雇了主教练萨里,签约名宿皮尔洛,但是要想在欧冠赛场上夺冠,这还不够,球队还需要什么?没错,需要一名强力中锋,在正印中锋伊瓜因难堪大用的情况下,尤文图斯必须引进一名强力中锋。
  现在的问题是,在新赛季即将开始、疫情下球队银根紧缩的背景下,到底谁才是合格的引援人选?本次我们使用基于Python3的factoranalyzer库来对球员进行分析,试图寻找尤文图斯最适合引援的球员。
  首先我们来划定范围,先排除掉不可能的签约,比如拜仁的莱万多夫斯基,或者是热刺的哈里凯恩亦或是皇马的哈基姆本泽马,这三人都是世界级中锋,但是由于身价等多种因素导致他们加盟尤文图斯的可能性无限趋近于零。好吧,让我们现实点,巴萨的苏亚雷斯,罗马的哲科以及马竞的莫拉塔才是可能的人选,苏亚雷斯已经和巴萨闹翻,出走几乎是必然。莫拉塔下个赛季也不会出现在卡尔德隆球场,哲科在罗马虽然过得还不错,但是很明显他想要更高的荣誉。
  数据分析首先就得有数据,让我们来看看他们三个上赛季的比赛数据。
  首先来看看同在西甲的苏亚雷斯和莫拉塔:
  这里我们抽取中锋最重要的两项数据,进球数和进球转化率,可以看到在进球数相差4个的情况下,莫拉塔的进球转化率仅为14。5,落后于苏亚雷斯的19。
  作为中锋,除了进球,还需要一定的策应能力,这样就可以为C罗的后插上提供帮助:
  可以看到在策应能力上,莫拉塔也落后于苏亚雷斯,让我们再看看同在意甲的哲科和伊瓜因的数据:
  哲科在上个赛季无论是进攻能力还是策应能力都明显强于伊瓜因。
  现在我们来抽取一些高阶数据,这里以进球、转换率和助攻作为特征样本,当然了,如果愿意,也可以添加一些别的特征,这里只是简单演示一下,但是需要注意一点,数据建模只有有限的参考价值,因为球员的个人因素如:球员国籍,球员丑闻,球员个人目标定位(或期望值),球员伤病史及严重程度等等,这些都是没有参考数据的。
  所以,我们以纯能力数据为核心考量,球员转会身价及年薪这些成本因素不作年化成本计算,理论上也可以说是从主观角度根据转会新闻对此进行判断。同样,球员及所处球队的竞训水平也不作为参考数据,因为即便天赋再高的球员,长期和不在同一水平的球员或者教练员一起训练,也会导致与期望值有巨大偏差。
  将数据添加到数据集:importpandasaspdimportnumpyasnpfrompandasimportDataFrame,Series构建数据集mydata{进球:〔16,12,16,8〕,进球转化率:〔19,14,13,10〕,助攻:〔8,2,7,4〕,}dataDataFrame(mydata)data。index〔苏亚雷斯,莫拉塔,哲科,伊瓜因〕print(data)
  数据矩阵:进球进球转化率助攻苏亚雷斯16198莫拉塔12142哲科16137伊瓜因8104
  因子分析是通过对原始数据相关系数内部结构的研究,将多个指标转化为少量互相不相关且不可观测的随机变量(即因子),以提取原有指标的绝大部分的信息的统计方法。因子分析首先将原始数据标准化处理,建立相关系数矩阵并计算其特征值和特征向量,接着从中选择特征值大于等于1的特征值个数为公共因子数,或者根据特征值累计贡献率大于80来确定公共因子,求得正交或斜交因子载荷矩阵,最后计算公因子得分和综合得分。
  第一步,建立因子分析模型:fromfactoranalyzerimportFactorAnalyzer,RotatorfaFactorAnalyzer(rotationNone)fa。fit(data)print(fa。loadings)
  公共因子与原有变量指标之间的关联程度由因子载荷值体现,由于初始因子载荷矩阵结构不够简明,各个因子的含义不突出。为此采用方差最大法,使各个变量在某个因子上产生较高的载荷,而在其余因子上载荷较小。
  但是公共因子与原有变量指标之间的关联程度由因子载荷值体现,由于初始因子载荷矩阵结构不够简明,各个因子的含义不突出。为此采用方差最大法,使各个变量在某个因子上产生较高的载荷,而在其余因子上载荷较小,经过特征数据迭代收敛,得到旋转后因子载荷矩阵:rotatorRotator()print(旋转后矩阵:,rotator。fittransform(fa。loadings))
  随后我们可以简单看一下变量方差,即是每个原始变量在每个共同因子的负荷量的平方和,也就是指原始变量方差中由共同因子所决定的比率。变量的方差由共同因子和唯一因子组成。共同性表明了原始变量方差中能被共同因子解释的部分,共同性越大,变量能被因子说明的程度越高,即因子可解释该变量的方差越多。共同性的意义在于说明如果用共同因子替代原始变量后,原始变量的信息被保留的程度。print(fa。getcommunalities())
  也可以查看因子相关矩阵和特征值:print(fa。geteigenvalues())
  当然了,我们的最终目的是根据因子模型对各个球员进行综合打分,最后使用各个因子方差贡献率占3个因子方差贡献率的比重作为权重进行加权汇总,得到各个球员的综合得分F,即:defF(factors):returnsum(factorsfa。getfactorvariance()〔1〕)
  之后就可以在矩阵中依次进行计算:scores〔〕foriinrange(len(fa。transform(data))):newF(fa。transform(data)〔i〕)scores。append(new)print(scores)
  得到分值数组:〔0。7294004536510521,0。2958329655707666,0。530110265958429,0。9636777540387146〕
  然后我们就可以为原矩阵添加一列数据:data〔综合打分〕scoresprint(data)
  得到新矩阵:进球进球转化率助攻综合打分苏亚雷斯161980。729400莫拉塔121420。295833哲科161370。530110伊瓜因81040。963678
  同时可以指定按照新字段列进行排序,方便数据展示:datadata。sortvalues(by综合打分,ascendingFalse)
  得到排序后的矩阵:进球进球转化率助攻综合打分苏亚雷斯161980。729400哲科161370。530110莫拉塔121420。295833伊瓜因81040。963678
  如果愿意,我们也可以对矩阵进行可视化操作,这里以水平柱状图为例子:importmatplotlib。pyplotaspltimportmatplotlibmatplotlib。rcParams〔font。sansserif〕〔SimHei〕matplotlib。rcParams〔axes。unicodeminus〕Falseplt。barh(range(4),scores,height0。7,colorsteelblue,alpha0。8)plt。yticks(range(4),〔苏亚雷斯,莫拉塔,哲科,伊瓜因〕)plt。xlim(1,2)plt。xlabel(分数)plt。title(引援打分)forx,yinenumerate(scores):plt。text(y0。2,x0。1,sy)plt。show()
  根据综合评分,苏亚雷斯无疑是最佳人选,退而求其次是哲科,第三选择是莫拉塔,无论如何,他们三位的综合能力都要比队内的伊瓜因都要强,从这个角度来看,就算选择莫拉塔,也是比让伊瓜因留队更好的选择。
  结语:必须指出的一点是,球员特征所形成的数据结果,绝对不能成为做决策的主要依据,只能作为参考而存在,过度依赖数据往往可能适得其反,比如曾被誉为足坛数据战术大师的贝尼特斯,其根据数据排首发阵型的操作曾经聒噪一时,可现在呢?只能混迹于中超联赛。截止到本文发布的2020年9月24日凌晨,尤文图斯俱乐部通过租借的形式引进莫拉塔,而苏亚雷斯600万英镑转会马德里竞技,哲科留队。尤文图斯选择了因子分析模型分数不高的莫拉塔,莫拉塔能否帮助C罗圆梦?新赛季欧冠谁执牛耳?让我们拭目以待。

(体育)滑板世锦赛男子街式资格赛赛况当日,2022滑板世锦赛男子街式资格赛在阿联酋沙迦举行。2月2日,中国选手苏建军在比赛中。新华社记者王东震摄2月2日,中国选手张杰在比赛中。新华社记者王东震摄2月2日,中国选手张杰国羽三对男双全部一轮游周昊东(左)何济霆2月1日,泰国羽毛球公开赛在曼谷全面开战。虽说只是超级300级别的赛事,但国羽基本延续了上一站参加印尼公开赛的阵容,以老带新,主要目的还在于练兵,有实力的队员则要莫兰德受伤尚未归队,辽宁男篮抓紧引进中锋外援辽宁男篮正在沈阳训练,备战第三阶段联赛。针对第二阶段比赛球队暴露出内线存在明显短板的问题,寻找一位强力中锋外援已成当务之急。目前,辽宁男篮俱乐部高层正在国外考察人选,力争在第三阶段帕拉蒂奇我们已经关注波罗很久了抓住了签丹朱马的机会直播吧2月2日讯热刺总监帕拉蒂奇在接受俱乐部官网采访时谈到了新援波罗和丹朱马,帕拉蒂奇肯定了两位新援的实力,并表示很开心能够签下这样的球员。在谈到新援波罗时,帕拉蒂奇说首先,在过去李亚光,被查据重庆市纪委监委2月2日消息,重庆市体育局原巡视员李亚光涉嫌严重违纪违法,目前正接受重庆市纪委监委纪律审查和监察调查。李亚光(资料图)公开信息显示,李亚光出生于1958年,曾是一名耐克蒂芙尼全曝光!它提前预定年度鞋王没想到吧,Nike竟然和TiffanyCo。合作了。首发的,就是一双鞋这次耐克经典的空军1号,开始带点奢侈珠宝味了。标志性的品牌色蒂芙尼蓝,从鞋盒就开始吸睛。尽管官方图还没亮相,近RMC勒格拉埃仍远程操控着法国足协,否认所有指控且不想辞职直播吧2月2日讯前法国足协主席勒格拉埃在此前因针对齐达内的言论而引发争议,同时他还深陷性骚扰丑闻。在当地时间1月11日,勒格拉埃在足协执委会结束后表示同意会议结果,暂时中止自己的法冬奥场馆华美转身北京冬奥会后,冬奥场馆向大众开放。图为小朋友们在国家速滑馆冰丝带进行短道速滑训练展示。新华社记者鞠焕宗摄奥运场馆赛后利用是一道国际公认难题。时值北京冬奥会和冬残奥会成功举办一周年,津门虎或喜迎功勋指挥官回归,曾被名帅推荐到西甲,效力过豪门日前,根据深圳队记者程文莉透露球队功勋队长李源一,已经合约到期。李源一合约到期之后,就意味着他拥有了自由身球员的身份。93年出生的李源一正处于当打之年,而且综合能力特别强。所以,李终老伯纳乌?沙特超级合同难以打动莫德里奇与皇马至少续约1年2月2日,西班牙阿斯报皇马版主编龙赛罗透露,尽管有来自沙特的超级合同,但莫德里奇看上去并没有被打动,接下来,他大概率与皇马完成至少一年的续约,甚至终老伯纳乌。此前西班牙世界报爆料称卡卡我建议莱奥留下,有时候离开米兰并不是一个好主意巴西球星卡卡今天接受了米兰体育报的独家专访,他也谈到了即将到来的米兰德比以及莱奥和德凯特拉雷等球员的话题。我们先来聊聊莱奥吧他是一个非凡的球员,我非常喜欢他,如果他将意甲视为跳板,
如果档案中显示有三个不同年龄,退休时应该按哪个算?依据是什么?对于即将办理退休的人员,可能有一个问题不清楚,那就是退休年龄的认定,实行居民身份证和职工档案相结合的办法,当职工本人的身份证和档案记载的出生年月不一致时,以本人档案记载的最先时间为本人在一个私立学校担任初中体育老师,学校里勾心斗角严重怎么办?题主似乎有些困惑。至于在复杂的勾心斗角的环境里该怎么办,完全取决于你自己。不光是私立学校里有勾心斗角,凡是有人群的地方,都会有矛盾有矛盾,就会有明争暗斗,只不过程度不同而已。至于怎大学毕业后档案重要吗?谢邀,大学毕业后档案的重要性取决于个人工作的性质!但对每个人大学毕业生来说,都很重要(除非你选择回家)丢失请速补办!特别说明毕业后档案不能放在自己手里。可以存放学校生源地人事局人才在清华北大或者其他顶尖985院校,到底存在不存在智商被碾压这回事?我觉得智商碾压是存在的。我上大学时被同学叫去测智商,用的是国外很流行的通用的那款试题,就是有很多图形判断的那个。同学们测出来从90到110不等,很聪明的班长测出来是125,我测完后高中时填的档案有多重要?高中档案袋中有什么?有什么用?高中生在毕业后回领取到一份纸质档案,这个纸质档案是需要带到大学中去的,很多高中毕业生对于纸质档案中存放有什么东西都非常的好奇,想知道里边有什么,还有一你经历过哪些塞翁失马,焉知非福的人生大转折?多年以前,有熟人介绍我入一间五金厂做保安头,比普通保安高仅500元,但不用上夜班,仅凭这一条就值了,最怕上夜班。入到厂半年后,老板看上了一个比他年轻他30岁的本厂跛脚女文员,又瘦又人活到多少岁才是最合适的呢?寿命太长的人会怎么样?这个问题把人生看得很通透,寿命太长难免遭罪,对自己对儿女都是负担,走得安详也算一种福分。至于活到多少岁,可能并不重要,活得值得才最重要。要说活到多少岁才最合适,古人云人生七十古来稀城里人没有社保,没有地,要怎么生存?现实是,城里人没社保不在少数,主要是没工作单位的,个体户的,摆地摊的,理发的,等等。这些人不象农民有点地,他们吃一根葱都要钱,生活的确比农民更艰难多少倍。目前,国家对城乡拒不交纳一农村老话说送亲要小,接亲要老是什么意思?有道理吗?在农村结婚都是要送亲接亲的,很多都还保留着传统的习俗,还是比较有讲究的,比如就有姑不接姨不送的说法,新郎方姑姑不接亲,新娘方姨不送亲。那么送亲要小,接亲要老这句话又是怎么理解呢,今女孩学哪些专业好?应悟空小秘书邀答!女孩学什么专业好?我们家人的职业只有老师和医生,也许有职业偏见,世界观也会与众不同。从祖辈开始看中了学医,认为医生受人尊敬,要请医生出诊都用小独轮车上门请!这一继天津理科投档线在570630分的高校有哪些?每年的分数投档线都是高考填报志愿的一个主要参考依据。也是考生衡量自己水平与理想高校差距的一个标杆。因此每年招生考试院都会公布各个高校在所在省份的投档分数线,供考生作为参考的依据。2
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网