范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

从零开始学R数据分析,数据预处理

  上一节讲到R数据清洗内容,主要包括缺失值处理、特殊字符处理、大小写转换、数据格式转化、重复值处理、数值替换,本节在R数据清洗的内容上继续学习R数据预处理,内容包括数据合并(横向合并、纵向合并),自定义排序等内容,下面一起学习。 示例工具:R x64 3.5.3、RStudio
  本文讲解内容:数据预处理
  适用范围:数据合并、自定义排序
  1   数据合并
  数据合并这里主要有三种方法进行合并,包括数据表的纵向合并、横向合并以及增加新字段的方法,将多个小表合并为一个大表。
  1.1 纵向合并
  纵向合并的意思就是在数据表的后面追加新的行记录,比如在EXCEL中使用复制粘贴功能往下增加新的行记录,在R中使用rbind()函数来纵向合并,这里首先构建一个data数据表,数据表内容如下。 #手动创建数据表data data<-data.frame(ID=c("c001","c002","c003","c004","c005","c006","c007","c008","c009","c010"),                  NAME=c("Rmesh","Khilan","Kaushik","Chaitali","Hardik","Komal","Tom","Muffy","Susan","Kevin"),                  AGE=c(23,20,23,25,27,24,26,31,26,30),                  ADDRESS=c("Ahmed","Delhi","Kota","Mumbai","Bhopal","MP-A","MP-B","Indore","JP-No.1","JP-No.2"),                  SAL=c(2000,1500,2000,5000,8500,6500,5500,9500,7000,9000))
  然后构建一个data1数据表,数据表如下。 #手动创建数据表data1 data1<-data.frame(ID=c("c011","c012"),                   NAME=c("Ami","Dave"),                   AGE=c(30,28),                   ADDRESS=c("Ahmed","Delhi"),                   SAL=c(8500,8000))
  使用rbind函数,将data和data1两个数据表纵向合并起来。 #合并数据表 data<-rbind(data,data1)
  1.2 横向合并
  横向合并类似于EXCEL中的VLOOKUP函数的用法,在R中使用merge()函数进行横向合并,创建一个新的数据表data2,包含ID、GENDER和LEVEL三个字段。 #手动创建数据表data2 data2<-data.frame(ID=c("c001","c002","c003","c004","c005","c006","c007","c008","c009","c010"),                   GENDER=c("female","female","male","female","female","male","male","male","female","male"),                   LEVEL=c("Bachelor","Bachelor","Bachelor","Bachelor","Master","Master","Bachelor","Doctorate","Master","Doctorate"))
  使用merge函数将data和data2两个数据表横向合并,合并的方式为inner,该方法将两个数据表中共有的数据匹配到一起生成新的数据表,这里共有的字段是ID。 #数据表合并 inner模式 data<-merge(data,data2,by="ID")
  除了inner方式以外,合并的方式还有left、right和outer方式。 #数据表合并 left模式 data<-merge(data,data2,all.x=TRUE,by="ID")
  数据表合并后,可以重置数据表的索引,默认状态下索引是从1开始向下排列。
  这里使用rownames()函数,将ID这一列设置为索引列。 #设置索引列 rownames(data)=data$ID
  1.3 增加新字段
  增加新字段也可以实现表的合并,要增加新字段可以将现有的字段进行合并,或者通过现有字段进行计算后生成新字段,字段合并首先用paste()函数将两个字段合并为一个字段,然后使用cbind()函数合并到数据表。 #合并两个字段的内容 ID_NAME<-paste(data$ID,data$NAME) data=cbind(data,ID_NAME)
  另一种方法是对数据表中的字段进行计算,产生新的字段,首先计算SAL的平均值,保留两位小数,结果如下。 #计算新字段并合并 AVG_SAL=round(mean(data$SAL),digits = 2)
  然后,使用cbind函数将计算字段合并到表。 #计算新字段并合并 data=cbind(data,AVG_SAL)
  2   自定义排序
  2.1 降序排列
  在R中使用order函数进行排序,这里对SAL列进行排序,当decreasing为TRUE时表示降序排序。
  2.2 升序排列
  若省略decreasing参数,默认为正序排序。 #对数据表按SAL列进行排序(正序) data[order(data$SAL),]
  2.3 自定义排列
  也可以同时对数据表中的多列进行排序,这里对SAL和AGE两列降序排列。 #对多列进行排序 data[order(data$SAL,data$AGE,decreasing = TRUE),]

小米Buds3配置速看旗舰级混合降噪,很遗憾没有空间音频数码圈这一年你有想过自己已经多久离不开耳机了吗?以前戴有线耳机总是会觉得厌烦,因为每次耳机线都会缠绕在一起,每次戴耳机前还得多一步理线的步骤,真的好浪费时间。但现在有了蓝牙的出现,看了iPhone14,刚到手的iPhone13退货还来得及吗?iPhone13才刚刚拿到手,iPhone14即将上市的消息就随之而来了。看了iPhone14渲染图和参数配置后,到手的13都不香了。与iPhone13相比,iPhone14最大的超级重要的Java知识点详解集合框架前言前面我们保存大量数据时,首先会想到数组。但数组长度是固定的,如果保存数量不确定的数据时就存在问题了。本文将带大家了解Java集合框架的体系结构,掌握ListSetMap接口的区品质坚如磐石的三防手机AGMM6体验,让老人体验越来越好对于数码爱好者来说,AGM这个品牌并不陌生,在户外三防领域鼎鼎有名,旗下不仅推出了热爱户外运动的年轻用户所喜爱产品,还有为长辈们专门设计的M系列机型,满足老年群体的需求。今天体验的小米有品众筹频道推智能水龙头手是人的身体部位中接触细菌最多的部位,养成良好的洗手习惯对预防疾病是有着关键作用。所以小米现在在水龙头上面也是开启了新产品的制造。你家的水龙头或许也可以要换新喽。消息显示,小米有品小米MIX4和小米11Ultra谁更值得购买?8月10日晚上19点30分,雷总举行了他的年度演讲,在这场演讲中也伴随着发布了很多新品,其中最受关注的应该就是年度旗舰小米MIX4了,这款手机大家足足等待了三年,因为MIX的一代真小米手机再次发力骁龙888Plus120W快充时隔三年,小米MIX系列迭代新机姗姗来迟。近日,根据多家科技媒体的消息,2021雷军年度演讲,米粉期待已久的MIX4正式发布,是MIX基础序列的真正迭代机型。对于小米MIX系列来说8月13日,小米新系统迎来公测,首批支持13款机型2021雷军年度演讲上,小米一口气发布了四款产品,分别为小米MIX4小米平板4小米电视和四足机器人CyberDo,可以说是吊足米粉胃口。但并非所有米粉都关注硬件产品,看发布会的网友七夕送男生什么礼物好?告诉你男生最喜欢的蓝牙耳机七夕情人节送男生什么礼物好呢?好多女生都纠结这个问题,其实很多男生都比较喜欢数码产品哦,比如蓝牙耳机或者手机,送一款蓝牙耳机再手工做一个耳机保护套肯定让男生更开心呢。如果要送蓝牙耳荣耀平板V7Pro深度体验这一套,全能应对你的各种需求随着这两年线上教育的兴起,平板市场重新迎来了热潮。也随着各品牌的深耕,平板如今有了更出色的应用表现。在过去几年,平板产品一度被很多品牌放弃,因为觉得受众群并不多。但也有那么几个品牌三星8月份新品发布会将在今天举办,折叠屏新手机也将登场依照过去的情况,8月份是三星新品发布旗舰级商品的重特大连接点,2021年不出意外,全世界新品发布会将在今天举办,换句话说三星重磅消息的Galaxy新品会在今天宣布出场。再依据官方网
迪拜推出充电黑科技,电动汽车越开电越足近日,迪拜道路交通管理局宣布,他们发明了一种利用形磁共振技术,给运行中的电动汽车无线充电的技术,当电动汽车行驶在这条路上,就可以边行驶边充电。这项无线充电技术名为SMFIR,可以解Shopify与TikTok合作开发社交电商8月25日消息,加拿大电商巨头Shopify当地时间周二表示,它正在与TikTok合作开发一项功能,让购物者可以直接从社交应用程序上购买商品。Shopify在其文章中表示,拥有Ti随着5G手机逐渐普及,4G芯片反而贵了?随着移动芯片供应商越来越关注5G解决方案,4G智能手机芯片的供应正在缩减。日前,据外媒DigiTimes引援业内人士的说法,从本年下半年开端,5G手机的关键芯片价格还在持续降低,但又一个时装品牌加入元宇宙RalphLauren合作虚拟社交ZEPETO今年以来,数字加密货币的资产价值不断攀升,创下历史新高,这让人们意识到,虚拟世界的经济原理和资本实力与现实世界相似。RalphLaurenxZepeto数字服装系列本月,德国奢侈时参与感小米品牌口碑营销内部学习手册334页完整版这份参与感小米口碑营销内部手册,是小米联合创始人黎万强原创内容。送给所有的产品经理和运营经理,一定要放在团队内部多多学习。完整版内容在文末领取目录大纲一,参与感篇互联网思维就是口碑微软放出Windows11官方ISO,可以刷起来了微软的新系统Windows11已经公布了一段时间,相信许多人也已经通过UUP转ISO等方式进行了尝鲜。不过对于追求纯净系统的人来说,还是直接从官方下载的镜像文件更加安心一些,现在它凭什么一代就逆袭成功?3060游戏本二当家在消费者心目中是个啥样?提到以往的戴尔G系列游戏本,电脑老鸟们恐怕会直摇头,前几代G系列孱弱的性能和不佳的散热导致口碑崩塌。但在RTX30系显卡锐龙5000H及第11带酷睿H平台发布后,全新的游匣G15竟工信部67款应用违规索权弹窗骚扰,点名蜻蜓FM音遇近日,工业和信息化部(下称工信部)针对App违规索取权限开屏弹窗信息骚扰用户等问题开展了回头看,至8月25日,尚有67款App未按时限要求完成整改。南都隐私护卫队注意到,其中包括蜻iPadmini6基本确认,果粉买苹果今年的秋季发布会下月就来,除了iPhone13,还有不少小伙伴十分期待新款iPadmini6的到来。那么,iPadmini6到底啥样?现在已经基本确认了!今天,疯师傅就给大家汇谷歌推AAB安装包是为了不兼容鸿蒙?告诉你真相最近,一条新闻引起了很多人的注意。谷歌要求开发者从2021年8月开始,所有提交到谷歌应用商店的应用都必须以AAB格式提交。众所周知,安卓是一个开源的操作系统。有了开源项目AOSP,高性价比降价手机盘点,物美价廉的它们你还能忍住不剁手吗1。小米11pro小米11的升级版,这款手机现在的价格售价降到了4300。作为小米11的升级版,这款手机采用了骁龙888处理器,6。81英寸的曲面屏。同时在充电方面,采用了67W有