从零开始学SQL数据分析,SQL数据清洗
获取数据后,对数据的清洗工作必不可少,常用的数据清洗方法主要有缺失值填充、数值替换、数据类型转换、数据分列、重复值处理等,清洗的数据结果直接影响最后数据分析的结果,一个成熟的数据分析师,在日常工作中绝大多数时间都在数据清洗,下面一起学习。 缺失值填充
缺失值处理,可以使用均值、线性插值等方法进行填充,这里使用均值来作为填充值填充,首先计算分数的平均值,然后筛选分数为空的行,使用UPDATE函数将空值填充为平均值。 #计算score列的均值 SELECT AVG(score) AS avg_score FROM score;#使用均值填充空值 UPDATE score SET score=74 WHERE score is null; select * from score;
清理空格
清理字符中的空格,使用的是TRIM函数,并且用UPDATE函数更新表格。 #清理字符中的空格 UPDATE course SET Cname=TRIM(Cname); select * from course;
数值替换
REPLACE函数可以对字符进行替换,类似于EXCEL的替换功能。 #修改和替换 UPDATE course SET Cname=REPLACE(Cname,"语文","语文-A"); select * from course;
大小写转换
小写转换可以用LOWER函数,大写转换可以用UPER函数,这里使用LOWER函数将大写A转换为小写a。 #大小写转换 UPDATE course SET Cname=LOWER(Cname); select * from course;
数据类型转换
数据类型转换用CONVERT函数,括号中第一个写要转换类型的值,第二个写要转换成的数据类型,此处将出生日期转换为日期类型。 SELECT Sname,CONVERT(Sage,date) as "出生日期" FROM student;
mySQL常用的数据类型如下:
数据分列
数据分列与EXCEL的功能相似,这里使用到的函数是SUBSTRING_INDEX,这里将" 语文-A ",分列成科目 语文 与评级为 A 两部分。#数据分列 SELECT SUBSTRING_INDEX(cname,"-",1) AS "科目", SUBSTRING_INDEX(cname,"-",-1) AS "评级" FROM course;
分列后的数据可以通过更新增加在原数据表中,下面是具体的代码。 #数据分列(改表),添加两个空字段 ALTER TABLE course ADD (col1 VARCHAR(255),col2 VARCHAR(255)); SELECT * FROM course;
#更新分列后的字段内容 UPDATE course SET col1 = SUBSTRING_INDEX(cname,"-",1), col2 =SUBSTRING_INDEX(cname,"-",-1); SELECT * FROM course;
重复值处理
重复值的处理使用到DISTINCT函数,也可以使用数据分组功能,实现将某个字段去除重复值的功能。 #重复值 SELECT DISTINCT CId,Cname FROM course;
苹果汽车高管转投福特消费电子企业造车比想象更难苹果汽车部门最近的一则人事变动引起了美国电动车市场的震动。2018年从特斯拉加入苹果公司的汽车负责人道格菲尔德(DougField)日前正式宣布加入福特汽车。这也令苹果的造车计划增
买新能源车还是传统燃油车1。2020年社会消费品零售总额391981亿元,其中汽车类消费为39414亿元,占比高达10。05,排名第一(房子没有算在消费数据内)。2。截止2021年7月,新能源车销售占比为
马斯克传统车厂已是零利润日前,特斯拉掌门人在社交媒体上发布了一则消息,内容主要指向大型传统汽车制造商,分享对传统厂商利润率的一些看法。马斯克表示大型传统汽车制造商,卖车的利润率极低,甚至已经是零利润。他们
华为的5G技术与美国的5G技术相比如何?5G(5thGeneration)技术,指的是第五代通信技术。全球都用一个5G技术,美国和中国的都一样,没有本质区别。但是,掌握5G技术的国家格局却在发生变化,在5G技术之前的4G
甲方直接引用软件DLL文件来做二次开发,会不会有版权问题?这得看这个dll的来头和你使用的规模了,本质上这就是盗版行为。例如Arcsoftface。dll这个dll文件是虹软人类识别库的核心算法,人家一个上市公司的老老小小都靠这个吃饭呢。
网络券商第一股是谁?网络券商第一股是东方证券。传统券商第一股是中信证券。随着近十年互联网的普及,从而诞生了一批互联网券商,其中互联网券商主要是有三家,分别为东方财富同花顺以及大智慧等,这三家在互联网券
阅读金怎么领取?关于阅读金的领取办法是你要多读一些文章,多看一些视频,特别是在看广告的时候,一定要认真的去看,不要等时间一到你就点击断开,这样是不对的,你要把整个广告耐心的看完。这样的话,你就会领
VIVOX60和荣耀50哪个手机好?简单提取一下vivoX60和荣耀50哪个手机更好?主要纠结的点是处理器!那么答案就很简单了,X60的Exynos1080处理器再怎么样也比荣耀50的高通778G强吧!瘦死的骆驼比马
三体中出现了几个文明,具体有什么表现?就凭我的记忆说一说了。1。人类文明这当然是我们最熟悉的一种文明。在书里,又可以分为地球人类和星舰人类两个分支。地球人类太阳系中唯一的文明,在书中最后发展到了太空时代,标志性行为是可
鸡西市有出过哪些名人?高强著名演员,饰演过西安事变等多部影视作品马绍信大决战中林彪的饰演者14任程伟国家一级演员15江永华奥运会中国第一枚自行车奖牌获得者16唐金乐黑龙江省运会冠军刘德利2005年全运会
为什么有人会说人类有可能是宇宙中的第一个文明?你信吗?谢邀!宇宙星空,大到无边,且存在了几百亿年,还在扩张,为什么这么长时间都没出现过人或其它文明,而就在几千年前人类才出现在太阳系里的地球上,真有点不可思议,也许曾经有过很多,但是人不