范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

pythonpandasampampquot数智教育ampampquot数据可视化分析

  数据介绍:
  数据来源于由宁波教育局与阿里云计算有限公司主办,宁波效实中学承办的"数智教育"数据可视化创新大赛数据集。
  https://www.heywhale.com/mw/dataset/5eb3f5f9366f4d002d76e70f1_teacher.csv:包含了近五年各班各学科的教师信息 term:学期 cla_id:班级ID cla_Name:班级名 gra_Name:年级名 sub_id:学科ID sub_Name:学科名 bas_id:教师id bas_Name:教师名  2_studentinfo.csv:包含了当前在校学生详细信息 bf_StudentID,学生ID bf_Name,学生姓名 bf_sex,性别 bf_nation,民族 bf_BornDate,出生日期(年) cla_Name,班级名(与teacher.csv的cla_name对应) bf_NativePlace,家庭住址(省市或省) Bf_ResidenceType,家庭类型 bf_policy,政治面貌 cla_id,班级ID cla_term,班级学期 bf_zhusu,是否住校 bf_leaveSchool,是否退学 bf_qinshihao,宿舍号  3_kaoqin.csv kaoqin_id,考勤ID qj_term,学期 DataDateTime,时间和日期 ControllerID,对应考勤类型表里的ControllerID controler_name,考勤名称 control_task_order_id,对应考勤类型表里的control_task_order_id bf_studentID,学生ID,对应学生信息表 bf_Name,学生姓名 cla_Name,班级名 bf_classid班级ID  4_kaoqintype.csv:考勤类型 controler_id,考勤类型id controler_name,考勤类型名称 control_task_order_id,考勤事件id control_task_name:考勤事件名  5_chengji.csv:学生成绩 mes_TestID,考试id exam_number,考试编码 exam_numname,考试编码名称 mes_sub_id,考试学科id mes_sub_name,考试学科名 exam_term,考试学期 exam_type,考试类型(对应考试类型表) exam_sdate,考试开始时间 mes_StudentID,学生id mes_Score,考试成绩(-1为作弊,-2为缺考,-3为免考) mes_Z_Score,换算成Z-score(Z-score、T-score、等第 是一种学生成绩评价方式,可以参考网络百科) mes_T_Score,换算成T-score mes_dengdi:换算成等第(参见:https://tianchi.aliyun.com/forum/postDetail?spm=5176.12281978.0.0.65ca76d8kaGnld&postId=47777)  6_exam_type.csv:考试类型 EXAM_KIND_ID:考试类型id EXAM_KIND_NAME:考试类型名称  7_consumption.csv:本学年学生消费信息 DealTime,消费时间 MonDeal,消费金额 bf_studentID:对应学生信息表studentid AccName,姓名 PerSex,性别  特别说明: 1.由于人为登记等不可避免原因,某些字段可能存在缺失或者异常值 2.从班级名可以看出,从2017年开始学校陆续启用了新校区,2018年新校区统一命名为型为"白-高二(01)"和"东-高二(01)"的班级名 3.考勤类型中的"校服[移动考勤]"指的是没穿校服3.考勤类型中的"校服[移动考勤]"指的是没穿校服#导入用到的库 import pandas as pd import matplotlib.pyplot as plt
  1.各科成绩分布图
  结果分析:
  1.体育,美术,音乐,通用技术成绩很稳定均匀,与之有关的影响因素较少,在于学生的个人选择及天赋,可不必投入较多资源;
  2.该学校的数学,英语,语文平均成绩明显较其他科目成绩好,说明该校的主要的教师资源,人力资源主要集中在三大学科上;
  代码:#读取成绩文件 chengji_data=pd.read_csv("5_chengji.csv") #mes_Score,考试成绩(-1为作弊,-2为缺考,-3为免考) 删除以上数据 chengji_data1=chengji_data[chengji_data["mes_Score"]>0] #查看每列空值 chengji_data1.isna().sum() #按课程名分组 chengji_group=chengji_data1.groupby("mes_sub_name") #按学年分组 chengji_group_year=chengji_data1.groupby("exam_term") #建立空表 data=pd.DataFrame({"data":[]}) boxes=[] boxes_name=[] #遍历按课程名分组的所有课程名及成绩 for k,g in chengji_group:     if k!="data":         boxes.append(g["mes_Score"])         boxes_name.append(k) #全部学年集合 chengji_year=[]        for k1,g1 in chengji_group_year:     chengji_year.append(k1)
  #定义图颜色 color = dict(boxes="DarkGreen", whiskers="DarkOrange", medians="DarkBlue", caps="Gray") plt.rcParams["font.sans-serif"]=["SimHei"]##中文乱码问题! plt.rcParams["axes.unicode_minus"]=False#横坐标负号显示问题! plt.figure(figsize=(10,5))        #图片大小为10*5 plt.boxplot(boxes,whis=2,showmeans=True,showbox = True,labels=boxes_name,showfliers=False) plt.grid(axis="y",alpha=0.4)#绘制 plt.show()
  2.历年成绩对比曲线
  结果分析:
  1.从图上可以看出所有成绩从2013-2015都比较平稳,许多课程从2015年开始成绩开始呈下降趋势;
  2.可能跟近年来一直要求的素质教育有关,出题的方式及难度都有问题,以及老师的过往经验的不适用性;
  代码:#新建模板以分组日期集合为index data1=pd.DataFrame({"date":chengji_year}) data1.set_index("date", inplace=True)#设置日期为index for k,g in chengji_group:#遍历课程分组     print(k)     chengji_group_year=g.groupby("exam_term")#按学年分组取年和平均成绩写入新表     for k_y,g_y in chengji_group_year:         print(k_y,g_y)         data1.loc[k_y,k]=g_y["mes_Score"].mean()
  plt.figure(figsize=(12,5))        #图片大小为12*5 plt.plot(data1,ms=5,marker=".",label=data1.columns) plt.grid(alpha=0.4)#绘制 plt.legend(loc="lower right")#显示图例 plt.show()
  3.考试类型与成绩对比分析
  结果分析:
  1.考试类型与各科成绩波动较大,可能存在明显的难易程度不同;
  2.学校的期中期末考试成绩一般分布可以,其他类型考试波动很大;
  代码:#读取考试类型表 kaoshi_lx=pd.read_csv("6_exam_type.csv") kaoshi_lx.set_index("EXAM_KIND_ID", inplace=True)#设置类型为index
  #按课程分组遍历 for k,g in chengji_group:     #print(k)     #按考试类型分组     chengji_group_year=g.groupby("exam_type")     #取考试类型和平均成绩     for k_y,g_y in chengji_group_year:         #print(k_y,g_y)         kaoshi_lx.loc[k_y,k]=g_y["mes_Score"].mean() kaoshi_lx
  4.政治面貌/民族占比#读取学生信息表 zhengzhi=pd.read_csv("2_student_info.csv") #按政治面貌分组 zhengzhi_group=zhengzhi.groupby("bf_policy").count() #按民族分组 minzu_group=zhengzhi.groupby("bf_nation").count()  zhengzhi_group["bf_StudentID"].plot.pie() minzu_group["bf_StudentID"].plot.pie()
  5.学生消费信息分布
  结果分析:
  1.图中可以看出各学生总消费以及每次消费金额都成明显的正态分布,说明该学校整体消费趋势正常
  2.该数据统计了6个月(2018.7-2019.1)六个月的消费情况,平均来说该学校学生每月平均消费在[250,500];
  3.每次消费金额在7-10之间,但存在可能购买文具等小物件上,这里不做详细的分类讨论;
  代码#读取消费信息表 sale=pd.read_csv("7_consumption.csv") sale["DealTime"]=pd.to_datetime(sale["DealTime"])#转换日期格式 ym_mean = sale.groupby([sale.DealTime.dt.year, sale.DealTime.dt.month]).sum() #按月求和 ym_mean["MonDeal"]=abs(ym_mean["MonDeal"]) ym_mean["MonDeal"].plot.bar() #学生消费top sale_top= sale.groupby("bf_StudentID").sum() #按学生求和 sale_top.sort_values(by=["MonDeal"],inplace=True) sale_top["MonDeal"]=abs(sale_top["MonDeal"]) sale_top["MonDeal"].head(20).plot.bar()
  6.学生考勤分析
  代码#读取考勤表 kaoqin_df=pd.read_csv("3_kaoqin.csv") #使用正则表达式清洗班级名 for i in range(len(kaoqin_df)):     str1=re.sub(u"(.*?)|白-|[A-Z]|东-|[0-9]", "",kaoqin_df.loc[i,"cla_Name"])     str1=str1.replace(" ","")     kaoqin_df.loc[i,"cla_Name1"]=str1 #取所有考勤汇总 kaoqin_type=kaoqin_df.groupby(["controler_name"]).count() kaoqin_type.index kaoqin_moban=pd.DataFrame({"type":kaoqin_type.index}) kaoqin_moban.set_index("type", inplace=True)#设置类型为index kaoqin_moban#按新的班级名分组 kaoqin_gruop=kaoqin_df.groupby(["cla_Name1"]) #遍历分组 for k,g in kaoqin_gruop:     print(k)     #按考勤类型汇总     tmp=g.groupby(["controler_name"]).count()     for j1 in tmp.index:         #print(tmp.loc[j1,"kaoqing_id"])         #根据考勤类型写入新表         kaoqin_moban.loc[j1,k]=tmp.loc[j1,"kaoqing_id"] kaoqin_moban
  labels = list(kaoqin_moban.columns) first = list(kaoqin_moban["高一"]) second = list(kaoqin_moban["高二"]) third = list(kaoqin_moban["高三"]) data = [first, second, third] x = range(0,8) width = 0.35 # 将bottom_y元素都初始化为0 bottom_y = [0] * 8 # 计算每组柱子的总和,为计算百分比做准备 sums = [sum(i) for i in zip(first, second, third)] #print(first,labels,sums) plt.figure(figsize=(12,5))   for i in data:     # 计算每个柱子的高度,即百分比     y = [a/b for a, b in zip(i, sums)]     #print(x,y)     plt.bar(x, y, width, bottom=bottom_y)     # 计算bottom参数的位置     bottom_y = [(a+b) for a, b in zip(y, bottom_y)] plt.legend(labels,loc="right") plt.xticks(x, kaoqin_moban.index) plt.title("考勤分析") plt.show()
  labels = list(kaoqin_moban1.index) da1 = list(kaoqin_moban1["操场考勤机"]) da2 = list(kaoqin_moban1["早退[移动考勤机]"]) da3 = list(kaoqin_moban1["校徽_早退"]) da4 = list(kaoqin_moban1["校服[移动考勤机]"]) da5 = list(kaoqin_moban1["离校[移动考勤机]"]) da6 = list(kaoqin_moban1["进校[移动考勤机]"]) da7 = list(kaoqin_moban1["迟到[移动考勤机]"]) da8 = list(kaoqin_moban1["迟到_晚到"])  data = [da1,da2,da3,da4,da5,da6,da7,da8] x = range(0,3) width = 0.35 # 将bottom_y元素都初始化为0 bottom_y = [0] * 3 # 计算每组柱子的总和,为计算百分比做准备 sums = [sum(i) for i in zip(da1,da2,da3,da4,da5,da6,da7,da8)] #print(first,labels,sums) plt.figure(figsize=(8,6))   for i in data:     # 计算每个柱子的高度,即百分比     y = [a/b for a, b in zip(i, sums)]     #print(x,y)     plt.bar(x, y, width, bottom=bottom_y)     # 计算bottom参数的位置     bottom_y = [(a+b) for a, b in zip(y, bottom_y)] plt.legend( kaoqin_moban1.columns,loc="upper center") plt.xticks(x, kaoqin_moban1.index) plt.title("考勤分析") plt.show()

全国各省市大学生活费各是多少,你认为大学生活费多少合适?感谢邀请。8月份快要结束,准大一新生将要面临大学生活,这个时间段,新生最关心的就是怎么样去面临未来的大学生活,这其中就包括要为大学准备多少生活费,同样家长也犯愁,大学生活费给多了怕找领导办事,领导反复说研究研究,你认为研究到最后结果会如何?结果是什么样的这个问题根本不是最重要的。最重要的是您现在急需建立成熟的思考问题的逻辑!否则您的这种思考问题的角度思路逻辑会对你未来的职场发展有巨大的负面影响!题主朋友提出的问题已经单位上越干事越累,越被边缘化,是什么问题?单位上越干事越累,说明你是老实人!老实人往往在单位是能者多劳的角色。但话又说回来,既然累,你还干,说明你还有追求,我想你更痛苦的是被边缘化!想不被边缘化,就得有所投靠,学会做人,这我15岁中学生,想入手DW和卡西欧这两款表,怎么样?当然选择卡西欧啊!一个15岁的中学生,要以实用靠谱为主要考量,DW这种伪文艺就不要买啦。以电子计算器起家的卡西欧,做电子表当然是手到擒来的容易。数字计时器和电子计算器原理上是一样的临时工在单位干十五年以上退休有退休金吗?在单位已经工作了15年的,实际上已经不是临时工了,按照中华人民共和国劳动合同法的规定,应该是属于签订无固定期限劳动合同的员工了。但是虽然按照法律的基本精神,你应该属于无固定期限的员在婚恋市场上单身女性年龄越大就越不受欢迎吗?又来一波,女人是人,不是木偶,想真心过日子的,不是年龄大小,是男人的选择,她不是嫁不出去,而是有些人不靠谱,没有安全感,所以不嫁。别把女人比作物品来欣赏,喜不喜欢是你看走了眼,你不作为一名退伍军人,你们目前在做什么工作?我94年当兵,97年退伍,在当时只有干部志愿兵城市兵才安排工作,作为当三年兵的我,父亲也提早安排,让我把粮食关系找关系放进档案,正在为这事打算的时候,父亲给我来信说不用我跑了家里已路过亲戚家打算借住一晚,亲戚爱搭不理的,以后还有必要来往吗?几年前,我家一个远房亲戚突然来访,我出钱出力招待他们,最后却没有得到好名声。一个周末的下午,有人敲我家的门,打开门后发现是三个陌生人一个中年男人带着两个十七八岁的孩子,还拖着两个大本田混动是如何用别人都失败的方案走向成功的?本田的混动利用了别人失败的方案?那么这个方案就应该是比亚迪的第一代混动方案。比亚迪于2010年推出的一款混动车型F3DM,这是比亚迪最早的混动方案,结构图如下这套方案与本田应用的I红枣怎么泡酒好喝?谢谢邀请!红枣怎么泡酒好喝?你好,老岳为你推荐红枣泡酒小妙招首先选择干大红枣,洗净,晾干,放干锅中慢火炒,炒到枣表皮变色后。凉透,再泡酒,这样做泡的酒,有一种大枣特有的甜香气。红枣为什么吴裕泰茶叶店基本看不到人买,但从未倒闭?利润大,南城人喝张一元,北城人喝吴裕泰,进去人几百元肯定不会倒闭,茶叶的利润太大了,当年的茶一斤几百上千元,隔年了打碎了还能买,茶叶产地进货没有中间商赚差价肯定赚钱。吴裕泰的花茶,
林庭谦2716率队加时赛轰出150冲击波天津送北控4连败北京时间1月16日,CBA联赛继续进行,天津男篮对阵北控男篮。双方经过加时赛较量,最终天津122106击败北控。双方数据天津林庭谦27分16助攻詹姆斯29分15篮板3助攻田雨17分(体育)NBA综合詹姆斯迎里程碑湖人不敌76人约基奇准绝杀掘金胜魔术新华社华盛顿1月15日电20222023赛季美职篮(NBA)常规赛15日上演多场较量,洛杉矶湖人队詹姆斯在当日比赛中达成38000分里程碑,不过球队以112113不敌费城76人丹佛巨星33岁场均得分表现科比28分,乔丹30分,那詹姆斯呢NBA之上,球员最畏惧什么呢?伤病和年龄定然是两大让球员无奈的因素,毕竟我们常说伤病猛如虎,球星也因为英雄迟暮而感觉到有心无力,且于篮球这般竞技舞台之上,33岁后就会迎来下滑,而在皮蓬让詹姆斯和乔丹带同一支队伍,老詹绝对比乔丹完成的更出色最近皮蓬前妻和乔丹的儿子打的很火热,这对于皮蓬也是一种不可接受的,在参加一档美国杨毅的活动中,皮蓬又开始高谈阔论了,皮蓬认为,詹姆斯在三支不同球队已经证明了自己,而乔丹一直都在享受心语我并不相信有悔过,如果当时毫无意义,那便到此为止心语心情Jan16(1)着欣赏的眼光看人带着包容的心做事带着知足的心生活带着感恩的心看世界你会发现世界因你而更美好(2)时间匆匆转眼又是一年愿我们放下一切执念不念过往,不畏将来淡看4连败难逃,并非首钢球霸要做掉解立彬,新帅更不会重用方硕晓川北京时间1月16日,CBA赛场又爆出一个小冷门,福建男篮10388战胜北京,这也是首钢的3连败,本赛季首钢共三次对阵福建,两负一胜,一心要杀入4强的首钢队竟然在倒数第二的鱼腩球队身詹姆斯今天达到3。8万分,就一次得分王,为啥总得分这么高?38000分天南地北大拜年今天湖人输给76人的比赛结束,詹姆斯如愿以偿拿到里程碑,总得分达到38000分,很多人一直不明白,明明才拿过一次得分王的他,怎么总得分这么高?一句话,不怕无现金时代太危险?为什么越发达国家,越不流行移动支付?近几年,我国移动支付得到不断地普及,无论是年轻的城市白领还是进城卖菜的瓜农,大家都在使用手机移动支付。与现金支付相比,手机支付可以避免纸币找零或收到假钞等问题。数据表明,使用支付宝济南这个国家4A级网红景区免费开放一个月!不去可就亏大了这下终于可以实现遛娃自由了!园区那么大,今天去没看完,明天接着去去了怎么玩?游玩攻略来了!游览乘车游览区(自驾或乘坐园区小火车,自驾汽车入园需收费)(汽车进园需要购票)(持票可免费开州汉丰湖获批国家水上国民休闲运动中心试点单位美丽的汉丰湖。开州区文化旅游委供图1月14日下午,国家水上(海上)国民休闲运动中心评审标准颁布新闻发布会在北京召开。重庆市开州区汉丰湖被确定为第一批国家水上(海上)国民休闲运动中心外国女疯狂注射惊现异形面自豪拥有世界上最大脸颊整容现今社会整容风气盛行,不少艺人或网络红人为了追求完美的外貌,纷纷到整形医院进行各种大大小小的医美疗程。在追求美丽过程上,有些人不知不觉逐渐失控走火入魔,一意孤行下把自己推向了一