范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

为什么使用Pandas?数据结构及基本使用操作

  1Pandas介绍
  2008年WesMcKinney开发出的库 专门用于数据挖掘的开源python库 以 Numpy 为基础,借力 Numpy 模块在计算方面性能高的优势 基于 matplotlib ,能够简便的画图 独特的数据结构 2为什么使用Pandas
  Numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas学习的目的在什么地方呢?
  增强图表可读性 回忆我们在numpy当中创建学生成绩表样式: 返回结果
  如果数据展示为这样,可读性就会更友好:
  便捷的数据处理能力
  读取文件方便
  封装了Matplotlib、Numpy的画图和计算 3 Pandas数据结构
  Pandas中一共有三种数据结构,分别为:Series、DataFrame和MultiIndex(老版本中叫Panel )。 其中Series是一维数据结构,DataFrame是二维的表格型数据结构,MultiIndex是三维的数据结构。
  1.Series
  Series是一个类似于一维数组的数据结构,它能够保存任何类型的数据,比如整数、字符串、浮点数等,主要由一组数据和与之相关的索引两部分构成。
  Series的创建
  参数: data:传入的数据,可以是ndarray、list等 index:索引,必须是唯一的,且与数据的长度相等。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。 dtype:数据的类型
  通过已有数据创建 指定内容,默认索引 pd.Series(np.arange(10))
  指定索引 pd.Series([6.7,5.6,3,10,2], index=[1,2,3,4,5])
  通过字典数据创建
  1.2 Series 的属性
  为了更方便地操作Series对象中的索引和数据, Series 中提供了两个属性 index 和 values index
  values
  也可以使用索引来获取数据:
  2.DataFrame
  DataFrame是一个类似于二维数组或表格(如excel)的对象,既有行索引,又有列索引 行索引,表明不同行,横向索引,叫index,0轴,axis=0 列索引,表名不同列,纵向索引,叫columns,1轴,axis=1
  2.1 DataFrame 的创建
  参数: index:行标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。 columns:列标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。
  通过已有数据创建
  举例一: pd.DataFrame(np.random.randn(2,3))
  回忆咱们在前面直接使用np创建的数组显示方式,比较两者的区别。
  举例二:创建学生成绩表
  但是这样的数据形式很难看到存储的是什么的样的数据,可读性比较差!!
  问题:如何让数据更有意义地显示?
  给分数数据增加行列索引,显示效果更佳
  效果:
  增加行、列索引
  2.2 DataFrame 的属性 shap
  index
  DataFrame的行索引列表
  columns
  DataFrame的列索引列表
  values
  直接获取其中array的值
  T
  转置
  结果
  head(5) :显示前5行内容
  如果不补充参数,默认5行。填入参数N则显示前N行
  tail(5) :显示后5行内容
  如果不补充参数,默认5行。填入参数N则显示后N行
  2.3 DatatFrame 索引的设置
  需求:
  2.3.1  修改行列索引值
  注意:以下修改方式是错误的
  2.3.2  重设索引
  reset_index(drop=False) 设置新的下标索引 drop:默认为False,不删除原来索引,如果为True,删除原来的索引值
  2.3.3  以某列值设置为新的索引
  set_index(keys, drop=True) keys  : 列索引名成或者列索引名称的列表 drop  : boolean, default True.当做新的索引,删除原来的列
  设置新索引案例
  1、创建
  2、以月份设置新的索引
  3、设置多个索引,以年和月份
  注:通过刚才的设置,这样DataFrame就变成了一个具有MultiIndex的DataFrame。
  3.MultiIndex 与 Panel
  3.1 MultiIndex
  MultiIndex是三维的数据结构;
  多级索引(也称层次化索引)是pandas的重要功能,可以在Series、DataFrame对象上拥有2个以及2个以上的索引。
  3.1.1 multiIndex 的特性
  打印刚才的df的行索引结果
  多级或分层索引对象。
  index属性 names:levels的名称 levels:每个level的元组值
  3.1.2 multiIndex 的创建
  3.2 Panel
  3.2.1 panel 的创建
  class  pandas.Panel ( data=None ,  items=None ,  major_axis=None ,  minor_axis=None ) 作用:存储3维数组的Panel结构 参数:
  data  : ndarray或者dataframe
  items  : 索引或类似数组的对象,axis=0
  major_axis  : 索引或类似数组的对象,axis=1
  minor_axis  : 索引或类似数组的对象,axis=2
  3.2.2  查看 panel 数据
  注: Pandas 从版本 0.20.0 开始弃用:推荐的用于表示 3D 数据的方法是通过 DataFrame 上的 MultiIndex 方法 4 基本数据操作
  为了更好地理解这些基本操作,我们将读取一个真实的股票数据。关于文件操作,后面在介绍,这里只先用一下API
  1  索引操作
  Numpy当中我们已经讲过使用索引选取序列和切片选择,pandas也支持类似的操作,也可以直接使用列名、行名称,甚至组合使用。
  1.1  直接使用行列索引 ( 先列后行 )
  获取"2018-02-27"这天的"close"的结果
  1.2  结合 loc 或者 iloc 使用索引
  获取从"2018-02-27":"2018-02-22","open"的结果
  1.3  使用 ix 组合索引
  Warning:Starting in 0.20.0, the .ix indexer is deprecated, in favor of the more strict .iloc and .loc indexers.
  获取行第1天到第4天,["open", "close", "high", "low"]这个四个指标的结果
  2  赋值操作
  对DataFrame当中的close列进行重新赋值为1
  3  排序
  排序有两种形式,一种对于索引进行排序,一种对于内容进行排序
  使用df.sort_index给索引进行排序
  这个股票的日期索引原来是从大到小,现在重新排序,从小到大
  3.2 Series 排序 使用series.sort_values(ascending=True)进行排序
  series排序时,只有一列,不需要参数
  使用series.sort_index()进行排序
  与df一致

口碑爆棚!这部电影撑起国庆档!1天票房逼近2亿,占比近70,涉及多家A股公司2022年国庆档首日票房成绩出炉。大盘总体表现清淡,10月1日总票房收于2。65亿元。其中,由华策影视主投主控的主旋律影片万里归途票房领跑。国庆档是国内电影市场的最热门档期之一。从命苦之人,有这些特征头条创作挑战赛有道是命有长短,福有厚薄。每个人的命数,那是有长短之分的。而人自身的福气,也是有厚薄之别的。好命之人,必然长寿,福气也会特别深厚。而命苦之人,往往福气浅薄,难以幸福。一心谋求挤进上层圈子,不惜违背底线,冯亮被开除党籍江西银行股份有限公司萍乡分行原行长冯亮严重违纪违法被开除党籍日前,江西省纪委省监委驻江西银行纪检监察组和萍乡市监委联合对江西银行股份有限公司萍乡分行原行长冯亮严重违纪违法问题进行了外媒拉脱维亚新团结党在大选中获胜据路透社10月2日报道,根据初步计票结果,拉脱维亚总理卡林什领导的新团结党周六赢得大选,19的选票使他有资格组建一个新的联合政府。报道称,这意味着拉脱维亚将继续作为立陶宛和爱沙尼亚宝宝喜欢趴着睡,要不要纠正?医生给你支招在儿科门诊经常有家长会问宝宝晚上总是撅着个小屁股趴在那里睡,你把他翻过来,不一会又趴回去了,这样有没有问题啊?会不会压坏心脏或者窒息啊?温州市中西医结合医院儿科二(中医儿科)主治中如何教宝宝爬行大部分宝宝在6个月到10个月大时学会爬行。如果你的宝宝迟迟不会爬,也不用担心。有些体型较胖的宝宝比较慢学会爬,因为他们更难支撑自己的身体。有的宝宝则完全跳过爬行阶段,直接站立行走。孕期可做的运动动作怀孕期间,条件允许的情况下,医生会建议孕妈妈每天做一些运动,除了散步,还有很多运动,怀孕期间也是可以做的。下面有一些孕期基本动作,可以尝试去做一做1。肩部拉伸运动。缓解肩部压力。两丁克女子意外怀孕,家人得知后反应让她泪目,丁克一族好好看看现在,由于各种因素影响,很多年轻人要么不愿意结婚,要么不愿意生孩子。不管是哪一种现象,对我国的新生儿生育率都有着极大地影响。虽然知道这些现象对国家未来的发展极为不利,但是国家也不好产后一个星期,新妈妈不能疏忽这些事情,否则容易留下后遗症身为女性,这一生需要承受许多重要的时刻,或是嫁人时的分别,亦或是生产时的艰辛,每一个对于女性来说都是一场考验。尤其是生产,相当于女性在生命线上挣扎一番,虽说母子平安,但是孕育生产的新时代民族地区推广普及学前儿童国家通用语言教育的战略价值长期以来,由于受我国民族地区农村家庭与社区普通话语言环境普遍缺乏,以及乡村幼儿园教师普通话水平较低的师资制约,少数民族幼儿的普通话水平提升缓慢。近年来,党和国家对民族地区推广普及学净身出户离开霍家,二婚老公分她一半资产,朱玲玲无疑是人生赢家净身出户仍是霍家女主人,3个儿子做后盾,朱玲玲比梁安琪幸福得多引言。在最新一届港姐的总决赛上,朱玲玲作为前辈,带着自己的老公罗康瑞一同出席。一身网纱白裙的朱玲玲看起来比之前胖了一些
丁彦雨航如今落寞不已,后悔当初巅峰期和恩师巩晓彬闹离队!说起丁彦雨航这个名字,很多球迷都会又爱又恨,他曾经给山东球迷带来无尽的欢乐,他曾经带领山东男篮闯进总决赛,这是恩师巩晓彬也没有完成的心愿。虽然在总决赛中被如日中天的广东宏远横扫,但债市早报避险情绪回落,银行间主要利率债收益率普遍上行,转债市场指数集体收涨金融界12月27日消息金融界东方金诚联合推出债市早报栏目,为您提供最全最及时的债市信息。内容摘要12月26日,隔夜利率低位反弹,7天期利率因跨年上行幅度较大避险情绪回落,银行间主要产品力内卷背后,开发商在焦虑什么?很快,这一年已经走向尾声。站在现在回望,关于这一年的楼市,有哪些产品让你印象深刻?据克而瑞预估,今年全年商品房的销售面积和销售金额分别是13。6亿平方米和13。3万亿元,较去年的同县委大院将吴越刘涛万茜放一起后,会演不会演,一目了然正午阳光出品的扶贫剧县委大院播到现在,估计再也不会有人质疑它的好剧身份。撇开本剧朴实接地气的题材不谈,剧中一众演员的出彩演技同样值得表扬。好比剧中饰演县委书记梅晓歌的男星胡歌,虽说环球网校摘获2022年度公信力职业教育品牌殊荣12月20日,2022搜狐教育年度盛典在北京启幕,本次盛典以教育回源价值重塑为主题,邀请来自全国各地的权威专家知名校长跨界名人等教育界同仁齐聚一堂。环球网校受邀参加搜狐教育年度盛典用心用情浙江公安全力打造亲清助企金名片时至岁末年关。拿到工资回家过年,是每个在外奔波忙碌打工人的共同心愿。衢州市公安局智造新城分局城南派出所提前谋划,依托高新南企业社区亲清助企中心(警务融治中心),联合衢州智造新城人社重要通知!事关元旦春节!中共中央办公厅国务院办公厅印发关于做好2023年元旦春节期间有关工作的通知近日,中共中央办公厅国务院办公厅印发了关于做好2023年元旦春节期间有关工作的通知。全文如下2023年是全被迫道歉的向太,会成为第二个张兰吗?12月27号,向太回应直播争议,表示自己并非像网友口中所描述得那样不堪。向太何许人也?她又因为什么引发了争议?向太陈岚,作为向华强的第二任妻子担任着中国星电影公司副主席,在香港娱乐从普通骑士到管理12家门店,顺丰同城骑士努力闯出自己的小天地2020年7月1日,是70后的田文辉成为顺丰同城骑士的第一天。那时候,父母并不能理解他的这个决定。你一个大男人,去送什么外卖?你这样跑来跑去,被周围邻居看到像什么样子?此起彼伏的质俄军仗打得拉垮,国家面临诸多困难,但胜利终究属于俄罗斯2022生机大会自2022年2月24日至今,俄乌战争已经持续了300多天,已经进入第十一个月,从现在的冲突进程来看,结束仍旧遥遥无期。我们回顾整个冲突不仅要思考一个被阉割过的乌克兰下线发运!宏光MINIEV敞篷版即将交付首批车主兑现浪漫之约近日,五菱宏光MINIEV敞篷版陆续下线,创新研发精益制造加上严苛的质量检验,铸就每一台五菱敞篷的品质。第一批敞篷已经发运并即将交付首批车主,兑现与年轻人的浪漫之约。(五菱宏光MI