范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

Python机器学习(二十七)Sklearn数据集基本信息

  前面章节中,我们加载了SciKit-Learn自带的数据集digits,可以通过以下语句查看数据集中包含哪些主要内容: digits.keys()
  输出 dict_keys(["data", "target", "target_names", "images", "DESCR"])data 样本数据 target 目标值 target_names 目标名称 images 图像格式(二维)的样本数据 DESCR 描述信息
  查看数据集的描述: print(digits.DESCR)
  输出 .. _digits_dataset:  Optical recognition of handwritten digits dataset --------------------------------------------------  **Data Set Characteristics:**      :Number of Instances: 5620     :Number of Attributes: 64     :Attribute Information: 8x8 image of integer pixels in the range 0..16.     :Missing Attribute Values: None     :Creator: E. Alpaydin (alpaydin "@" boun.edu.tr)     :Date: July; 1998  This is a copy of the test set of the UCI ML hand-written digits datasets https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits  The data set contains images of hand-written digits: 10 classes where each class refers to a digit.  Preprocessing programs made available by NIST were used to extract normalized bitmaps of handwritten digits from a preprinted form. From a total of 43 people, 30 contributed to the training set and different 13 to the test set. 32x32 bitmaps are pided into nonoverlapping blocks of 4x4 and the number of on pixels are counted in each block. This generates an input matrix of 8x8 where each element is an integer in the range 0..16. This reduces dimensionality and gives invariance to small distortions.  For info on NIST preprocessing routines, see M. D. Garris, J. L. Blue, G. T. Candela, D. L. Dimmick, J. Geist, P. J. Grother, S. A. Janet, and C. L. Wilson, NIST Form-Based Handprint Recognition System, NISTIR 5469, 1994.  .. topic:: References    - C. Kaynak (1995) Methods of Combining Multiple Classifiers and Their     Applications to Handwritten Digit Recognition, MSc Thesis, Institute of     Graduate Studies in Science and Engineering, Bogazici University.   - E. Alpaydin, C. Kaynak (1998) Cascading Classifiers, Kybernetika.   - Ken Tang and Ponnuthurai N. Suganthan and Xi Yao and A. Kai Qin.     Linear dimensionalityreduction using relevance weighted LDA. School of     Electrical and Electronic Engineering Nanyang Technological University.     2005.   - Claudio Gentile. A New Approximate Maximal Margin Classification     Algorithm. NIPS. 2000.
  这是一个手写数字的数据集。
  类似地,你也可以查看其它内容: .. _digits_dataset:  Optical recognition of handwritten digits dataset --------------------------------------------------  **Data Set Characteristics:**      :Number of Instances: 5620     :Number of Attributes: 64     :Attribute Information: 8x8 image of integer pixels in the range 0..16.     :Missing Attribute Values: None     :Creator: E. Alpaydin (alpaydin "@" boun.edu.tr)     :Date: July; 1998  This is a copy of the test set of the UCI ML hand-written digits datasets https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits  The data set contains images of hand-written digits: 10 classes where each class refers to a digit.  Preprocessing programs made available by NIST were used to extract normalized bitmaps of handwritten digits from a preprinted form. From a total of 43 people, 30 contributed to the training set and different 13 to the test set. 32x32 bitmaps are pided into nonoverlapping blocks of 4x4 and the number of on pixels are counted in each block. This generates an input matrix of 8x8 where each element is an integer in the range 0..16. This reduces dimensionality and gives invariance to small distortions.  For info on NIST preprocessing routines, see M. D. Garris, J. L. Blue, G. T. Candela, D. L. Dimmick, J. Geist, P. J. Grother, S. A. Janet, and C. L. Wilson, NIST Form-Based Handprint Recognition System, NISTIR 5469, 1994.  .. topic:: References    - C. Kaynak (1995) Methods of Combining Multiple Classifiers and Their     Applications to Handwritten Digit Recognition, MSc Thesis, Institute of     Graduate Studies in Science and Engineering, Bogazici University.   - E. Alpaydin, C. Kaynak (1998) Cascading Classifiers, Kybernetika.   - Ken Tang and Ponnuthurai N. Suganthan and Xi Yao and A. Kai Qin.     Linear dimensionalityreduction using relevance weighted LDA. School of     Electrical and Electronic Engineering Nanyang Technological University.     2005.   - Claudio Gentile. A New Approximate Maximal Margin Classification     Algorithm. NIPS. 2000.
  注意:如果使用read_csv()导入数据集,数据集已经分割好,导入的数据集中可能没有描述字段,但是你可以使用head()或tail()来检查数据。在这种情况下,最好仔细查看数据描述文件夹!
  接下来,我们进一步了解数据集中的数据。
  可以看到,数据集中的数据都是numpy数组的格式,可以查看这些数组的数据类型,形状,长度等信息。 import numpy as np  # 打印data数组的形状 print(digits.data.shape) # 输出:(1797, 64) # 打印data数组的类型 print(digits.data.dtype) # 输出:float64  # 打印target数组的形状 print(digits.target.shape) # 输出:(1797,) # 打印target数组的类型 print(digits.target.dtype) # 输出:int32 # 打印target数组中包含的唯一值数量 print(len(np.unique(digits.target))) # 输出:10  # 打印target_names数组的形状 print(digits.target_names.shape) # 输出:(10,) # 打印target_names数组的类型 print(digits.target_names.dtype) # 输出:int32  # 打印images数组的形状 print(digits.images.shape) # 输出:(1797, 8, 8) # 打印images数组的类型 print(digits.images.dtype) # 输出:float64
  可以看出,digits.data中,有1797个样本,每个样本有64个特征值(实际上是像素灰度值)。
  digits.target中,包含了上面样本数据对应的目标值(样本标签),同样有1797个目标值,但10个唯一值,即0-9。换句话说,所有1797个目标值都由0到9之间的数字组成,这意味着模型要识别的是从0到9的数字。
  digits.target_names包含了样本标签的名称: 0~9。
  最后,可以看到digits.images数组包含3个维度: 有1797个实例,大小为8 8像素。digits.images数据与digits.data内容应该相同,只是格式不同。可以通过以下方式验证两者内容是否相同: print(np.all(digits.images.reshape((1797, 64)) == digits.data)) # 输出:true
  把digits.images改变形状为(1797, 64),与digits.data比较,两者相等。numpy方法all()可以检测所有数组元素的值是否为True。

奇瑞大蚂蚁,浑身都是武艺,哪一招能杀敌呢?奇瑞大蚂蚁,一款SUV新能源汽车。众所周知,新能源汽车产品受到了国家的大力扶持。奇瑞大蚂蚁这款新能源汽车也受到了国家的相关补贴政策。正是由于相关政策的补贴,使得奇瑞大蚂蚁获得了非常看智能汽车奇瑞新能源艾瑞泽e如何诠释汽车美学在近几年来,中国的汽车工业呈爆发式增长,很多消费者对汽车的造型颜值也越来越挑剔。汽车的内外造型设计是一款汽车给人的第一印象,也是大众评价一款汽车的第一落脚点。当消费者想要了解一款汽当潮流汽车开始务实,奇瑞小蚂蚁制动好颜值潮为了保护我们生存的环境,近几年以来,国家一直都在提倡发展新能源汽车产品。经过几年的发展,新能源汽车产品已经成为我们经常可见的出行工具。其中,微型新能源汽车产品奇瑞小蚂蚁因时尚呆萌的开着奇瑞新能源艾瑞泽e,让你更有底气目前,国家仍然是大力提倡新能源汽车产品,毕竟节能减排是当今社会发展的一个重要的目标,而奇瑞作为国产汽车中的佼佼者,为了给消费者提供更好的驾驶体验,为我们带来了奇瑞新能源艾瑞泽e这款全面发展不偏科,奇瑞大蚂蚁才是一台真ampampquot安全车ampampquot?面对当今越来越复杂和拥堵的交通状况,中国消费者对汽车的安全性能也愈发重视了比如,很多老司机们的技术虽然娴熟,却也总为神出鬼没的鬼探头而烦恼在长途高速行车当中,疲劳驾驶又是安全最大的功能和服务结合,玩转星越L的车机系统GKUI,日常用车更轻松国内移动互联网技术飞速发展,中国品牌汽车在产品力以及影响力上也实现了跨越性发展,而两者融合则让中国汽车品牌的智能互联车载系统在面对合资品牌时,拥有了智能化本地化易用性等多方面的优势沈子瑜融资超2亿美元,亿咖通科技国际化步伐持续加速沈子瑜表示,亿咖通科技于2016年成立,成立以来一直都在汽车智能科技方面不断努力,并且,还在全球化发展方面不断努力。沈子瑜表示,公司如果不走全球化,是很难做大做强的,因此在亿咖通科熊工巧匠Boxes。py之小白也能学会的激光切割创意盒子玩法最近捣鼓车间对装备进行了全面升级。我们换上了高大上的雷宇激光切割机。图雷宇激光切割机新机器切割过程中几乎没有烟熏痕迹,并且切割速度和切割质量也是国内一流!最重要的是雷宇激光开发的L2021中秋节朋友圈创意文案怎么写?这款便签来帮你中秋节是我们中国的传统节日,它也是一个团聚的节日,有不少人对它的重视程度甚至可以和春节相媲美,所以为了纪念中秋佳节,大家会用各种各样的方式庆祝和纪念。对于很多年轻人来说,发朋友圈是爱上只需一眼Lofree洛斐小瓣鼠标终于入手了Lofree洛斐的小瓣鼠标,这款专为女生打造的高颜值鼠标,从上市就深深的吸引着我。因为这款鼠标的外观设计实在是太漂亮,让我无法拒绝,于是我又买买买了!它完全打破了常规鼠标5G赋能电影行业数智化转型升级中国移动5GFUN映厅上线启动9月28日,5G观影未来同屏为主题的中国移动5GFUN映厅发布暨首发影片上线仪式在京举行,中国移动市场部总经理张冬副总经理首建国中国移动咪咕公司总经理刘昕欢喜传媒CEO项绍琨著名导
Centos7安装Nginx安装所需环境一。gcc安装安装nginx需要先将官网下载的源码进行编译,编译依赖gcc环境,如果没有gcc环境,则需要安装yuminstallgccc二。PCREpcredevel文件公示!宝马中国全资收购华晨中华工厂10月20日,国家市场监管总局反垄断局网站公示宝马(中国)投资有限公司收购华晨汽车制造有限公司股权案。文件显示,华晨汽车集团控股有限公司(华晨集团)目前持有华晨汽车制造有限公司(华家园系统新篇章?继诛仙后的又一新作继诛仙之后,仙侠手游的炸街之作诛仙手游,延续端游高质量场景人设玩法等设计,让手游玩家能在重温IP情怀之余,体验到制作精良的3D仙侠手游。从大话西游到仙剑奇侠传,不难看出,仙侠IP的又一大作延迟EA官宣战地2042跳票战地2042应该算是今年下半年最受玩家期待的游戏之一,此前该作官方确定的发售时间是10月23日,但是在今天EA官方宣布了该作将会跳票到11月19日正式发售,想必很多玩家们都感到无奈不念西风独自凉,光影潋滟夜未央君看,光影潋滟夜未央浮华似影,沧海如烟,蓦然惊梦,往事难重省。灯火明灭,不晓西风情深,君看,光影潋滟夜未央文冰馨雪馥深冬,夜风很凉,却让人分外清醒。灯火照耀之处,似明非明。借着微光挑战和希望并存,自动驾驶离我们究竟还有多远?近日,小米集团发布的Q2财务报告显示,小米已与自动驾驶技术公司DeepMotion的相关方达成股份购买协议,将以7737万美元(约人民币5亿元)整体收购DeepMotion。Dee暗黑2重制版NS版最新截图公开,画面质量不错近日暗黑官方公布了暗黑破坏神2重制版主机版本已经开放预载,该作将会在本月的23日晚上11点正式开放游戏,之后PC版游戏的预载也会开放,所以PC玩家不用着急。暗黑破坏神2重制版将会在以色列军队惊现隐身衣,开启魔法世界的真人秀7月20日21时,蓝色起源创始人贝索斯率先完成太空旅行,让科幻变成了现实。然而让科幻成真的不止是太空旅行,拥有隐形功能的TVC更让科技圈为之震颤。TVC,全称ThermoVisua如何正确撸拼多多羊毛拼多多可以撸的东西很多今天给大家带来一个简单红包助力,这个相信很多人都知道,不过这东西是有方法的,你如果没有方法可能会被反撸。接下来我就把我知道的方法告诉给大家快速获得拼多多100年轻人口中的的b站正在脱离二次元大家好,我是在头条快一个月赚了不到5毛钱的人,我们今天来聊一下哔哩哔哩(简称b站)百度百科有点地方错了,09年那会还不叫b站叫mikufans而在10年才改名成bilibili。在让未成年人过早接触网络好吗?前几天回了一个话题是关于未成年人沉迷网络游戏,很多人都表示网络游戏对于未成年来说影响最大,不知道怎么办才好。那晚接触网络会改变现状吗?我在初中的时候,学校不让带手机,同学们嫌无聊带