Python机器学习（三十三）Sklearn速查

　　Scikit-learn是一个开源Python库，它使用统一的接口实现了一系列机器学习、预处理、交叉验证和可视化算法。 一个基本例子from sklearn import neighbors, datasets, preprocessing from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score iris = datasets.load_iris() X, y = iris.data[:, :2], iris.target X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=33) scaler = preprocessing.StandardScaler().fit(X_train) X_train = scaler.transform(X_train) X_test = scaler.transform(X_test) knn = neighbors.KNeighborsClassifier(n_neighbors=5) knn.fit(X_train, y_train) y_pred = knn.predict(X_test) accuracy_score(y_test, y_pred)加载数据
　　数据类型可以是NumPy数组、SciPy稀疏矩阵，或者其他可转换为数组的类型，如panda DataFrame等。 import numpy as np X = np.random.random((10,5)) y = np.array([＂M＂,＂M＂,＂F＂,＂F＂,＂M＂,＂F＂,＂M＂,＂M＂,＂F＂,＂F＂,＂F＂]) X[X < 0.7] = 0预处理数据标准化/Standardizationfrom sklearn.preprocessing import StandardScaler scaler = StandardScaler().fit(X_train) standardized_X = scaler.transform(X_train) standardized_X_test = scaler.transform(X_test)归一化/Normalizationfrom sklearn.preprocessing import Normalizer scaler = Normalizer().fit(X_train) normalized_X = scaler.transform(X_train) normalized_X_test = scaler.transform(X_test)二值化/Binarizationfrom sklearn.preprocessing import Binarizer binarizer = Binarizer(threshold=0.0).fit(X) binary_X = binarizer.transform(X)类别特征编码from sklearn.preprocessing import LabelEncoder enc = LabelEncoder() y = enc.fit_transform(y)缺失值估算>>>from sklearn.preprocessing import Imputer >>>imp = Imputer(missing_values=0, strategy=＂mean＂, axis=0) >>>imp.fit_transform(X_train)生成多项式特征from sklearn.preprocessing import PolynomialFeatures poly = PolynomialFeatures(5) oly.fit_transform(X)训练与测试数据分组from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X,y,random_state=0)创建模型有监督学习模型线性回归from sklearn.linear_model import LinearRegression lr = LinearRegression(normalize=True)支持向量机(SVM)from sklearn.svm import SVC svc = SVC(kernel=＂linear＂)朴素贝叶斯from sklearn.naive_bayes import GaussianNB gnb = GaussianNB()KNNfrom sklearn.naive_bayes import GaussianNB gnb = GaussianNB()无监督学习模型主成分分析(PCA)from sklearn.decomposition import PCA pca = PCA(n_components=0.95)k均值/K Meansfrom sklearn.cluster import KMeans k_means = KMeans(n_clusters=3, random_state=0)模型拟合有监督学习lr.fit(X, y) knn.fit(X_train, y_train) svc.fit(X_train, y_train)无监督学习k_means.fit(X_train) pca_model = pca.fit_transform(X_train)
　　回到顶部 模型预测有监督学习y_pred = svc.predict(np.random.random((2,5))) y_pred = lr.predict(X_test) y_pred = knn.predict_proba(X_test))无监督学习y_pred = k_means.predict(X_test)评估模型性能分类指标准确度knn.score(X_test, y_test) from sklearn.metrics import accuracy_score accuracy_score(y_test, y_pred)分类报告from sklearn.metrics import classification_report print(classification_report(y_test, y_pred)))混淆矩阵from sklearn.metrics import confusion_matrix print(confusion_matrix(y_test, y_pred)))回归指标平均绝对误差from sklearn.metrics import mean_absolute_error y_true = [3, -0.5, 2]) mean_absolute_error(y_true, y_pred))均方差from sklearn.metrics import mean_squared_error mean_squared_error(y_test, y_pred))R^2Rfrom sklearn.metrics import r2_score r2_score(y_true, y_pred))聚类指标调整兰德系数from sklearn.metrics import adjusted_rand_score adjusted_rand_score(y_true, y_pred))同质性/Homogeneityfrom sklearn.metrics import homogeneity_score homogeneity_score(y_true, y_pred))调和平均指标/V-measurefrom sklearn.metrics import v_measure_score metrics.v_measure_score(y_true, y_pred))交叉验证print(cross_val_score(knn, X_train, y_train, cv=4)) print(cross_val_score(lr, X, y, cv=2))模型调优网格搜索from sklearn.grid_search import GridSearchCV  params = {＂n_neighbors＂: np.arange(1,3), ＂metric＂: [＂euclidean＂, ＂cityblock＂]}  grid = GridSearchCV(estimator=knn,param_grid=params)  grid.fit(X_train, y_train)  print(grid.best_score_)  print(grid.best_estimator_.n_neighbors)随机参数优化from sklearn.grid_search import RandomizedSearchCV  params = {＂n_neighbors＂: range(1,5), ＂weights＂: [＂uniform＂, ＂distance＂]}  rsearch = RandomizedSearchCV(estimator=knn,    param_distributions=params,    cv=4,    n_iter=8,    random_state=5)  rsearch.fit(X_train, y_train)  print(rsearch.best_score_)

特斯拉的无线网络之TPMS在整理线束架构的时候，一个很让人感兴趣的方向，就是汽车里面的无线网络按照什么样的结构来发展像TPMS无线钥匙手机钥匙和是否会出现更多的车内无线通信（无线BMS），我觉得从这个架构来快手董事长被带走调查？紧急回应假的，已报案点蓝字关注，不迷路有市场传言称，快手董事长宿华疑于四月底被有关部门带走配合调查。5月23日晚间，快手回复证券时报券商中国记者称，已正式向公安机关报案并启动法律程序，坚决维护公司和宿君逸数码珠城科技通力科技将于5月26日创业板上会君逸数码是一家专业的智慧城市综合解决方案提供商，主营业务是为智慧城市领域客户提供系统集成服务运维服务和自研产品销售等产品和服务。公司主要采用物联网云计算大数据人工智能BIM等新一代俄罗斯Tinkoff银行推出TinkoffPay即时支付服务据塔斯社5月23日报道，俄罗斯Tinkoff银行推出了TinkoffPay即时支付服务，该服务将允许客户在线上和线下商店在线支付商品和服务，无需输入卡的详细信息。图片来自塔斯社据悉苹果CEO库克在2022年时代100榜单中成为封面人物IT之家5月24日消息，苹果公司首席执行官蒂姆库克入选时代周刊2022年最具影响力的100人名单，在泰坦（Titans）类别中获得一个席位，并获得了一张封面照。时代周刊每年都会发布加码智慧办公，华为推新品缓解远程办公痛点5月23日晚，在MateBook系列新品发布会上，华为接连发布了MateBook16si9版本MateBookD16MateBook14MateBookD14等四款笔记本电脑，以及从模式创新到科技破局，云从科技如何穿越时代变革周期？说起当下资本和时代都热捧的风口，AI无论如何都算得上是一个。自1956年，人工智能的概念被提出以来，国内外众多科学家便开始了长达数十年的对极致智能化目标的追求。不过，经过多年的发展比亚迪华为合作造车中国汽车行业最强组合定价150万？北京时间5月22日，认证为比亚迪汽车品牌及公关事业部总经理的微博ID不会武功的武功李云飞，发布了关于比亚迪高端品牌的最新消息，核心信息包括了两点1独立运作的高端品牌将应用比亚迪最尖关于火烧赤壁大家好，初来头条，我是赤壁哥，一个天猫运营，也是一名电商创业者，之前是派代网的优秀电商运营作者，获得广泛电商卖家和运营的好评，后派代关闭，辗转到知乎上分享实操运营干货，现在准备进入日媒美零件占率达38。5，荣耀确定是你们国产的手机？有好事日媒爆料，日将荣耀X30拆解后，发现了劲爆的结果！荣耀X30去美化进程不进反退，美核心部件占比从9。6升至38。5，国产部件只有10，这确定是你们国产的手机吗？这让一众花粉纷Oracle11g安装后参数设置规范概述在Oracle11g安装并建库后，需要进行一些调整，使数据库能够稳定高效地运行。花了一段时间整理了以下的参数设置规范，仅供参考。一建库参数设置1进程及会话数（默认150）查看进

<<<<<<－>>>>>>

两千元以内哪些手机猛？这三款当之无愧，战斗两三年完全不虚现在手机已经成为我们生活中不可缺少的一部分，而且随着手机的不断发展，配置已经越来越给力，甚至是不用花大价钱，就可以体验到配置不错的机型。但要注意的是，现在市面上机型众多，鱼龙混杂，2021多款旗舰机诚意满满，现已开始清仓，带你正确捡漏好手机2021年已经结束了，目前搭载高通骁龙8Gen1旗舰处理器的安卓旗舰已经陆续发布，不过相信大家都有一个共同的感受，那就是新一代旗舰产品普遍升级幅度小，甚至部分功能反向升级，这让很多Linux中是谁占用了我的端口来源入门小站（版权归原作者所有，侵删）Addressalreadyinuse这个提示，想必大家遇到过，怎么能快速找到问题并解决呢？下面有几种姿势可以了解一下。在对网络连接或特定于应高端游戏手机赔本清仓，骁龙88818512GB，从5999降至3499元经历了一月上旬的旗舰大战之后，最近新机的发布也逐渐平淡了一些。等到过完年，又会有大批新机发布。最近一段时间卢伟冰不断的在预热红米K50系列，其中红米K50游戏版的各种信息曝光的差不比宋紫薇还稳！iQOO9开售10秒破亿，2小时斩获全平台冠军数码圈最有看点的产品经理应该就是宋紫薇了吧？她凭借着傲人的身材以及沉稳的演讲风格，受到了不少数码爱好者的追捧。在iQOO3发布会上，宋紫薇更是凭借它负责抖，我负责稳这句话，在圈内迅手机越用越卡，是什么在影响手机的寿命？这三点可以记牢虽然说手机越来越智能，但作为消耗品，无论什么手机都会有自己的寿命，年限到了变会出现卡顿闪退屏幕老化电池健康下降的情况。那么到底是什么在影响手机的寿命呢？以下三点大家可以记牢。充电习美国中国将摆脱依赖，成为更大的国际半导体市场据彭博社报道过去数十年，一直都严重依赖美国芯片制造技术的中国，现在不但已经成为全球电子设备工厂的集中地，还正着重发展本土半导体产业，照此发展下去，假以时日必定会成为一个更大的国际半苹果发布iOS15。2。1正式版和iOS15。3Beta2双系统更新1月13日凌晨，苹果给所有用户推送了iOS15。2。1正式版，同时也给开发者们推送了iOS15。3Beta2测试版。iOS15。2。1正式版今天苹果终于给用户们推送了iOS15。2老游戏没内味了？原来是显示器惹的祸大家都知道，机哥除了关注最新最快的科技动向，平时也是一个爱怀旧的人。这不是最近又想玩以前的街机和红白机经典游戏嘛。也不知道怎么回事，就是感觉没内味了。思来想去只能说是机哥心态变浮躁智慧水务的发展背景和未来发展趋势综述近年来，智慧水务概念被提出，也受到了的发展及应用，传统水务向智慧水务的转型如今已是必然趋势。智慧水务的诞生传统水务企业缺乏规范的水务信息统一管理平台。由于水务企业各个系统之间信息化为什么我宁愿买高配千元机，也不考虑低配旗舰机？3点原因太真实买手机的时候，大家可能会遇到过一个问题，是选择高配千元机还是低配旗舰机，比如售价在17001900的千元机，这些千元机来到这个价位基本都是顶配了，同时还有一些售价低于3000元的旗