范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

手把手教你用Pyecharts库对淘宝数据进行可视化展示

  来源:Python爬虫与数据挖掘
  作者:Python进阶者一、可视化
  可视化部分,我们采用Pyecharts库来进行完成,这个库作图十分的炫酷,而且可以交互,十分带感,强烈推荐。关于这部分,小编以生成配料图表和生成保质期可视化图表为例来进行展开。
  1、生成配料饼图
  针对配料数据,我们使用一个饼图去进行展示,这样显得更加高大上一些,直接上代码。# 生成配料图表 def get_ingredients_html(df):     # 词表分词     names = df.配料表.apply(jieba.lcut).explode()     df1 = names[names.apply(len)>1].value_counts()     # 写入分词后的结果     with pd.ExcelWriter("淘宝商品配料数据.xlsx") as writer:         df1.to_excel(writer, sheet_name="配料")     fpath = r"C:UserspdcfiDesktop淘宝数据分析淘宝商品配料数据.xlsx"     # 读取数据 提取列     df1 = pd.read_excel(fpath, header=None, skiprows=1, sheet_name="配料", names=["sx", "sl"])     a = df1["sx"].to_list()[:10]     b = df1["sl"].to_list()[:10]       from pyecharts.charts import Pie     from pyecharts import options as opts     # 绘制可视化图表     pie = (         Pie().add("", [list(z) for z in zip(a, b)],                  radius=["20%", "60%"],  # 半径长度                  rosetype="radius"  # 扇区圆心角展现数据的百分比,半径展现数据的大小                  )             .set_global_opts(title_opts=opts.TitleOpts(title="淘宝商品数据配料统计", subtitle="8.19"))             .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))  # 数字项名称和百分比       )     pie.render("淘宝商品数据配料统计.html")
  在Pycharm里边运行代码之后,我们将会得到一个淘宝商品数据配料统计.html文件,双击打开该HTML文件,在浏览器里边可以看到效果图,如下图所示。
  是不是感觉一下子就高大上了呢?而且动动鼠标,你还可以进行交互,是动态图来着,十分好玩。
  2、生成保质期可视化饼图
  针对保质期数据,我们也先使用一个饼图去进行展示,直接上代码,其实你会发现和上面那个配料图表大同小异。"""生成保质期可视化图表""" def get_date_html(df):     # 词表分词     names = df.保质期.apply(jieba.lcut).explode()     df1 = names[names.apply(len) > 1].value_counts()     # 写入分词后的结果     with pd.ExcelWriter("淘宝商品保质期数据.xlsx") as writer:         df1.to_excel(writer, sheet_name="保质期")     fpath = r"C:UserspdcfiDesktop淘宝数据分析淘宝商品保质期数据.xlsx"     # 读取数据 提取列     df1 = pd.read_excel(fpath, header=None, skiprows=1, names=["bzq", "rq"])     a = df1["bzq"].to_list()[:10]     b = df1["rq"].to_list()[:10]     from pyecharts.charts import Pie     from pyecharts import options as opts     # 绘制可视化图表     pie = (         Pie()             .add("", [list(z) for z in zip(a, b)],                  radius=["20%", "60%"],  # 半径长度                  rosetype="radius"  # 扇区圆心角展现数据的百分比,半径展现数据的大小                  )             .set_global_opts(title_opts=opts.TitleOpts(title="淘宝商品保质期可视化图表", subtitle="8.19"))             .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))  # 数字项名称和百分比       )     pie.render("淘宝商品保质期统计.html")
  在Pycharm里边运行代码之后,我们将会得到一个淘宝商品保质期统计.html文件,双击打开该HTML文件,在浏览器里边可以看到效果图,如下图所示。
  相信有小伙伴肯定感觉哪里不对,一个保质期的可视化,做成这种饼图似乎太丑了吧?嗯,的确是丑爆了,所以程序大佬把保质期这个图转为了柱状图,这样看上去就高大上很多了。
  3、生成保质期可视化柱状图
  其实数据都是一样的,只不过呈现方式不同,直接上代码。"""生成保质期可视化图表""" def get_date_html(df):     # 词表分词     names = df.保质期.apply(jieba.lcut).explode()     df1 = names[names.apply(len) > 1].value_counts()     # 写入分词后的结果     with pd.ExcelWriter("淘宝数据.xlsx") as writer:         df1.to_excel(writer, sheet_name="保质期")     fpath = r"C:UsersdellDesktop崔佬数据分析综合实战淘宝数据.xlsx"     # 读取数据 提取列     df1 = pd.read_excel(fpath, header=None, skiprows=1, names=["bzq", "rq"])     a = df1["bzq"].to_list()[:50]     b = df1["rq"].to_list()[:50]       bar = (         Bar(init_opts=opts.InitOpts(theme=ThemeType.CHALK))             .add_xaxis(a)             .add_yaxis("保质期(天数)",b)             .set_global_opts(                 title_opts=opts.TitleOpts(title="Bar-DataZoom(slider-保质期)"),             datazoom_opts=opts.DataZoomOpts(),         )       )     return bar
  这么处理之后,我们就会得到一个柱状图了,如下图所示。
  这把看上去,是不是觉得清晰很多了呢?
  不过呢,程序大佬还觉得不够,想把这两张图放到一起,这应该怎么办呢?
  4、合并饼图和柱状图到一个HTML文件
  其实这个也并不难,只需要将生成两个图的函数放到一个布局类里边就可以完成了,直接上代码。def page_draggable_layout(df):     page = Page(layout=Page.DraggablePageLayout)     page.add(         get_ingredients_html(df),         get_date_html(df)     )     page.render("page_draggable_layout.html")
  如果你想在一个HTML文件里边加入更多的图,只需要继续在add()函数里面进行添加生成可视化图的函数即可。话不多说,直接上效果图。
  从上图我们可以看到配料饼图和保质期柱状图都同时在同一个HTML文件出现了,而且也是可以进行点击交互的噢!我们还可以收到拖拽,让图表移动,如下图所示,分为左右图进行展示。
  你以为到这里就结束了?其实并没有,程序大佬还想玩点更加高大上的,他想把table表一并显示出来,这样显得更加饱满一些。那么table表又如何来进行显示呢?
  5、table表加持
  其实在这里,程序大佬卡了一下,他在群里问,基于他目前的数据,像下图这样的df数据如何进行展示出来。
  而且,他自己在不断的尝试中,始终报错,一时间丈二和尚摸不着头脑,不知如何是好。
  不过此时小小明大佬,又递来了橄榄枝,人狠话不多,直接丢了两行代码,让人拍手叫绝。
  然后程序大佬,拿到Pycharm中一跑,啪,成了,真是拍案叫绝,小小明yyds!那么呈现的效果图是下面这样的。
  这样看上去还稍微不太好看,拖拽下,调整下格式看看,如下图所示。
  但是这样一看,确实高大上了一些,不过还是达不到程序大佬心里的预期,于是乎他继续折腾。
  6、调整图像背景色
  现在呢,程序大佬又想要加点背景色,这样显得高大上一些,代码如下。# 绘制可视化图表 pie = (     Pie(init_opts=opts.InitOpts(theme=ThemeType.CHALK))         .add("", [list(z) for z in zip(a, b)],              radius=["20%", "60%"],  # 半径长度              rosetype="radius"  # 扇区圆心角展现数据的百分比,半径展现数据的大小              )         .set_global_opts(title_opts=opts.TitleOpts(title="配料统计", subtitle="8.19"))         .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))  # 数字项名称和百分比   ) return pie
  其实核心的那句代码下面这个,引入了一个主题:init_opts=opts.InitOpts(theme=ThemeType.CHALK)
  得到的效果图如上图所示了。
  7、添加漏斗图
  这里是以数据里边的"食品添加"列来做实例的,代码如下所示。def get_sptj_data(df):     # 词表分词     names = df.食品添加剂.apply(jieba.lcut).explode()     df1 = names[names.apply(len) > 1].value_counts()     # 写入分词后的结果     with pd.ExcelWriter("淘宝数据.xlsx") as writer:         df1.to_excel(writer, sheet_name="食品添加剂")     fpath = r"C:UsersdellDesktop崔佬数据分析综合实战淘宝数据.xlsx"     # 读取数据 提取列     df1 = pd.read_excel(fpath, header=None, skiprows=1, names=["sptj", "sj"])     a = df1["sptj"].to_list()[:10]     b = df1["sj"].to_list()[:10]     c = (         Funnel(init_opts=opts.InitOpts(theme=ThemeType.CHALK))             .add(             "商品",             [list(z) for z in zip(a, b)],             label_opts=opts.LabelOpts(position="inside"),         )             .set_global_opts(title_opts=opts.TitleOpts(title="Funnel-Label(food_add)"))     )     return c
  得到的效果图如下图所示。
  写到这里,基本上快接近尾声了,不过程序大佬为了感谢小小明大佬,后来又补充了一个极化装X图来赞扬小小明。
  8、极化图
  直接上代码,程序大佬取的这个zb函数,就是装X的意思,取的太没有水平了。def zb_data():     data = [(i, random.randint(1, 100)) for i in range(10)]     c = (         Polar()         .add(             "",             data,             type_="effectScatter",             effect_opts=opts.EffectOpts(scale=10, period=5),             label_opts=opts.LabelOpts(is_show=False),         )         .set_global_opts(title_opts=opts.TitleOpts(title="Polar-没啥用,用来装逼,小小明yyds"))       )     return c
  看上去确实很高大上呢。二、总结
  大家好,我是Python进阶者。本文基于一份杂乱的淘宝原始数据,利用正则表达式re库和Pandas数据处理对数据进行清洗,然后通过stop_word停用词对得到的文本进行分词处理,得到较为"干净"的数据,之后利用传统方法和Pandas优化处理两种方式对数据进行词频统计,针对得到的数据,利用Pyecharts库,进行多重可视化处理,包括但不限于饼图、柱状图、Table表、漏斗图、极化图等,通过一系列的改进和优化,一步步达到想要的效果,可以说是干货满满,实操性强,亲测有效。

直击开发者需求痛点,思必驰DUI对话定制平台加速产品升级AI人工智能席卷各行各业,物联网已进入黄金期,Gartnert发布的数据显示,2020年全球联网设备数量将达260亿台,物联网市场规模将达1。9万亿美元,这无疑是一个巨大的市场,这其中AI语音高手过招,思必驰DUI开放平台亮相云栖大会2017云栖大会于10月11日在杭州云栖小镇拉开了帷幕。人工智能是此次大会的主角之一,大会以飞天智能为主题共探未来科技。这是一场互联网人工智能从业者爱好者的盛会,行业的最新动向企业DUI平台开放力的洞见AI语音的生长需要互相给养DUI平台开放力的洞见AI语音的生长需要互相给养目前国内提供语音交互技能的公司大体上有两种不同的思路。一种是基于AI语音是拼技术的偏见,提供封闭的包揽式解决方案另外一种就是专业化分思必驰DUI开放平台直击痛点让AI语音价值无限扩大人工智能的爆发使各类智能硬件产品层出不穷,AI技术的应用推动着人机交互的变革,智能语音使操控变得更简单,逐渐淘汰了按键遥控器APP等终端,成为智能硬件的标配交互方式。但AI语音技术让你没有理由拒绝它,长城皮卡秋冬服务节都有啥?随着冷空气的来袭,全国各地迅速降温,而换季也让不少人得了感冒。事实上,和人一样,进入到温度骤降的秋冬季节的汽车,也很容易怕冷。所以为了不让它们得上感冒,我们通常会提前进行保养和检查魏牌拿铁闯入混动汽车市场,现有格局或许会发生剧烈转变?在节能环保这个大环境下,混动车型正逐渐成为新型燃油车市场的主流产品,市场上的插电混合动力车型层出不穷,而用车更便捷更符合传统燃油车使用习惯的非插电混合动力车型也在逐步下探。而魏牌拿2016高交会探访思必驰语音世界图说思必驰副总裁雷雄国在高交会现场演示内置思必驰完整车载语音方案的车萝卜二代HUD抬头显示仪。摄影钱玉娟(钱玉娟编辑)一年一度的中国国际高新技术成果交易会(简称高交会)于11月16采访完Jessica,我们重新认识了降临里语言学家的世界机器之心原创撰文微胖采访李九喻编辑刘燕在电影叙事中,语言成为一枚强大的武器,但是,JessicaCoon认为语言仅仅是语言,让语言的回归语言。JessicaCoon,加拿大麦吉尔大思必驰CEO高始兴,打造以AI技术为核心的开放生态2017年9月7日,大音希声,AIISDUI,2017思必驰DUI开放平台发布会在北京隆重举行。发布会现场干货不断,一起来回顾一下图1思必驰DUI开放平台发布会现场2017年9月7思必驰完成5亿元D轮融资,继续深化AI生态布局2018年6月,思必驰完成D轮5亿元融资,由元禾控股中民投资本领投,深创投富士康联发科跟投。十年技术不断创新的积累五年面向智能终端赋能的产业化拓展,思必驰已成长为国内语音AI新生代智能黑板综合评价学生随着中高考招生制度的改革,综合素质评价被纳入招生考核标准。智能黑板用信息技术对学生进行综合素质评价,欧帝成长脚印助力学校推进教育信息化建设。传统课堂上,老师单向授课,学生被动听课,
未来物联网时代,大规模市场。有人预测,未来物联网的市场容量将是现在互联网的十倍以上。物联网是超越智能化与超越互联网的虚拟世界与实体世界深度融合的全新体系,是第三次信息产业浪潮第四次工业革命的核心支撑,物联网将小米何以实现快,更稳?30万小时稳定测试,连苏炳添都惊呆了今天对于各位米粉来说简直是过大年了,小米12刚发布不久,苏神苏炳添虽然没有出席发布会,但是今天空降小米科技园,与雷总来了一场直播。苏炳添来到园区内,见到雷总的瞬间感觉就变得青涩了许印度富士康数百人食物中毒,爆发大规模抗议文观察者网丁悦由于大规模食物中毒事件,印度金奈一家为苹果代工的富士康工厂陷入了麻烦。17日,1000多名工人爆发了抗议,迫使工厂关门整改,至今仍未恢复运营。路透社报道截图这家富士康科大讯飞拟20亿投建研发生产基地规模高速扩张员工十年增长超8倍长江商报消息长江商报记者汪静国内人工智能领域龙头科大讯飞(002230。SZ)持续扩张规模。12月27日,科大讯飞发布公告,公司与合肥高新技术产业开发区经济贸易局在合肥签署投资合作看看西方世界的先知预测2022年将会发生些什么?据荷兰电讯报(DeTelegraaf)的报道,随着2021年的即将结束,西方许多人都想知道2022年将会发生什么。在现已持续近两年的疫情大流行期间,人们经常听到我们在雾中航行这样的源码是什么意思?网站源码有哪些作用?云源码网解读源码是什么意思?在互联网上我们看到的任何的东西本质上来说都是代码,因为互联网本来就是由数据代码构成的。而一般来说学习一门计算机语言的周期可能需要23年的时间,很显然,我们不会为了建ATM机迎来大变革!取款方式变了,多家银行已实行,大家要留心自从我国的互联网和科技高速发展之后,移动支付也逐渐成为主流的支付方式。根据中国互联网中心发布的,最新一期中国互联网发展状况统计报告显示,截至2021年的6月份,我国网络支付用户规模手机功能越来越强大了,以后家庭里还需要购置个人电脑和电视吗?手机主要还是通讯和娱乐工具,电视是家电,电脑代表的是生产力,目前还看不到手机在这两方面代替电视和电脑的可能。当然,电脑应用肯定不是只在家里放歌看电影。吃完饭全家人一起看电视好,还是微信讨人厌的5个功能,哪个让你觉得最无语?微信的实用性不言而喻,可作为一个我们日常不可或缺的应用,它有部分功能也确实让人无力吐槽,其中以下几个讨伐声最多,看看哪个让你觉得最无语?讨人厌的功能一单向删除微信设计删除好友只是单地球距离冥王星有多远?目前人类宇宙飞船飞到冥王星需要多长时间?地球距离冥王星有多远?人类发射的探测器抵达冥王星需要多久?冥王星是一颗矮行星,已经不在太阳系行星之列了,它处在太阳系行星的外围,在柯伊伯带中。至于冥王星距离地球有多远,这个不是一个宇航员去太空回来后身体通常会发生什么变化?这位美国宇航员在国际空间站上度过了11个月,成功减龄13毫秒。在此次访谈中,他探讨了太空行走身体恢复以及将同卵双胞胎之一送入太空的科学价值。美国宇航员斯科特凯利(ScottKell