Apache Superset 1.2.0教程 (三)
通过之前章节的学习,我们已经成功地安装了superset,并且连接mysql数据库,可视化了王者英雄的数据。使用的是最简单Table类型的图表,但是superset还支持非常多的图表类型。
本文我们将对各种图表类型进行逐一的演示,文章较长,建议收藏后阅读。
图表分类
Superset提供了大量的图表来帮助我们进行数据可视化。
对于图表的类型可以分为以下几类:
时间序列图表:这类图表显示随时间变化的数据,最适合用于发现变化趋势。时间序列图的示例包括折线图、时间序列条形图等等。组合图:这些类型的图表显示了数据在特定领域的分布情况,例如“最多…”、“最少…”和“前 10 名”类型的图表. 组合图的示例包括条形图、饼图和树状图。分布图:这类图表显示数据如何分布在一个或多个字段中,最适合用于具有多维属性的数据。分布图的示例包括直方图、箱线图和水平图。关系图:这类图表显示两个或多个变量之间的关系,通常用于传达共性、非共性或因果关系类型。关系图的示例包括数据透视表、热图和气泡图。地理空间图表:这类图表显示基于地理的数据。superset还提供了各种基于deck.gl 的地理空间图表。
只有选择了正确的图表,才能准确的传达出你想表达的意思。那么怎么确定图表类型呢?
首先要考虑的就是想要实现的目标,一张好的图表必须是能够清楚表达问题的答案。以下是一些选表准则,供参考:
当您想要显示数据如何随时间变化(例如,上一季度产品销售的变化)时,请使用时间序列图表。当您的数据侧重于单个因素(例如,毕业生数量、最受欢迎的城市等)时,请使用组合图。当您的数据被分配到不同的类别时使用分布图(例如,某个区间段的人数分布等)。当您在两个或多个值之间进行比较时使用关系图(例如,与温度变化相比,海平面上升)。当您的数据依赖于地理(例如,城市的人口密度、空中交通路线等)时,请使用地理空间图表。数据集准备
针对这些图表,准备了不同的数据集进行可视化操作。分别是:
时间序列图表 : “大乔” 关键词,近一个月搜索指数变化数据。
组合图:王者各英雄最大生命值的排名情况。
分布图:王者各英雄最大生命值,每个生命值区间段的英雄数量统计。
关系图:看一下最大物防与最大生命的关系。
地理空间图表:这里简单对美国和印度新冠确诊人数做一个可视化。
下面来具体讲解不同类型图表的用法:
一、时间序列图表
首先准备好数据。数据来源于大乔的搜索指数数据。
首先进入Datasets页面,将这张表加入。
表成功加入以后,进入Charts页面,新建一个图表。
选择图表类型为 Time-series Bar Chart
新建图表
进入图表设置页,在这里可以对图表进行一系列的设置,首先修改名称。
默认表的统计指标是COUNT,这里改成SUM。
修改时间范围,默认是LAST WEEK。
还可以做一些自定义的设置,颜色,坐标轴等等。
保存,这样,时间序列图表就成功完成了。
二、组合图表
此数据源使用王者英雄数据,之前已经关联。下面我们用此数据制作一个饼图。
首先还是新建一个图表,选择类型为 Pie Chart
选择好数据源
进行基本的设置,这里按英雄分组,统计维度为最大生命
做一些自定义的设置
点击RUN查询,这样饼图就做好了。
三、分布图表
依然使用王者英雄数据,做一个直方图
首先新建图表,选择图表类型为 Histogram
进行一些自定义设置
选择统计列为 最大生命,调整好间隔。
可以清楚的看到最大生命值的分布情况。
点击RUN查询,这样直方图就做好了,保存。
四、关系图表
依然使用已有数据
选择Heatmap类型图表
随后做一些基本的设置,X轴选择最大物防
Y轴选择最大生命。
点击RUN查询,这样热力图就做好了,保存。
五、地理空间图表
准备好数据,选择图表类型为 World Map
进行一些设置,国家代码,统计列等等。
点击RUN进行查询,保存。
通过本文,我们已经对superset中的各种图表有了一个基本的了解。superset还有哪些功能呢?下一章继续~