一、选手简介
1、选手介绍
团队名称:深圳技师学院大数据实验室
- 队长介绍:
- 陈鸿生 深圳技师学院大数据应用技术专业学生,大数据应用技术工作室大数据组组长,帆软用户名:CHS
- 成员介绍:
- 成员-左海威,帆软用户名:zuohaiwei,深圳技师学院大数据应用技术专业教师,广东省技术能手。澳大利亚科廷大学高级研究员。
- 成员-梁天腾,帆软用户名:liangtianteng,深圳技师学院互联网技术学生,广东省技术能手。
- 成员-杜黎强,帆软用户名:duliqiang,深圳技师学院大数据应用技术专业教师,高级讲师。
- 成员赵艳云,帆软用户名:ZhaoYanyun,深圳技师学院大数据应用技术专业教师,高级讲师。
团人组成:师生
酬人照片:

2、参赛初衷
对数据分析有一定兴趣,想试试FineBI这种分析可视化工具。
二、作品介绍
1、业务背景
对近20年来的人口死亡情况进行统计分析,找出死亡原因,了解各地区的不同原因差异,对世界人口导致死亡的因素进行统计整理。
2、数据来源

3、分析思路

4、数据处理
(1)对不需要的字段移除,同时对英文字段进行翻译


(2)将不需要的数据进行清洗

(3)分组求和或者平均值

(4)合并表

5、可视化报告
(1)数据含义表达和图表排版布局

第一部分是指标卡与多系列折线图,指标是死亡人数、人口总数、每千人死亡/出生数。风格以蓝白为主,而折线图为凸显死亡与出生选择黑白。

第二部分是两张条形图,指标是死亡数,这两张图是为了反映2000与2019年top20死亡原因变化。


第三部分是饼图和柱状图,指标是死亡数与地区,这两张反映的是各地区死亡情况及top死亡原因。

第四部分是柱状图和云图,指标是死亡数与死亡原因,这两张反映出2019年不同收入等级国家的死亡情况与原因

第五部分是多分折线图,指标是GDP和总人口数,这张图反映出经济与人口的发展趋势
(2)通过分析得出的结论
观察以上图表我们能够得出以下结论:
1、无论是2000年还是2019年,缺血性心脏病(Ischaemic heart disease),中风(Stroke),下呼吸道感染(Lower respiratory infections),新生儿疾病 (Neonatal conditions)在死因中的占比都是名列前茅。
2、缺血性心脏病(Ischaemic heart disease)从20年前至今都占据着死因榜首,且人数在不断的上涨。
3、艾滋病(HIV/AIDS)死亡人数的急剧下降
4、下呼吸道感染(Lower respiratory infections)仍然是世界上最致命的传染病
5、下呼吸道感染(Lower respiratory infections)仍然是世界上最致命的传染病
6、非洲的首要死亡原因是新生儿(Neonatal conditions)
7、艾滋病在非洲也有非常高的死亡
8、除了非洲外,其余地区首要死亡杀手仍是缺血性心脏病(Ischaemic heart disease)与
中风(Stroke)
9、随着阿尔茨海默病和糖尿病的进入,非传染性疾病变得更加突出,而传染病正在下降
通过死亡原因的分析,能够改善生活方式,衡量每年的死亡人数有助于评估我们卫生系统的有效性,也能够反映出哪些地区的医疗资源不足,帮助决策对哪些地区进行资源的倾斜以降低该地区的死亡率。
(3)最终结果呈现的页面布局

三、参赛总结
1、FineBI工具
FineBI还是挺好用的,上手很快,一天就基本熟悉大部分功能,门槛低。数据清洗比我想象的要更加方便快捷,代码的大部分基础功能都能通过这个图形化工具完成,可视化也更加的灵活多变,多种复杂图表都能轻易实现。
不过,在我使用中还是有一些地方不太方便,比如在步骤过程中的表不能直接复制,一张表经过了6个步骤后,我想把第四个步骤状态下的表复制出来,希望完善这方面的功能。
2、参赛总结
我是第一次接触到这种工具,感觉还是挺不错挺新奇的,相比起代码这种有一定学习门槛的东西,这种图形化操作大大降低了使用门槛。
收获还是挺多的,了解到了这么一种工具,未来有机会需要做一些数据可视化的时候会考虑使用FineBI工具。 |