站内公告:
2023-07-26 18:03:15
摘要
2019年12月底,一种人类历史上从未出现过的新型病毒在湖北省武汉市逐渐显露獠牙,它就是新型冠状病毒,为有效控制疫情的进一步传播,政府采取了有效措施,疫情如今得到控制。本文主要研究湖北省各市相关数据以及疫情数据之间的关系并对其进行可视化分析。
首先,我们采集湖北省各城市相关数据,对其进行处理,之后采用Tableau软件,展示了湖北省各城市人均生产总值、人数、人口密度、医疗卫生机构密度、累计确诊人数信息,进而分析数据。
在第二部分,我们选取武汉市作为代表对象,运用Tableau绘制了其疫情期间累计确诊人数、现存确诊人数、死亡人数、治愈人数的曲线图,根据图形分析其变化趋势。
第三部分中,我们运用Tableau对湖北省各市与武汉交通流数据、与武汉距离等数据进行可视化分析,直观展现了交通流量对疫情的严重影响。
在第四部分,我们从人口、医疗两个方面入手,采用单因素方差分析方法,运用SPSS分析人口数据以及医疗数据对疫情数据的影响情况。最后根据我们的结果提出了切实可行的建议。
1.绪论
近日,武汉新型冠状病毒肺炎的疫情举世瞩目,社交媒体上的信息轰炸牵动着全国人民的心。从2019年12月30日武汉卫健委“不明原因肺炎”紧急通告肇起,这场新冠肺炎大疫情已蔓延至全国,乃至全球不少国家。没有一座城市能独善其身,没有一个人能置身事外,一场公共卫生领域前所未有的总动员也已细致深入到了中国每一个行政毛细血管。为有效控制疫情的进一步传播,各地政府采取了一系列延迟复工和管控措施。这些措施虽然对疫情的控制起到了立竿见影的效果,但这些管控措施无论是对企业经营还是居民生活都带来了巨大的负面影响。近期随着湖北省区逐步复工,疫情及管控措施对经济的负面影响开始逐步缓和,经济活动和居民生活有望逐步恢复正常。但对处在疫情中心的湖北省而言,疫情对湖北省的经济发展和人民生活的影响仍十分重大。
在疫情的发展期间,通过对湖北省各市相关数据的展示以及分析其与疫情的关系并可视化,直观地表现与疫情相关的社会因素以及影响程度,方便人们了解疫情数据以及社会各因素与疫情的关系。本文对湖北省各市与武汉交通流数据、与武汉距离、人口数据、医疗数据等多源数据进行可视化,展示湖北省各市的社会情况;分析多源数据与疫情的关系,从交通、人口、医疗三个方面入手,展示它们与疫情的相关程度,从而让人们关注与疫情相关的社会情况。
2.数据收集
1.湖北省统计年鉴:
http://tjj.hubei.gov.cn/tjsj/sjkscx/tjnj/qstjnj/
?2.交通流与距离数据:
3.全国新型冠状肺炎疫情数据:
https://news.qq.com/zt2020/page/feiyan.htm#/global
4.湖北省市级shp
1.各市疫情数据部分
通过Excel的Power Query爬取疫情网站中的湖北省各城市的疫情数据,存入Excel。
2.多源相关数据部分
获取湖北省各市的地图空间文件;查询和存储湖北省各市与武汉的交通流量、距离;搜索湖北省各市的人口密度等人口数据以及医疗机构密度等医疗数据;通过网络上给出的数据源对数据进行收集,根据实际情况对数据进行去重、补缺、清洗,规律存储于Excel文件中。
3.问题分析:
首先通过使用Tableau做出湖北省各城市总体数据统计图,该总体统计图以递减的方式展示了湖北各市的相关数据,包括人均生产总值、各市人数、人口密度、医疗卫生机构密度、各市确诊人数等方面信息。
在人均生产总值、人口密度、医疗卫生机构密度、平均医疗技术人员数和确诊人数信息中,条形图的长度代表数量的多少;在人口密度信息中,用颜色深浅程度代表数值高低;床位数的部分,颜色和所占面积表示数量的多少。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 图3-1-1 湖北省各城市数据统计图
从图3-1-1,我们可以看出,武汉市在经济、人口、医疗方面稳居湖北省第一的位置,但其新型冠状肺炎也是全省确诊人数最多的城市,相比武汉市,其它城市确诊人数较少,其经济、人口、医疗方面的数据都较低。
接下来,我们选取湖北省在医疗、人口、经济等方面都较为发达的武汉市、荆州市进行具体分析。湖北两市部分单位化地展示了湖北省两个城市的生产总值、人口密度、医疗卫生机构密度、床位数量信息,提供了两市经济、人口和卫生相关的具体数据。图片下方的折线图来自2020年1月21日至2020年4月10日湖北各市疫情趋势历史信息;折线图横坐标表示时间,纵坐标表示统计人数,不同颜色的曲线代表了不同类型的数据,包括各市累计确诊人数、现存确诊人数、治愈人数和死亡人数。
武汉市:
基础数据
人均地区生产总值(元) 123831 |
常住人口(万人) 1089.29 |
人口密度(人/平方公里) ?1271 |
医疗卫生机构密度(个/平方公里) ?0.51 |
平均床位数(张/千人) ?8.41 |
平均医疗技术人员数(人/千人) ?9.41 |
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?图3-2-1?武汉疫情曲线图
由图3-2-1可以看出,疫情数据从1月中旬开始,新增确诊人数呈缓慢增长趋势,于2月15日前到达一个峰值,当日武汉市新增大概15000例病例,暴增原因为2月12日的统计把临床诊断病例增加为确诊病例,临床诊断病例为疑似病例具有肺炎影像学特征者。疫情高发期是在1月26日-2月25日之间。这个时间段恰好是在春节前后,而根据病毒的潜伏周期来计算,说明疫情高发的原因是因为在春运高峰期间大量的人员流动与接触导致病毒的迅速与广泛传播。之后呈下降的趋势,然后恢复到平稳。死亡人数趋于平稳缓慢增长,于2月25日死亡人数增长率到达最高值。治愈人数曲线呈上增长趋势,于3月初斜率最高即治愈率达最高值,累计确诊人数曲线受新增确诊人数曲线的影响,于2月15日前累计确诊率达到峰值,于3月初趋于平缓上升趋势,由于新增病例从3月6日左右人数趋于0,所以累计病例从3月6日左右开始达到平稳。
荆州市:
人均地区生产总值(元) 33902 |
常住人口(万人) 564.17 |
人口密度(人/平方公里) ?400.12 |
医疗卫生机构密度(个/平方公里) ?0.23 |
平均床位数(个/千人) ?5.38 |
平均医疗技术人员数(个/千人) ?5.74 |
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 图3-2-2?荆州疫情曲线图
由图3-2-2可以看出,疫情数据从1月中下旬开始记录,新增确诊人数呈缓慢增长趋势,有两个峰值,在2月初到达一个峰值,原因为荆州市样本检测能力翻倍,从之前每天检测100份左右疑似病例标本,提高到了200份标本左右,所以有更多疑似病例被确诊,这为下一步防控及救治提供了准确依据。第二个峰值在2月中旬,暴增原因为2月12日的统计把临床诊断病例增加为确诊病例,之后呈下降的趋势趋向于0。死亡人数趋于平稳缓慢增长。治愈人数曲线呈上增长趋势,于2月下旬斜率最高即治愈率达最高值,累计确诊人数曲线根据新增确诊人数曲线的影响,于2月17日前累计确诊率达到峰值并趋于平缓上升趋势,由于新增病例从2月17日左右人数趋于0,所以累计病例从2月17日左右开始达到平稳。
因为武汉市是最早发现疫情的,湖北省的其他城市随之确诊疫情,我们猜测,病毒的传播可能和武汉市与其他城市的交通流量以及距离有关,于是,我们采集了武汉市与其他城市的交通流量以及距离数据,利用Tableau绘制流量与各市感染人数散点图、距离与各市感染人数的关系散点图。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?图3-3-1与武汉地理距离与湖北省各市后期确诊人数关系图
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?图3-3-2 疫情初期流量与湖北省各市后期确诊人数关系图
从图3-3-1以及3-3-2中,可以很明显的看出,与武汉市距离的远近与感染人数并没有明显的规律,而流量的大小与感染人数呈现出了一个接近线性的关系,分析该情况是因为新冠病毒通过飞沫传染,与距离并无直接关系,而与人群最可能移动的路径长度有关系,这里我们用流量来表示人口流动的等效距离。
为了更加清晰的展示,我们利用Tableau对疫情早期武汉市到湖北省(除武汉)各市的人口流动情况进行可视化,地图深浅表示三月中旬各市(疫情中期)的感染人数,直线颜色深浅表示从武汉到各城市的人口流量。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?图3-3-3 湖北省人口流动图
从上面的人口流动图,我们可以观察到,武汉是湖北省疫情最严重的城市,从武汉到黄冈、孝感、荆州市人口流量较大,其疫情也明显较为严重,从武汉到潜江、天门市人口流量明显比其他城市小,其确诊人数也比其他城市少。
在这一部分,我们进一步研究了人口数据、医疗数据与疫情数据的关系,我们选取湖北各城市的人口密度、医疗卫生机构密度分别代表人口与医疗方面,运用SPSS对其进行单因素方差分析,得到各项数据对疫情的影响程度情况。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?表3-4-1 人口密度对确诊人数影响的单因素方差分析结果
?
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?表3-4-2医疗卫生机构密度对确诊人数影响的单因素方差分析结果
表3-4-1是人口密度对累计确诊人数影响的单因素方差分析结果。可以看到,观测变量累计确诊人数的离差平方总和为1.262E+11,如果仅考虑人口密度单个因素的影响,则确诊人数总变差中,不同城市的人口密度可解释的变差为9.538E+10,抽样误差引起的变差为3.084E+10。组间方差和组内方差分别为5961470752和23702538.45,两者相除所得的F统计量的观测值为251.512。本检验的原假设为人口密度没有对累计确诊人数的平均值产生显著影响,如果设显著性水平α=0.05,我们可以看出,对应的概率 P-值小于α,因此应拒绝原假设,即人口密度对累计确诊人数产生了显著影响。
从表3-4-2可以看出:观测变量累计确诊人数的离差平方总和为1.262E+11,如果仅考虑医疗卫生机构密度单个因素的影响,则确诊人数总变差中,不同城市的医疗卫生机构密度可解释的变差为9.521E+10,抽样误差引起的变差为3.101E+10。组间方差和组内方差分别为6800660372和23799915.08,两者相除所得的F统计量的观测值为285.743。本检验的原假设为不同城市的医疗卫生机构密度没有对累计确诊人数的平均值产生显著影响,如果设显著性水平α=0.05,我们可以看出,对应的概率 P-值小于α,因此应拒绝原假设,即不同城市的医疗卫生机构密度对累计确诊人数的平均值产生了显著影响。
对比表1和表2容易发现,如果从单因素的角度考虑,医疗卫生机构密度对累计确诊人数的影响比人口密度大。
4.疫情防控建议
(1)呼吁广大市民群众,在出行时重视武汉相关的交通流量、所在地人口密度、人口接触距离等因素,防患于未然。
(2)在控制疫情情况时,注重交通流量的管控,一定的交通封闭是有必要的。
(3)加强医疗卫生方面的防护和建设,未雨绸缪,以达到促进各地疫情防治、社会长治久安的目的
?