连日来,社会各界自发收听收看十九大盛况,学习十九大报告,用心领会报告中提出的新论断、新特点、新目标、新要求。笔者也未能免俗,花了半天时间研读《决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利》的报告。
作为一名数据程序猿,笔者深知数据分析能够为我们提供全局性的视角,它能以直观、生动的可视化方式,精准描绘出报告中的重要关注点。下面,抛砖引玉,从数据分析角度对报告的着重点做个分析。
文章中词语的频率往往反映了它在该文中的重要性,也就是说,词语在文章中出现的次数与它的重要性往往成正比。
通过对报告中词汇的频率加权统计,笔者提取了四十八个维度的关键词,涉及了国计民生的各个方面,如下图所示:
如果根据词语的重要性选择相应的大小字体,可以对四十八个维度的关键词有更加直观的认识,如下图所示:
从图中可以看出,国计民生是报告关注的重点,“人民”和“发展”两词在报告中出现的频率超过了两百次,占据了大量的篇幅。在可预见的未来,一大批惠民举措将落地实施,人民获得感将显著增强。
随后,笔者将四十八个关键词根据性质不同分成了五个类别,包括:经济建设、法制建设、思想建设、科技建设和其他。通过下方的饼状图,可以清晰地看出每个类别所占的比例(其中的百分比已经过加权计算)。可见,思想建设和经济建设受重视程度较高。
最后,笔者看到的是未经过加权处理的关键词分布情况:思想建设和经济建设的比重被进一步放大,突出了这两个方面在我们今后工作中的重要性。
以上是笔者作为一名数据程序猿对十九大报告的研读笔记。
来源:苏宁财富资讯;作者:沈春泽
安徽信息工程学院
微信号:ahpumec1935
应用研究型大学
长按二维码关注