科学的本质在于可证伪(验证),如果没有数据支撑,一篇严谨的科学论文就是无根之水。在信息爆炸时代,数据是丰富的,如同一个金矿等待有心者去挖掘。如果你想称为一个合格的研究者,实现从追赶者向引领者的转变,你就必须加强数据收集能力以及数据分析能力,做数据的掌控者。
因此,具备寻找数据的能力是进行定量研究的基础。通过分析数据,我们能够把握其中的规律。分析数据指的是揭示人们行为和决策中隐含的规律,只有通过规律,我们才能发现并验证其是否真实存在。
数据的主要类型
从宏观的角度来看,数据可以分为宏观数据和微观数据,前者指的是国家层面或者地区层面(如省份、城市)的数据,而后者则指是的企业层面、个人或家庭等微观个体层面的数据。
从时间维度来看,数据可以分为截面数据、时间数据和面板数据。截面数据(横向数据)是描述多个观测对象在相同一段时间内或相同时间节点上的表现。例如2022年各省的GDP指标。时间数据(纵向数据)是描述观测对象随着时间变化而变化的情况。例如1978年-2023年中国GDP的变化。面板数据(横向数据X纵向数据)是描述多个观测对象随着时间变化而变化的情况,是结合了界面数据和时间数据。例如1978年-2023年各省GDP的变化。
第三个维度是抽样调查数据和大样本数据。抽样调查数据是通过抽取小样本数据来很好地反映大样本数据的情况。随着互联网技术的发展,产生了大量的数据,这也推动了大样本数据的发展,大样本数据接近于总体数据。比如淘宝反映的全国人民的购物习惯的数据收集,滴滴对于我们打车习惯数据的收集。
第四个维度是观测数据和模拟数据。观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。模拟数据是在控制条件下,某一个变量的变化引起核心变量相应的变化
数据来源
我们今天讲数据的来源主要是微观数据和宏观数据来源。微观数据的来源主要是包括以下四个途径:
1、第一手的调查数据。我们每个人都可以成为数据的采集者,我们可以个人或者依靠团队的力量收集数据,我们可以根据自己的喜好或者需要去设计问卷。
2、公开的微观数据库、报告。一些有实力的科研机构或者是大学开始了微观数据库的建设,有利于我们理解当代社会。
3、第三方平台大数据。这种数据量大,而且涉及到个人,所以也是特别重要的数据。比如春节回家百度做的迁徙大数据,对于人从哪里走、到哪里去、途径哪里,春运结束以后都会发布相应的数据。
4、手工处理或者网络爬虫获得的数据。有些数据是没有人整理,散落在网络的海洋中,我们如果有一定的见识和能力,可以把它们整理出来,形成自己独特的数据库。比如把近30年中央一号文件整理一下通过词频整理“三农”政策的发展脉络。
除了微观数据,还有许多宏观数据来源,如各类统计年鉴、统计公报、政府报告、行业报告和智库咨询公司发布的专业报告。
然而,仅具备数据收集能力并不意味着万事大吉。如何对收集到的数据进行分析也是许多人困惑的难题。为了解决学习者在量化数据收集和数据分析方面的困惑,学术志邀请了多年从事量化研究的钱老师开设《量化数据收集与数据分析在线直播课》。
本课程通过解析何谓数据分析、数据分析的原则,收集数据的方法和技巧;哪里能够找到数据,常用的数据或数据库有哪些;处理和分析数据的工具有哪几类,如何快速掌握;如何对数据进行预处理和可视化分析,数据分析的基本方法有哪些;进而结合数据分析的实践案例,讲解如何做好数据分析来服务研究和论文写作。
联系客服