Stata Tutorial

作者

徐鑫

发布于

2025年1月1日

前言

内容架构

本文是课程《Stata数据分析及应用》的讲义,仅用于教学目的,请勿外传。

本科课程阶段,主要涉及前11章的内容,算是对Stata这一统计编程软件的入门学习。在完成本课程的学习与训练后,学生预期可以掌握基本的实证数据分析基础。

第一部分为“预备知识”,共计一个章节,是关于Stata软件的简介。包括:Stata软件的特点、安装方法、常见的功能速览和其他优质Stata的学习资料。另外,有一些最基本的计算机知识,本讲义放在了附录 14  计算机基础知识 中,强烈推荐大家首先阅读这个章节后再正式开始Stata的学习。

第二部分为“数据处理”相关的基础知识,共计6个章节。其中第2章介绍了Stata中的数据处理对象——文件的操作,包括:Stata支持的数据文件类型、如何将外部数据文件(Excel、csv等格式)导入Stata中;如何将数据文件保存成Stata格式(dta文件);如何对Stata数据文件进行分割、合并(常见的包括横向与纵向)、变形处理(长宽转换、转置)等文件操作;如何将Stata格式的文件导出为Excel或者csv格式。

第3章介绍了Stata的命令结构。每一条Stata命令是在Stata代码中运行的最小单元,每一条命令由多个部分构成,包括:分组(bysort)、命令主体(command)、变量列表(varlist)、条件判断(if exp)、作用范围(in range)、可选项(option)、权重(weight)等。每一条命令都遵循上述语法结构。

从第3章到第6章,我们介绍了Stata命令结构中的四个重要部分:变量、运算符、表达式和函数。它们构成了数据处理中的主要方法。

第7章介绍了Stata中的流程控制语句,我们首先介绍了宏的概念(local和macro);然后介绍了Stata中命令结果的存储和获取最后介绍了条件判断(if-else if-else)和循环语句(forvalues, foreach, while)的应用方法。

第三部分为使用Stata进行结果的报告与展示。其中第8章为实证研究常见表格的生成方法。第9章为常见图形的绘制方法。

第四部分为综合应用训练。其中第10章选取了一篇典型的公司金融的实证论文,复现了其中一些常见公司层面指标的计算方法;第11章选取了一篇典型的资产定价的实证论文,复现了投资组合分析的典型方法。

第五部分尚在计划中,第12章介绍编写自定义的函数以及ado文件;第13章介绍如何动态展示数据分析结果。