如何把excel里的数据导入stata
经常会遇到的情形是:我格式的数据,需要导入到 stata 中进行分析,建议此时将其他格式数据复制到分析数据的文件目录下,然后直接用stata 的导入数据文件命令导入原始数据,用程序模式进行处理,然后导出处理结果.这样做的最大好处是:既不会破坏最原始的数据文件,又使我们的每一步数据处理和分析过程都有迹可循.1 insheet 命令 示例:3origin.xls”数据,将其打开并另存为“3origin.csv” ,(另存时请注意要选择“保存类型”下拉单,选择 csv(逗号分隔)这一项).然后在 stata命令窗口中用下述命令导入insheet using 3origin.csv,clear 也可以先将“3origin.xls”数据打开并另存为“3origin.txt” ,然后用下面的命令导入 insheet using 3origin.txt,clear 当数据中某个变量的位数特别长或者对导入数据的精度要求很高的时候,需要在该命令后面加double 选项.insheet using 3origin.txt,double clear 2 infile命令 对于“3origin.txt”或“3origin.csv”,还可用 infile命令导入 stata,此时需要先指出变量名.尤其要注意,当变量为字符型时,要先指明.infile id str10 name gender minority economy math using origin.txt,clear 或者 infile id str10 name gender minority economy math using origin.csv,clear 3 infix命令 还有一种标准化的数据,每个变量的位数是确定的,不足时,前面用0补齐,以 origin数据的后面四个变量为例,其数据格式为 114068 128052 029076 024390 037096 115385 028536 129565 如果遇到这种数据格式,需要对照数据说明导入数据,相应的命令为:infix gender 1 minority 2 economy 3-4 math 5-6 using origin.csv,clear 其中的数字为对应的数字位数.4 outsheet 命令与前述三个命令相反,有时我们需要将 stata 数据导出为其他格式数据,比如文本格式或后缀为 acs 的格式:此时需要使用outsheet 命令实现,该命令的基本格式如下.outsheet using myresult.txt outsheet using myresult.asc 此时建立的文件 myresult.txt第一行为变量名,第2~6 行为变量值.变量列间用tab键分隔.如果不希望在第一行存储变量名,则可以使用nonames 选项.如果文件已经存在,则需要使用 replace 选项,相应的命令分别为.outsheet using myresult.asc,nonames outsheet using myresult.asc,nonames replace 5 使用 transfer 软件 20210311