Stata软件之数据框
• 在内存中同时加载多个数据集
• 将每个数据集存储在一个数据框中
• 链接相关数据框
• 使用多个数据框中的变量,就像它们在于一个框中一样
• 多任务
• 在另一框中记录结果
• 交互式使用数据框
• 保存和加载数据框集
• 使用ado和Mata格式的数据框进行编程
• 从Java和Python访问Stata数据框中的数据
创建和数据框
内存中的数据集以数据框的形式存储,每一个框都会被命名。当Stata启动时,它会自动创建一个名为default的数据框。
创建数据框命名为 myframe
. frame create myframe
删除现有数据框:oldframe
. frame drop oldframe
将现有数据框oldname重命名为newname
. frame rename oldname newname
仅将变量x1、x2和x3复制到名为subset1的数据框中
. frame put x1 x2 x3, into(subset1)
只将z > 50的观测值复制到名为subset2的新框中
. frame put if z > 50, into(subset2)
探索数据框
列出内存中的所有数据框,以及每个框中数据的标签和维度
. frames dir
描述内存中每一个框中的数据
. frames describe
切换数据框
将myframe设置为活动框,对myframe中的数据执行Stata命令,并再次将default设置为活动框
. frame change myframe
. stata_command
. stata_command
. frame change default
使用frame前缀对myframe中的数据运行Stata命令
. frame myframe: one_stata_command
对myframe中的数据运行多个命令
. frame myframe {
stata_commamd
stata_command
}
在内存中存储多个数据集可以支持您同时执行多个任务,处理彼此独立但相关的数据集,将结果从一个数据集导入到另一个数据集,等等。
使用独立但相关的数据集
你有两个相关文件persons.dta 和 counties.dta,这些人住在不同郡县。你可以将数据集加载到单独的框中,并将它们链接起来。
在default框中打开persons.dta
. use persons
创建一个新的counties数据框并打开counties.dta
. frame create counties
. frame counties: use counties
使用变量countyid将活动框(default)中的观测值链接到郡县框中相应的观测值
. frlink m:1 countyid, frame(counties)
将记录各县收入中位数的变量med _ income从郡县框复制到活动框
. frget med_income, from(counties)
为变量med homesize创建别名,该变量记录每个郡县的房屋大小中位数,这样您就可以像在活动框中一样使用该变量。
. fralias add med_homesize, from(counties)
使用数据框让工作变得更简单
假设你有世界各地城市和国家的数据,并且您希望在不修改当前数据的情况下高效地分析德国的数据:
. frame put if country==”Germany”, into(subset)
. frame change subset
. stata_commands
. frame change default
. frame drop subset
在另一个数据框中记录结果
用变量t和p创建一个名为results的新数据框
. frame create results t p
进行1000次模拟,绘制100个随机正态变量,将平均值与0进行t检验,并将t统计量和p值发布到结果框中
. forvalues i=1(1)1000 {
2. quitely set obs 100
3. quietly generate x = rnormal()
4. quietly ttest x=0
5. frame post results (r(t)) (r(p))
6. drop _all
7. }
计算results框中p值小于0.05的观测值
. frame results: count p <= 0.05
北京天演融智软件有限公司(科学软件网)是Stata软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。
turntech8843.b2b168.com/m/