Stata 16 Feature highlights:
1. Lasso
2. Reporting
3. Meta-analysis
4. Choice models
5. Python integration
6. New in Bayesian analysis—Multiple chains, predictions, and more
7. Panel-data ERMs
8. Import data from SAS and SPSS
9. Nonparametric series regression
10. Multiple datasets in memory
11. Sample-size analysis for confidence intervals
12. Nonlinear DSGE models
13. Multiple-group IRT models
14. xtheckman
15. Multiple-dose pharmacokinetic modeling
16. Heteroskedastic ordered probit models
17. Graph sizes in printer points, centimeters, and inches
18. Numerical integration
19. Linear programming
20. Stata in Korean
21. Mac interface now supports Dark Mode and native tabbed windows
22. Do-file Editor—Autocompletion and more syntax highlighting

2019年6月Stata 15正式发布。这是Stata有史以来较大的一次版本更新。我们贴出了Statalist并且列出了16项较重要的新功能。这篇文章会重点谈谈这些新功能:
扩展回归模型
潜在类别分析(LCA)
贝叶斯前缀指令
线性动态随机一般均衡(DSGE)模型
web 的动态Markdown文档
非线性混合效应模型
空间自回归模型(SAR)
区间删失参数生存时间模型
有限混合模型(FMMs)
混合Logit模型
非参数回归
聚类随机设计和回归模型的功率分析
Word和PDF文档
图形颜色透明度/不透明度
ICD-10-CM/PCS支持
联邦储备经济数据(FRED)支持
其他
上面列出的十六功能当然是重要的, 但还有其他值得一提的。比较*想到的是:
. 贝叶斯多级模型
. 门限回归
. 具有随机系数的面板数据tobit
. 区间测量结果的多层回归
. 删失结果的多级Tobit回归
. 面板数据的协整测试
. 时间序列中多断点的测试
. 多组广义 SEM
. 异方差的线性回归
. Heckman风格的样本选择Poisson模型
. 具有随机系数的面板数据非线性模型
. 贝叶斯面板数据模型
. 随机系数的面板数据区间回归
. SVG的导出
. 贝叶斯生存模型
. 零膨胀有序概率
. 添加您自己的电源和样本大小的方法
. 贝叶斯样本选择模型
. 支持瑞典语
. 对DO文件编辑器的改进
. 流随机数生成器
. 对于java插件的改进
. Stata / MP更多的并行化

Stata是一款完整的、集成的统计软件包,提供您需要的一切数据分析、数据管理和图形。
统计功能介绍
Stata使得大量的统计工具用于指尖
标准方法,如
基本表格和总结
案例对照分析
ARIMA
ANOVA 和MANOVA
线性回归
时间序列平滑
广义线性模型(GLM)
聚类分析
对比和比较
功率分析
样本选择
……
高级方法,如
多层模型
生存分析
动态面板数据回归
结构方程建模
二进制,计数和审查结果
ARCH
多重替代法
调查数据
Treatment effects
精确统计
贝叶斯分析
……
Stata是一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。事实上,Stata的ado文件(高级统计部分)都是用Stata自己的语言编写的。
Stata其统计分析能力远远**过了SPSS,在许多方面也**过了SAS!由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度较快(一般来说, SAS的运算速度要比SPSS至少快一个数量级,而Stata的某些模块和执行同样功能的SAS模块比,其速度又比SAS快将近一个数量级!)Stata也是采用命令行方式来操作,但使用上远比SAS简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至**过了SAS。用Stata绘制的统计图形相当精美,很有特色。
科学软件网是一个以引进国外优秀科研软件,提供*软件服务的营业网站,网站由天演融智软件有限公司创办,旨在为国内高校、科研院所和以研发为主的企业事业单位提供优秀的科研软件及相关软件服务。截止目前,科学软件网已获得数百家国际**软件公司正式授权,代理销售科研软件达一千余种,软件涵盖领域包括经管,仿真,地球地理,生物化学,工程科学,排版及网络管理等。同时,还提供专业培训、视频课程(包含34款软件,64门课程)、实验室解决方案和项目咨询等服务。
不管您是需要购买单款软件,还是制定整个实验室的购买方案,都可以提供。
Stata是一款完整的、集成的统计软件包,提供您需要的一切数据分析、数据管理和图形。
快速,简单并易于使用
点击式的界面和强大,直观的命令语言让Stata使用起来快速,精确并易于使用。
所有的分析结果都可以被复制和存档,并用来出版和审查。不管您什么时候写的内容,版本控制系统确保统计程序可继续生成同样的结果。
Stata的作图模块,主要提供如下八种基本图形的制作 : 直方图(histogram),条形图(bar),百分条图 (oneway),百分圆图(pie),散点图(two way),散点图矩阵(matrix),星形图(star),分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。
Stata的矩阵运算功能
矩阵代数是多元统计分析的重要工具, Stata提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、 Cholesky分解、 Kronecker内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。
统计功能
Stata使得大量的统计工具用于指尖
标准方法,如
基本表格和总结
案例对照分析
ARIMA
ANOVA 和MANOVA
线性回归
时间序列平滑
广义线性模型(GLM)
聚类分析
对比和比较
功率分析
样本选择
……
高级方法,如
多层模型
生存分析
动态面板数据回归
结构方程建模
二进制,计数和审查结果
ARCH
多重替代法
调查数据
Treatment effects
精确统计
贝叶斯分析
……
Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。
统计功能介绍
Stata使得大量的统计工具用于指尖
标准方法,如
基本表格和总结
案例对照分析
ARIMA
ANOVA 和MANOVA
线性回归
时间序列平滑
广义线性模型(GLM)
聚类分析
对比和比较
功率分析
样本选择
……
高级方法,如
多层模型
生存分析
动态面板数据回归
结构方程建模
二进制,计数和审查结果
ARCH
多重替代法
调查数据
Treatment effects
精确统计
贝叶斯分析
……
Stata的数据管理功能让您控制所有类型的数据。
您可以重组数据,管理变量,并收集各组并重复统计。您可以处理字节,整数,long, float,double和字符串变量(包括BLOB和达到20亿个字符的字符串)。Stata还有一些高级的工具用来管理特殊的数据,如生存/时间数据、时间序列数据、面板/纵向数据、分类数据、多重替代数据和调查数据。
Stata轻松生成出版质量、风格迥异的图形。您可以编写脚本并以可复制的方式生成成百上千个图形,并且可以以EPS或TIF格式输出打印、以PNG格式或SVG格式输出放到网上、或PDF格式输出预览。使用这个图形编辑器可更改图形的任何方面,或添加标题、注释、横线、箭头和文本。

Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。

Stata 数据管理统计绘图软件
快速,简单并易于使用
点击式的界面和强大,直观的命令语言让Stata使用起来快速,精确并易于使用。
所有的分析结果都可以被复制和存档,并用来出版和审查。不管您什么时候写的内容,版本控制系统确保统计程序可
继续生成同样的结果。
统计功能介绍
Stata使得大量的统计工具用于指尖
● 基本表格和总结
● 案例对照分析
● ARIMA
● ANOVA 和MANOVA
● 线性回归
● 时间序列平滑
● 多层模型
● 生存分析
● 动态面板数据回归
● 结构方程建模
● 二进制,计数和审查结果
● ARCH
■ 标准方法,如■ 高级方法,如
● 多重替代法
● 调查数据
● Treatment effects
● 精确统计
● 贝叶斯分析
● ……
尽管您不需要使用Stata进行编程,
但是它作为一个快速完成矩阵的编程
语言,是Stata功能中不可或缺的一部
分。Mata既是一个操作矩阵的互动环
境,也是一个完整开发环境,可以生
产编译和优化代码。它还包含了一些
特殊功能来处理面板数据、执行真实
或复制的矩阵运算,提供完整的支持
面向对象的编程,并完全兼容Stata。
Stata 16 New in Bayesian analysis—Multiple chains, predictions, and more
Multiple chains.
Bayesian inference based on an MCMC (Markov chain Monte Carlo) sample is valid only if the Markov chain has converged. One way we can evaluate this convergence is to simulate and compare multiple chains.
The new nchains() option can be used with both the bayes: prefix and the bayesmh command. For instance, you type
. bayes, nchains(4): regress y x1 x2
and four chains will be produced. The chains will be combined to produce a more accurate final result. Before interpreting the result, however, you can compare the chains graphically to evaluate convergence. You can also evaluate convergence using the Gelman–Rubin convergence diagnostic that is now reported by bayes: regress and other Bayesian estimation commands when multiple chains are simulated. When you are concerned about noncovergence, you can investigate further using the bayesstats grubin command to obtain individual Gelman–Rubin diagnostics for each parameter in your model.
Bayesian predictions.
Bayesian predictions are simulated values from the posterior predictive distribution. These predictions are useful for checking model fit and for predicting out-of-sample observations. After you fit a model with bayesmh, you can use bayespredict to compute these simulated values or functions of them and save those in a new Stata dataset. For instance, you can type
. bayespredict (ymin:@min({_ysim})) (ymax:@max({_ysim})), saving(yminmax)
to compute minimums and maximums of the simulated values. You can then use other postestimation commands such as bayesgraph to obtain summaries of the predictions.
The dataset created by bayespredict may include thousands of simulated values for each observation in your dataset. Sometimes, you do not need all of these individual values. To instead obtain posterior summaries such as posterior means or medians, you can use bayespredict, pmean or bayespredict, pmedian. Alternatively, you may be interested in a random sample of the simulated values. You can use, for instance, bayesreps, nreps(100) to obtain 100 replicates.
Finally, you may want to evaluate model goodness of fit using posterior predictive p-values, also known as PPPs or as Bayesian predictive p-values. PPPs measure agreement between observed and replicated data and can be computed using the new bayesstats ppvalues command. For instance, using our earlier example
. bayesstats ppvalues {ymin} {ymax} using yminmax
Lasso is a machine-learning technique used for model selection, prediction, and inference.
The new lasso command selects “optimal” predictors for continuous, count, and binary outcomes using deviances from linear, Poisson, logit, or probit regression models.
For instance, if you type
. lasso linear y x1-x500
lasso will select a subset of the specified covariates—say, x2, x10, x11, and x21. You can then use the standard predict command to obtain predictions of y.
If you instead have a binary or count outcome, you can use lasso logit, lasso probit, or lasso poisson in the same way. And if you prefer to select variables using the elastic net or square-root lasso method, you can use the elasticnet or sqrtlasso command.
Sometimes, variable selection or prediction is the final goal of lasso. Other times, you are interested in estimating and testing coefficients. Stata 16 provides 11 commands that allow you to estimate coefficients, standard errors, and confidence intervals and to perform tests for variables of interest while using lasso methods to select from among potential control variables. The commands are
dsregress, dslogit, dspoisson, poregress, pologit, popoisson, poivpoisson, xporegress, xpologit,
xpopoisson, and xpoivregress.
The ds commands perform double-selection lasso, the po commands perform partialing-out lasso, and the xpo commands perform cross-fit partialing-out lasso. They do this for models with continuous, binary, and count outcomes. They can even handle endogenous covariates in models for continuous outcomes. The literature currently discusses many methods for lasso-based inference. We make some of these methods available so that researchers can select their favorite. In fact, there are even more lasso-based methods of inference in the literature, and often researchers may use the tools available in lasso, sqrtlasso, and elasticnet to implement other methods.
The lasso and elasticnet commands are standard lasso tools often requested for variable selection and prediction. The lasso tools for inference implement newer methods developed primarily by econometricians. However, these inference methods will be popular in all disciplines because they provide a method for testing and interpreting coefficients on variables of interest.
Users can easily learn all about the lasso features in the new Lasso Reference Manual.
-/gjiiih/-
http://turntech8843.b2b168.com