博文分享 | Stata软件导入COVID-19数据(更新篇)

时间:2020-04-03点击次数:256

在上一篇文章中,作者提到不打算发布covid19.ado文件,因为在2020319日提到如果Johns Hopkins更改数据时,它可能会变得没有意义。而当前数据已经在2020323日有所更改,它很可能还会不断的发生变化。随着数据的变化,作者可能会在将来发布更新,但是您可能需要在作者发布之前更快的进行调整。因此,让我们看看如何更新代码以适应不断变化的数据。

首先,运行上一篇博客文章中的代码。

当我们describe数据时,看起来有些错误。

我们具**称相似的变量,例如provincestateprovince_statecountryregioncountry_region等。 较新的原始文件中的变量名称已更改。 但是追加数据时,必须具有相同的变量名。

 

我浏览了较新的原始数据文件,并确定了数据更改的日期。您*打开文件即可执行此操作。您可以简单地describe本地磁盘或云帐户中的数据。

 

2020322日的原始数据使用旧的变量名称。

2020323日的原始数据使用新的变量名称。

我们可以编写一些巧妙的代码来区分323日之前和之后创建的文件。但是一个简单的替代方法是使用capture rename来更改原始数据文件中必要的变量名。

 

让我们在323日的原始数据文件上尝试一下,然后再将其合并到我们的其余代码中。

现在,新数据中的变量名称与旧数据中的变量名称匹配。新数据中的某些变量未出现在旧数据中。这些新变量将添加到较终数据集中,但不包含323日之前的任何数据。

 

以下更新的代码将从2020323日起从Johns Hopkins GitHub repository中导入原始数据。我标红了新命令。

 

我们可以通过描述结果数据来验证此方法是否有效。


保存此数据集,以便以后使用。

请注意,我们尚未检查并确认这些数据。上面的代码和所得数据应仅用于指导目的。


北京天演融智软件有限公司(科学软件网)是Stata软件在中国的授权经销商,为中国的Stata用户提供优质的软件销售和培训服务。





http://turntech8843.b2b168.com

产品推荐

Development, design, production and sales in one of the manufacturing enterprises

您是第3056611位访客
版权所有 ©2025 八方资源网 粤ICP备10089450号-8 北京天演融智软件有限公司 保留所有权利.

北京天演融智软件有限公司 保留所有权利.

技术支持: 八方资源网 八方供应信息 投诉举报 网站地图