发布信息

SasR和Python的比较|数据分析的工具选择来

作者:软荐小编      2023-10-22 09:00:59     139

Sas R 和 Python 的比较 | 数据分析工具选择

来源:“舒硕工作室”(微信ID:shushuojun)

软件数据如何备份_r 数据软件_软件数据如何一起存到内存卡

过去几年,数据分析界对R着迷,但R的潮流还没有过去。 Python再次崛起,并且越来越强大。 对于传统的数据分析工具来说,老牌的SAS和SPSS仍然占据着市场,那么我们应该如何选择数据分析工具呢?

SAS 和 R 的比较已经是分析领域最大的争论,Python 也值得争论。 本文将对这三种工具进行比较和讨论,希望大家都能从中受益。

这样的对比还不够多吗?

好多啊! 但我还是觉得有必要进一步讨论,因为:

我们的行业正在迅速变化;

之前的对比并没有太关注Python。 我认为我们现在需要认真考虑一下;

本文从全球角度对这三种工具的应用进行了比较。

背景

对这三者简单介绍一下:

(1)SAS:在商业分析领域,是无可争议的霸主。 SAS提供了丰富的统计功能,友好的GUI界面可以让分析人员快速上手,技术支持也很到位。 但成本太高,而且对于一些最新的统计分析方法来说,SAS更新也比较慢。

(2)R:R可以看作是SAS的“开源版本”,在学术研究中得到了广泛的应用。 由于它是开源的,新模型和算法更新很快,而且网上有很多文档r 数据软件,使其成为非常划算的选择。

(3)Python:原本是一种开源脚本语言,近年来其使用量显着增加。 如今,一些库(如numpy、scipy和matplotlib)和函数的引入使得支持几乎所有的统计分析和统计建模工作成为可能。 另外,由于Pandas库的存在,Python在处理结构化数据方面非常强大。

比较

我将从以下几个方面对这三个工具进行比较:

1. 成本

2. 易学性

3、数据处理能力

4.图形处理能力

5、更新速度

6. 就业前景

7. 客户服务支持和社区资源

对于每个方面,作者都给出了评分(1为最低,5为最高)。

成本

SAS 是商业软件,对于大多数个人分析师来说根本无法负担! 但SAS在机构或公司中拥有最高的市场份额。 R和Python都是免费的,可以随意下载,所以我的评价是:

SAS-2

R-5

Python-5

易于学习

首先,SAS非常容易使用。 例如,它的PROC SQL命令任何学过SQL的人都可以立即使用。 而且SAS有很好的GUI界面,网上有很多学习资源。 SAS还提供认证考试,这当然增加了学习者的成本。

使用R需要一些编程知识,但它是一种低级编程语言,因此简单的程序需要编写较长的代码。

在编程世界中,Python以简单着称,在数据分析世界中也是如此。 虽然目前还没有一个好的GUI界面,但我希望Python Notebook能够变得越来越主流,因为它编辑、记录和分享都非常方便。

SAS-4.5

R-2.5

Python-3.5

数据处理能力

数据处理能力一直是SAS的优势。 R的计算全部在RAM内存中进行,因此其计算过程受到32位机RAM内存大小的限制。 当然,这一切都将不再是问题,这三个软件都有非常好的数据处理能力r 数据软件,可以进行并行计算。

因此,在我看来,数据处理能力已经无法区分这三个工具了(当然可能有一些我没有意识到的创新),所以我给它们打相同的分数:

SAS-4

R-4

Python-4

图形处理能力

SAS 在“功能性”图形处理方面表现良好,但仅限于“功能性”。 如果你想对图形进行一些自定义修改,你需要了解复杂且困难的SAS图形包。

与其他两个软件相比,R 在图形处理方面的性能最好,并且有很多软件包可以帮助您实现它。

Python的性能处于中间位置。 你不仅可以使用原生库(matplotlib),还可以调用R来使用一些派生库。

SAS-3

R-4.5

Python-4

更新速度

这三个工具都提供了基本且最常用的分析功能,您可以处理大多数模型构建。 但如果你恰好需要使用最新、最前沿的技术或算法怎么办?

由于其开源特性,R 和 Python 算法可以快速更新。 由于R在学术界已经广泛使用,所以更新速度最快,而SAS会在下一个版本更新。

但另一方面,SAS的更新是由自己的研发团队完成的,并且经过了良好的测试。 R和Python的更新是“公开贡献的”,因此出错的可能性更大。

SAS-4

R-4.5

Python-4

工作前景

在全球范围内,SAS 仍然是公司和机构(尤其是大型机构)中最常用的工具。 R/Python更多地是初创公司或想要节省成本的公司的选择。 近年来,R和Python在工作中的使用增长迅速。 以下是网上发布的使用R和Python的职位数量趋势图:

r 数据软件_软件数据如何备份_软件数据如何一起存到内存卡

在印度(注:作者是印度人),我估计SAS占据了70%左右的市场份额,R约为15%,Python不到5%,但增长趋势与全球类似。

SAS-4.5

R-3.5

Python-2.5

客户支持和社区资源

R拥有最大的在线社区,但没有客户服务支持。 所以,遇到麻烦,就只能自己想办法解决。 当然,你会得到别人的很多帮助。 Python 也是如此。

SAS有专门的客户服务支持系统和在线社区,因此如果您遇到安装或其他问题,可以去找他们解决。

SAS-4

R-3.5

Python-3

其他因素

还有几点值得注意:

Python在网站开发中应用广泛,所以如果你从事互联网相关的工作,使用Python会更加方便。

SAS过去在端到端部署(可视化分析、数据仓库等)方面具有巨大的优势,但近年来,由于R在SAP HANA、Tableau等一些平台上的集成和支持,这种优势SAS 有所下降。 虽然与SAS的无缝集成相比还有很长的路要走,但道路已经打开。

综上所述

这个行业日新月异。 现在说谁会输、谁会赢还为时过早。 根据自己的情况(职业阶段、经济状况等)选择适合自己的。 以下是一些提示:

如果您是数据分析行业的新手,我建议您首先使用SAS。 它非常容易学习,并且市场占有率最高。

如果您已经从事数据分析行业几年,您应该学习一种新工具来扩展您的专业知识。

对于这个行业的专业人士来说,他们应该至少掌握两种工具来应对未来的机遇和挑战。

如果您在一家初创公司,或者您是一名自由职业者 - 我认为您应该坚持使用 R 或 Python!

最终得分总结如下:

软件数据如何备份_r 数据软件_软件数据如何一起存到内存卡

软件数据如何备份_软件数据如何一起存到内存卡_r 数据软件

·结尾·

相关内容 查看全部