发布信息

1小时入门数据分析利器R语言

作者:软荐小编      2023-12-05 16:05:42     211

作者|谢家标

R语言是一套开源的数据分析解决方案,几乎可以独立完成数据处理、数据可视化、数据建模和模型评估,并且可以完美配合其他工具进行数据交互。

R语言高级研究员、微软MVP谢家彪老师在6.29上了一堂名为《R语言,1小时入门数据分析工具》的免费公开课,受到了很多朋友的喜爱。 谢老师特地整理了当天直播内容的精华,错过了直播。 朋友们,快来看看吧! 在StuQ后台输入“R语言”即可接收“R语言快速入门”ppt和“R脚本”txt。

R语言的优点

具体来说,R语言具有以下优点:

当然,R语言也有一些固有的缺点:

R&RStudio工具的下载和安装

我们可以在 CRAN(综合 R 存档网络)获取最新版本。 页面点击下载R,输入CRAN镜像站地址,包含中国大陆7个镜像地址。 您可以选择离您最近的地址进入其镜像详细页面,通过该页面您可以下载Linux、MacOS和Windows操作系统。 安装包。

双击下载的文件r软件教程,每次点击下一步即可完成R的安装。如果您的系统是64位,则默认安装会同时安装32位和64位R。普通包对于R都是通用的。有些与位数相关的包会需要R以不同的位数来运行,比如rJava包、RODBC包等。我们双击桌面图标启动R,打开如下界面。

R的界面相当简单,只有几个菜单栏和快捷按钮。 快捷按钮下方是主控制台,是输入脚本和执行结果窗口。

与SAS、SPSS和IBM SPSS Modeler等传统数据挖掘工具相比,R的缺点是它没有友好的操作菜单,这会让很多熟悉其他工具的用户一开始感到困难。 幸运的是,R的免费特性得到了很好的利用,用户贡献的R包已经实现了很多功能的基于菜单的操作。 我们来介绍一个更友好的编辑器——RStudio。

RStudio可以从其官方网站免费下载并安装。 一般情况下,只需下载并安装桌面版即可。 安装后启动RStudio的基本界面如下。

左上角的窗口是一个功能强大的文本编辑器。 我们可以在文本编辑器中编写脚本,然后点击运行按钮(或者使用Ctrl+R/Ctrl+Enter快捷键)来批量运行代码; 右上角窗口包含当前环境信息和历史命令; 右下窗口是标准R控制台; 右下窗口包括文件路径、绘图窗口、本地安装的软件包信息、帮助文档以及用于交互式绘图的图形浏览界面。

R语言快速入门、包的安装和使用

R 是一种区分大小写的解释语言。 程序内置的功能可以满足基本的数据分析需求,并且有丰富的帮助文档帮助新手快速上手。 还有很多用户贡献了高质量的软件包,极大地扩展了R的功能。

我们可以在命令提示符(>)后一次输入一个命令,或者一次执行脚本文件中编写的一组命令。 R语言是一种解释性语言。 输入命令后可以实时响应,就像计算器一样。 当我们输入指令点和等号后,它会输出计算结果。 如果R检测到输入的命令行还没有结束,就会给出提示符“+”,提示我们在下一行继续输入未完成的命令。

R语言中的标准赋值符号是

一=1:10

这时,如果我们想查看对象a,可以直接输入小写a。 不过,由于R是区分大小写的解释语言,所以此时如果我们输入大写的A,就会报错:

错误:未找到对象“A”

R提供了大量的帮助文档。 了解如何使用这些帮助文档可以帮助您快速入门。 如果你想了解某个函数或数据集的信息,可以输入问号吗? 后跟函数名称。 如果要搜索某个功能,可以输入两个问号??,后面输入与该功能相关的关键字。 函数 help 和 help.search 相当于 ? 和 ?? 分别。

例如:

?median # 相当于help("median"),查看中位数函数的帮助文档

??median # 相当于help.serach("median") 搜索包含median的帮助信息

如果您使用的是RStudio,还可以在右下角help中的搜索框中输入median来查看该函数的帮助文档,如下图。

默认情况下,帮助只能查找已加载到内存中的包中的函数和数据。 如果我们想要查找扩展包中尚未加载到内存中的函数和数据,我们需要在帮助函数中的package参数中指定具体的包名。 或者将 try.all.package 参数设置为 TRUE。 例如,我们要在shiny包中找到runExample函数:

包是具有明确定义格式的 R 函数、数据和预编译代码的集合。 R语言的使用很大程度上需要各种R包的辅助。 从某种程度上来说,R包是R的插件,不同的插件满足不同的需求。 截至2016年5月18日,CRAN已收录各类包8,417个。 包在计算机上存放的目录称为库r软件教程,位于R软件安装目录的/library目录下。 我们可以通过函数.libPaths()查看库的位置,并通过函数library()显示库中已安装的包。

要首次安装软件包,请使用命令 install.packages("package_name","dir")。 dir:安装包的路径。 默认情况下,它安装在 ..\library 文件夹中。 可以修改该参数来选择安装文件夹。

例如,如果我们要安装一个可以快速读取大数据集的扩展包data.table,我们只需要执行install.packages(“data.table”)即可完成安装。

'data.table'打开成功,MD5和检查也通过

下载的二进制包位于:

C:\Users\Think\AppData\Local\Temp\Rtmpoltpbz\downloaded_pa​​ckages

我们也可以选择R的菜单:Package->Install Package->在弹出的对话框中选择你要安装的包,然后确认。 如果您使用的是RStuido,可以选择菜单Tools -> Install Packages 弹出窗口,包括在线安装和本地安装。 我们选择在线安装。 只需要在Packages中输入包名,然后点击Install即可安装。

软件包安装后,如果您想使用该软件包的功能。 必须先将包加载到内存中(默认情况下,R启动后默认加载基本包)。 包加载命令:library(“包名”)或require(“包名”)。 也可以通过RStuido右下窗口中的Packages来加载包。 默认情况下,扩展包不会加载到内存中。

只需勾选data.table前面的复选框即可完成包的加载。

了解了R语言包的下载、安装和使用后,你就打开了学习R语言进行数据挖掘的大门! 但距离真正揭开R语言的面纱还很遥远~

相关内容 查看全部