Microsoft Excel是使用最广泛的电子表格程序,它以.xls或.xlsx格式存储数据. R可以使用一些特定于Excel的包直接从这些文件中读取.很少有这样的软件包 - XLConnect,xlsx,gdata等.我们将使用xlsx软件包. R也可以使用这个包写入excel文件.
安装xlsx包
您可以在R控制台中使用以下命令来安装" xlsx"包.它可能会要求安装一些此程序包所依赖的附加软件包.按照相同的命令使用所需的软件包名称来安装其他软件包.
install.packages("xlsx")
验证并加载"xlsx"软件包
使用以下命令验证并加载"xlsx"软件包.
#验证软件包是否已安装. any(grepl("xlsx",installed.packages()))#将库加载到R工作区. library("xlsx")
当脚本运行时,我们得到以下输出.
[1] TRUELoading required package: rJavaLoading required package: methodsLoading required package: xlsxjars
输入为xlsx文件
打开Microsoft excel.将以下数据复制并粘贴到名为sheet1的工作表中.
idname salary start_datedept1Rick 623.3 1/1/2012 IT2Dan 515.2 9/23/2013 Operations3Michelle 611 11/15/2014IT4Ryan 729 5/11/2014 HR5Gary 43.25 3/27/2015 Finance6Nina 578 5/21/2013 IT7Simon 632.8 7/30/2013 Operations8Guru 722.5 6/17/2014 Finance
同时将以下数据复制并粘贴到另一个工作表,并将此工作表重命名为"city".
name cityRick SeattleDan TampaMichelle ChicagoRyan SeattleGary HoustonNina BostonSimon MumbaiGuru Dallas
将Excel文件另存为"input.xlsx".您应该将它保存在R工作区的当前工作目录中.
读取Excel文件
使用
# Read the first worksheet in the file input.xlsx.data <- read.xlsx("input.xlsx", sheetIndex = 1)print(data)
当我们执行上面的代码,它产生以下结果 :
id, name, salary, start_date, dept1 1 Rick 623.30 2012-01-01 IT2 2 Dan 515.20 2013-09-23 Operations3 3 Michelle 611.00 2014-11-15 IT4 4 Ryan 729.00 2014-05-11 HR5 NA Gary 843.25 2015-03-27 Finance6 6 Nina 578.00 2013-05-21 IT7 7 Simon 632.80 2013-07-30 Operations8 8 Guru 722.50 2014-06-17 Finance