使⽤R语⾔的时候,如果是少量数据,不妨使⽤c()或其他函数进⾏创建;但是对于⼤量数据,最好还是先通过其他更⽅便的软件创建数据⽂件,然后使⽤R读⼊这个⽂件。
前⽂说,.csv是⾮常好的数据⽂件格式,跨平台⽀持⾮常好。我在Excel或者SPSS中创建的数据,只要存为csv格式,就可以使⽤⼏乎任何数据处理软件对这些数据进⾏处理了。
R语⾔中读取外部⽂件的最基本函数是read.table(),先介绍read.table(),然后再介绍专门⽤来读csv的read.csv()。敲⼊?read.table命令,就看到了关于数据输⼊函数的说明。对read.table,使⽤格式是这样的;read.table(file, header = FALSE, sep =\"\dec = \".\as.is = !stringsAsFactors,
na.strings = \"NA\skip = 0, check.names = TRUE, fill =!blank.lines.skip,strip.white = FALSE, blank.lines.skip =TRUE,comment.char = \"#\
allowEscapes = FALSE, flush =FALSE,stringsAsFactors =default.stringsAsFactors(),fileEncoding = \"\参数很多,最常⽤的也就⼏个,重写如下:
read.table(file, header = FALSE, sep =\"\dec = \".\
strip.white = FALSE, blank.lines.skip =TRUE,comment.char = \"#\")
file表⽰要读取的⽂件。file可以是
①绝对路径或者相对路径,但是⼀定要注意,因为在R语⾔中\\是转义符,所以路径分隔符必须写成\\\\,⽐如“C:\\\\myfile\\\\myfile.txt”或者
Sys.setenv(JAVA_HOME='C://Program Files/②可以使剪切板的内容。
③使⽤file.choose(),弹出对话框,让你选择⽂件位置。强烈推荐使⽤第三种⽅法,免去了记忆和书写⽂件路径的⿇烦,强烈推荐使⽤第三种⽅法,免去了记忆和书写⽂件路径的⿇烦,特别是能够避免因数据⽂件位置移动带来的错误!例如:特别是能够避免因数据⽂件位置移动带来的错误!read.table(file.choose(),...)。header来确定数据⽂件中第⼀⾏是不是标题。默认F,即认为数据⽂件没有标题,也即认为第⼀⾏就开始是数据了!例如:姓名年龄 收⼊⼩六 12 350
如果header=F,读进来的第⼀⾏数据是“姓名 年龄收⼊”,header=T,读进来的第⼀⾏是“⼩六 12 350”。
sep指定分隔符,默认是空格。quote是引号,默认就是双引号。dec是⼩数点的表⽰,默认就是⼀个点。skip是确定是否跳过某些⾏。strip.white确定是否消除空⽩字符。blank.lines.skip确定是否跳过空⽩⾏。comment.char指定⽤于表⽰注释的引导符号。
⼀般情况下,我们只需要默认值就够了。
下⾯是⼀个简单的例⼦,本例⼦中,⾸⾏是标题⽽不是数据,使⽤\进⾏分割⽽不是空格。读取后的数据变量设为mydata。所以,可以写出读取⽅式为:
mydata<-read.table(file.choose(),header=T,sep=\"\\")
其中,T和TRUE的效果是⼀样的,正如F和FALSE的效果是⼀样的。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo6.com 版权所有 湘ICP备2023023988号-11
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务