R语言——文件读写(三)

目录

一、获取数据

二、读取文件

三、写入文件

四、读写Excel文件

五、读写R格式的文件

参考


一、获取数据

获取数据的三种途径:

1. 利用键盘来输入数据

2. 通过读取存储在外部文件上的数据

3. 通过访问数据库系统来获取数据

edit():定义一个数据编辑器,可直接输入修改数据,关闭编辑器,数据自动保存到变量中,注意这里需要将修改后的数据重新指向一个变量名,才可以成功保存

fix():可以直接修改并保存,不需要重新定义变量名

通过访问数据库系统来获取数据

ODBC是开放数据库连接Open Database Connectivity的简称。

install.packages("RODBC"):安装ODBC

二、读取文件

read.table('文件路径'):注意这里的路径用" \\ "或" / "。

sep:表示用什么分隔符分隔字段,默认为以空格分隔

如果文件过长,可以用head(x, n=10),tail(x, n=10)打开前十行或后十行。

header:作用是在读取数据时,是否将第一行数据作为变量的名称。

skip:表示跳过部分行内容,表示从第几行读数据

这里跳过了第一行的表头信息

nrows:读取文件的部分内容,表示读多少行

配合skip则可以读取文件中的任意行,表示从 skip 开始读,读 nrows 行

如果已知文件中使用什么符号代表缺失值,则可以使用 na.strings 替换为 “NA”

read.csv(x, sep=";"):默认分隔符为“ ,”,可以直接用来读取csv文件,也可以设置sep修改分隔符为“ ;”或其他

read.delim(x, sep='\t'):可以使用制表符进行分隔

如果想要读取的文件不在本地,R也支持读取网络文件

将本地路径修改为网络文件地址即可

read.table('https://codeload.github/masterpeace')  # 会被墙

install.packages('XML') : 安装XML包

使用 readHTMLTable 读取网页中的数据

R可以导入其他统计软件格式的数据,如SPSS等

R 可以直接读取压缩文件

read.table(gzfile("input.txt.gz")

不规则格式文件的读取

readLines(file, n):读取一行数据,n为读取的行数

三、写入文件

写入文件

write.table(b, file = 'E:\\R\\R_file\\new_file.csv')

数据被写在一个单元中

write.table(b, file = 'E:\\R\\R_file\\new_file.csv',sep = ','):添加分隔符

写入文件时,R又自动添加了行号

write.table(b, file = 'E:\\R\\R_file\\new_file.csv',sep = ',', row.names = F):定义row.names为FALSE, 不添加行号

write.table(b, file = 'E:\\R\\R_file\\new_file.txt',sep = ',', row.names = F):R会为字符串自动天添加双引号

如果不想要双引号,则定义 “quote”参数为“FALSE”。

write.table(b, file = 'E:\\R\\R_file\\new_file.txt',sep = ',', row.names = F, quote = F)

追加写入:write.table(b, file = 'E:\\R\\R_file\\new_file.txt',sep = ',', row.names = F,col.names = F, quote = F,append = T)

直接写成压缩文件:write.table(b, gzfile('E:\\R\\R_file\\new_file.txt.gz'))

写成其他统计软件支持的格式

help(package='foreign')

四、读写Excel文件

将.xlsx 文件转为 .csv 文件读取 

使用read.csv()

使用read.Clipboard()

如果 .xlsx 文件中包含多个工作表,则存为.csv 的方式就不适用了。

使用 readxl 包

install.packages('readxl')

library(readxl)

a <- read_xlsx(parh, sheet = 'sheet_name')

使用 openxlsx 包

install.packages('openxlsx')

library(openxlsx)

a<-read.xlsx("test.xlsx",sheet=1)

五、读写R格式的文件

        存储为R文件会有很多优势,R会对存储为内部文件格式的数据进行自动压缩处理,并且会存储所有与待存储对象相关的R元数据。如果数据中包含了因子,日期和时间或者类的属性等信息,这种存储方式,显得更加实用。

RDS保存单个R对象

读取 iris 数据集并存储为 RDS格式文件

saveRDS(iris, file = 'E:\\R\\R_file\\iris.RDS')

读取RDS文件

x <- readRDS('E:\\R\\R_file\\iris.RDS')

Rdata可以保存多个R对象

保存Rdata文件

save(iris, iris3, file = 'iris.Rdata')

保存工作空间中的所有对象 

save.image()

或者在命令行输入 q() ,选择 “y” ,则在退出R studio之前将工作空间保存在当前工作目录下。

加载Rdata文件:load(path)

加载 Rdata 文件,并不会提示加载了那些对象,可在 R studio 右上角窗口的 Environment 中查看有哪些对象。

或者点击左上角 File → Save 保存工作空间

点击 File → Open Project 打开工作空间

Rdata中的对象与当前工作空间的对象名冲突,此时加载Rdata则会覆盖掉当前空间中的对象。

参考

R语言入门与数据分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/258739.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

在使用mapstruct,想忽略掉List<DTO>字段里面的,`data` 字段的映射, 如何写ignore: 使用@IterableMapping

在使用mapstruct,想忽略掉List字段里面的,data 字段的映射, 如何写ignore 代码如下: public interface AssigmentFileMapper {AssigmentFileDTO assigmentFileToAssigmentFileDTO(AssigmentFile assigmentFile);AssigmentFile assigmentFileDTOToAssigmentFile(Assigment…

【Proteus仿真】【Arduino单片机】视力保护仪

文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真Arduino单片机控制器&#xff0c;使LCD1602液晶&#xff0c;DS18B20温度传感器、按键、蜂鸣器、继电器开关、HC05蓝牙模块等。 主要功能&#xff1a; 系统运行后&#xff0c;LCD16…

5252D 5G基站测试仪

01 5252D 5G基站测试仪 产品综述&#xff1a; 5252D多通道综测仪打破了信号发生器进行信号发射、频谱分析仪进行观看频域波形的测试方案&#xff0c;将信号收发融为一体&#xff0c;推动无线通信测试进入全新时代。其独具的多通道收发一体、高性能、全方位测试能力及直观操作…

UE5 runtime模式下自定义视口大小和位置并跟随分辨率自适应缩放

本文旨在解决因UI问题导致屏幕中心位置不对的问题 处理前的现象&#xff1a;如果四周UI透明度都为1&#xff0c;那么方块的位置就不太对&#xff0c;没在中心 处理后的现象&#xff1a; 解决办法&#xff1a;自定义大小和视口偏移 创建一个基于子系统的类或者蓝图函数库(什么类…

链表对象的封装

前言 前面我自己写了一个对链表对象的封装&#xff0c;现在看来&#xff0c;确实还得是大佬的封装思路更加完善 前言知识介绍 __init__方法 __init__方法是Python中的一个特殊方法&#xff0c;用于初始化一个新对象。当一个类的实例被创建时&#xff0c;__init__方法会被自…

【数据结构和算法】 K 和数对的最大数目

其他系列文章导航 Java基础合集数据结构与算法合集 设计模式合集 多线程合集 分布式合集 ES合集 文章目录 其他系列文章导航 文章目录 前言 一、题目描述 二、题解 2.1 方法一&#xff1a;双指针排序 三、代码 3.1 方法一&#xff1a;双指针排序 3.2 方法二&#xff1…

107基于matlab的模糊推理系统(ANFIS)的时间序列预测

基于matlab的模糊推理系统&#xff08;ANFIS&#xff09;的时间序列预测&#xff0c;输出训练集、测试集和预测数据结果&#xff0c;数据可更换自己的&#xff0c;程序已调通&#xff0c;可直接运行。 107 时间序列预测模糊推理系统 (xiaohongshu.com)

管理类联考——数学——真题篇——按题型分类——充分性判断题——蒙猜A/B

老规矩&#xff0c;看目录&#xff0c;平均3-5题 文章目录 A/B2023真题&#xff08;2023-19&#xff09;-A-选项特点&#xff1a;两个等号&#xff1b;-判断需联立的难易&#xff1a;难&#xff0c;看着感觉需要联立&#xff0c;所以判断联立需要有理论支撑&#xff0c;不然还…

QT qAbs()、qRound()

1.qAbs qAbs:原型为 T qAbs(const T &value) 返回输入参数对应类型的绝对值&#xff0c;其中T为输入参数类型&#xff0c;也就是可以返回多种类型&#xff08;int,float,double型&#xff09; 代码示例&#xff1a; int d -1; float b -3.14; double c -4.36;int a_…

具有超低功耗性能的R7F102GAC3CSP、R7F102GAC2DSP、R7F102G6C3CSP RL78/G22微控制器 16-bit MCU

RL78/G22 简介&#xff1a; 除了具有低电流消耗&#xff08;CPU工作时&#xff1a;37.5μA/MHz&#xff1b;STOP时&#xff1a;200nA&#xff09;外&#xff0c;RL78/G22微控制器还配备了丰富的电容触摸通道。完备的16-48引脚封装和32KB-64KB闪存&#xff0c;扩充了新一代RL78…

PMP认证需要多少钱?

PMP认证费太贵&#xff1f;这些可以省下来&#xff01; 学习PMP认证到拿证的过程中一共有两个地方需要有费用支出&#xff0c;第一是PMP培训费用&#xff0c;第二就是PMP考试费用。 为什么一定要参加培训&#xff1f;这是PMI的考试条件中要求的&#xff0c;任何考生都需要有35学…

【C++】开源:ImGui图形用户界面库配置与使用

&#x1f60f;★,:.☆(&#xffe3;▽&#xffe3;)/$:.★ &#x1f60f; 这篇文章主要介绍ImGui图形用户界面库配置与使用。 无专精则不能成&#xff0c;无涉猎则不能通。——梁启超 欢迎来到我的博客&#xff0c;一起学习&#xff0c;共同进步。 喜欢的朋友可以关注一下&…

【递归 回溯】LeetCode-226. 翻转二叉树

226. 翻转二叉树。 给你一棵二叉树的根节点 root &#xff0c;翻转这棵二叉树&#xff0c;并返回其根节点。 示例 1&#xff1a; 输入&#xff1a;root [4,2,7,1,3,6,9] 输出&#xff1a;[4,7,2,9,6,3,1]示例 2&#xff1a; 输入&#xff1a;root [2,1,3] 输出&#xf…

实战篇:一文讲清楚电商平台用户评价分析

01 明确问题 随着电商平台的成熟&#xff0c;如何提升用户体验、提高客户留存率也成为了电商平台关注的重点。而用户评价是最直观地能反应用户体验的指标。用户差评更是其中的重点&#xff0c;通过差评分析&#xff0c;可以寻找到平台目前存在的可能导致用户打出差评的因素&am…

机器学习——特征选择(一)

【说明】文章内容来自《机器学习——基于sklearn》&#xff0c;用于学习记录。若有争议联系删除。 1、简介 特征选择&#xff0c;又称变量选择、属性选择或变量子集选择&#xff0c;是选择相关特征子集用于模型构造的过程。简要地说&#xff0c;通过检测相关特征。摒弃冗余特征…

TransXNet实战:使用 TransXNet实现图像分类任务(二)

文章目录 训练部分导入项目使用的库设置随机因子设置全局参数图像预处理与增强读取数据设置Loss设置模型设置优化器和学习率调整策略设置混合精度&#xff0c;DP多卡&#xff0c;EMA定义训练和验证函数训练函数验证函数调用训练和验证方法 运行以及结果查看测试完整的代码 在上…

脉冲水表作用有哪些?

脉冲水表是一种新型的水表&#xff0c;它通过检测水流量并发送脉冲信号来计量用水量。与传统的机械水表相比&#xff0c;脉冲水表具有许多优势和作用。 首先&#xff0c;脉冲水表具有高精度和可靠性。传统的机械水表在长期使用过程中会因磨损而导致计量不准确&#xff0c;而脉冲…

【强化学习】Deep Q Learning

Deep Q Learning 在前两篇文章中&#xff0c;我们发现RL模型的目标是基于观察空间 (observations) 和最大化奖励和 (maximumize sum rewards) 的。 如果我们能够拟合出一个函数 (function) 来解决上述问题&#xff0c;那就可以避免存储一个 (在Double Q-Learning中甚至是两个…

Redis介绍与使用

1、Nosql 1.1 数据存储的发展 1.1.1 只使用Mysql 以前的网站访问量不大&#xff0c;单个数据库是完全够用的。 但是随着互联网的发展&#xff0c;就出现了很多的问题&#xff1a; 数据量太大&#xff0c;服务器放不下 访问量太大&#xff0c;服务器也承受不了 1.1.2 缓存…

STL stack练习

CSTL之stack栈容器 - 数据结构教程 - C语言网CSTL之stack栈容器1.再谈栈回顾一下之前所学的栈&#xff0c;栈是一种先进后出的数据结构&#xff0c;而实现方式需要创建多个结构体&#xff0c;通过链式的方式进行实现&#xff0c;这是标准的栈的思路&#xff0c;而在STL中栈可以…
最新文章