当前位置：首页 > news >正文

R语言【base】——scan()：读取数据值

news 来源：原创 2024/5/10 1:13:21

Package base version 4.2.0

Description

从控制台或文件中读取数据到向量或列表中。

Usage

scan(file = "", what = double(), nmax = -1, n = -1, sep = "",quote = if(identical(sep, "\n")) "" else "'\"", dec = ".",skip = 0, nlines = 0, na.strings = "NA",flush = FALSE, fill = FALSE, strip.white = FALSE,quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE,comment.char = "", allowEscapes = FALSE,fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

Argumens

参数【file】：要从中读取数据值的文件的名称。如果指定的文件为""，则从键盘获取输入(或者如果重定向输入或嵌入R，则从stdin()读取)。(在这种情况下，输入可以通过空行或EOF信号来终止，在Unix上是' Ctrl-D '，在Windows上是' Ctrl-Z '。)

否则，文件名将相对于当前工作目录(由getwd()给出)进行解释，除非它指定了绝对路径。在支持的地方执行波浪扩展。当从脚本运行R时，file = "stdin"可用于引用进程的stdin文件流。

这可以是一个压缩文件。

或者，file可以是一个连接，它将在必要时打开，如果需要，则在函数调用结束时关闭。无论以何种模式打开连接，LF、CRLF或CR中的任何一个都将被接受为一行的EOL标记，因此将匹配sep = "\n"。

文件也可以是一个完整的URL。(有关支持的URL方案，请参阅URL帮助的' URLs '部分。)

要读取非当前编码的数据文件(例如UTF-8区域设置中的Latin-1文件或相反)，请使用文件连接设置其编码参数(或scan的fileEncoding参数)。

参数【what】：给出了要读取的数据的类型。(这里的type是typeof的意思。)支持的类型有逻辑类型、整数类型、数字类型、复杂类型、字符类型、原始类型和列表类型。如果what是一个列表，则假定数据文件的每行都是包含长度(what)项(' fields ')的记录，并且列表组件的元素应该是列出的前六种(原子)类型之一或NULL，请参阅下面的' Details '部分。

参数【nmax】：要读取的数据值的最大数量，或者如果是列表，则要读取的记录的最大数量。如果省略或不为正数或整数的值无效(并且nlines未设置为正数)，scan将读取到文件的末尾。

参数【n】：整数:读取数据值的最大个数，默认为不限制。无效值将被忽略。

参数【sep】：默认情况下，scan期望读取“空白”分隔的输入字段。或者，sep可用于指定分隔字段的字符。除非用引号括起来，否则字段总是用行结束标记分隔。如果指定，则应该是空字符串(默认值)或NULL或仅包含一个单字节字符的字符串。

参数【quote】：引用字符的集合作为单个字符串或NULL。在多字节区域设置中，引号字符必须是ASCII(单字节)。

参数【dec】：小数点字符。这应该是一个只包含一个单字节字符的字符串。(NULL和零长度字符向量也可以接受，并作为默认值。)

参数【skip】：在开始读取数据值之前要跳过的输入文件的行数。

参数【nlines】：如果为正数，则表示要读取的最大数据行数。

参数【na.strings】：特征向量。这个向量的元素被解释为缺失(NA)值。空白字段也被认为是逻辑、整数、数字和复杂字段中的缺失值。请注意，测试发生在从输入中删除空白之后，所以na.strings值可能需要预先去掉它们自己的空白。

参数【flush】：逻辑值。如果为TRUE，则scan将在读取请求的最后一个字段后刷新到行尾。这允许在最后一个字段后面放置注释，但禁止在一行中放置多个记录。

参数【fill】：逻辑值。如果为TRUE, scan将隐式地向字段少于what所暗示的任何行添加空字段。

参数【strip.white】：与what实参中的项相对应的逻辑值向量。它仅在指定sep时使用，并允许从字符字段中剥离前导和尾随的“空白”(数字字段总是被剥离)。注意:引号内的空格不会被去掉。如果strip.white长度为1，适用于所有字段；;否则，strip.white[i]为TRUE，并且第i个字段是模式字符(因为[i]是)，那么字段i的前导和尾部未引号的空白将被剥离。

参数【quiet】：逻辑值。如果FALSE(默认值)，scan()将打印一行，表示读取了多少项。

参数【blank.lines.skip】：逻辑值。如果为TRUE，输入中的空行将被忽略，除非对跳过和行进行计数。

参数【multi.line】：逻辑值。仅当what是列表时使用。如果为FALSE，则所有记录必须出现在一行上(但多条记录可以出现在一行上)。注意，使用fill = TRUE意味着记录将在一行的末尾终止。

参数【comment.char】：字符值。长度为1的字符向量，包含单个字符或空字符串。使用""完全关闭注释的解释(默认值)。

参数【allowEscapes】：逻辑值。c风格的转义如' \n '应该被处理(默认)还是逐字读取?请注意，如果不在引号内，则可以将其解释为分隔符(而不是注释字符)。被解释的转义是控制字符' \a， \b， \f， \n， \r， \t，\v '和八进制和十六进制表示，如' \040 '和' \0x2A '。任何其他转义字符都被视为其本身，包括反斜杠。请注意，Unicode转义(以' \u '或' \U '开头:请参阅引号)永远不会被处理。

参数【fileEncoding】：字符串。If non-empty声明文件(不是连接也不是键盘)上使用的编码，因此字符数据可以重新编码。请参阅文件帮助的“编码”部分，以及“R数据导入/导出手册”。

参数【encoding】：为输入字符串假定的编码。如果值为"latin1"或"UTF-8"，则用于将字符串标记为已知的Latin-1或UTF-8:它不用于重新编码输入(参见fileEncoding)。另见“详细信息”。

参数【text】：字符串。如果没有提供file，则通过文本连接从text的值读取数据。

参数【skipNul】：逻辑值。在读取字符字段时应该跳过空值吗?