R文件下所有数据读取与文本字符处理
2017-11-01 14:00
337 查看
#清楚环境变量
rm(list = ls())
#加载所需要的包
library(tidyr)
library(dplyr)
library(data.table)
library(readr)
library(readxl)
library(rJava)
library(xlsxjars)
library(xlsx)
library(devtools)
library(stringr)
#设置路径
setwd('C:\\Users\\Administrator\\Desktop\\crawl\\phonebind')
#显示路径下所有文件
dir()
#读入文件
test1 <- read.csv(dir()[1])
num1 =length(dir())
for(i in 2:num1){
test2 <- read.csv(dir()[i])
test1 <- rbind(test1,test2)
}
test3 <- read.csv('C:\\Users\\Administrator\\Desktop\\crawl\\binddata\\phone.csv')
test <- rbind(test1,test3)
result <- data.frame(test$phone)
write.csv(result,'山东村委电话.csv')
num2 <- nrow(test1)
#读取第一个文件,转化为data.frame格式
data1 <- strsplit(test1$phone[1],split = '\n\n')
data1 <- data.frame(data1)
colnames(data1) <- c('phone')
#进行for循环用\n\n进行分割
for(i in 2:num2){
data2 <- strsplit(test1$phone[i],split = '\n\n')
data2 <- data.frame(data2)
colnames(data2) <- c('phone')
data1 <- rbind(data1,data2)
}
#转化为字符型
data1$phone <- as.character(data1$phone)
#模糊匹配
result <- data1$phone[which(grepl(pattern = '0',data1$phone))]
#转化为data.frame格式
result <- data.frame(result)
#重新赋值列名
colnames(result) <- c('phone')
write.csv(result,'phone.csv')
rm(list = ls())
#加载所需要的包
library(tidyr)
library(dplyr)
library(data.table)
library(readr)
library(readxl)
library(rJava)
library(xlsxjars)
library(xlsx)
library(devtools)
library(stringr)
#设置路径
setwd('C:\\Users\\Administrator\\Desktop\\crawl\\phonebind')
#显示路径下所有文件
dir()
#读入文件
test1 <- read.csv(dir()[1])
num1 =length(dir())
for(i in 2:num1){
test2 <- read.csv(dir()[i])
test1 <- rbind(test1,test2)
}
test3 <- read.csv('C:\\Users\\Administrator\\Desktop\\crawl\\binddata\\phone.csv')
test <- rbind(test1,test3)
result <- data.frame(test$phone)
write.csv(result,'山东村委电话.csv')
num2 <- nrow(test1)
#读取第一个文件,转化为data.frame格式
data1 <- strsplit(test1$phone[1],split = '\n\n')
data1 <- data.frame(data1)
colnames(data1) <- c('phone')
#进行for循环用\n\n进行分割
for(i in 2:num2){
data2 <- strsplit(test1$phone[i],split = '\n\n')
data2 <- data.frame(data2)
colnames(data2) <- c('phone')
data1 <- rbind(data1,data2)
}
#转化为字符型
data1$phone <- as.character(data1$phone)
#模糊匹配
result <- data1$phone[which(grepl(pattern = '0',data1$phone))]
#转化为data.frame格式
result <- data.frame(result)
#重新赋值列名
colnames(result) <- c('phone')
write.csv(result,'phone.csv')
相关文章推荐
- 如何处理ODBC中EXCEL驱动读取EXCEL文件中字段长度大于255字符时出现的"数据截断"问题.
- 如何处理Oledb中EXCEL驱动读取EXCEL文件中字段长度大于255字符时出现的"数据截断"问题.
- 读取某个文件夹下的所有文件并读取文件中的文本数据
- 处理EXCEL驱动读取EXCEL文件中字段长度大于255字符时出现的数据截断
- matlab处理txt文本文件---数据格式要有规律性,否则要用编写特定方式进行读取
- json文件中的特殊字符处理,放置json数据读取产生错误
- MATLAB处理txt文本文件---数据格式要有规律性,否则要用编写特定方式进行读取
- 获得(读取)一个文件内的所有数据的字节总数
- 使用Java程序一次分段读取所有数据(如海量数据)并计数处理
- 用JAVA处理文本与二进制数据混合大文件
- Python 读取键盘输入字符,多线程操作,文件操作随机处理 开发范例
- 自定义字符输入流的包装类,通过这个包装类对底层字符输入流进行包装,让程序通过这个包装类读取某个文本文件(例如,一个java源文件)时,能够在读取的每行前面都加上有行号和冒号。
- Java读取、写入、处理Excel文件中的数据
- ArrayList集合中的字符串数据存储到文本文件|文本文件中读取数据到集合
- phpExcel 读取数据,大数据文件处理方案
- ZOJ 1099这道题如果从文件中读取数据,最关键的地方是处理好空格,按时我一直没有成功,所以这道题中没有使用文件
- 使用OLEDB方式读取Excel文件到DataTable中数据类型的处理
- 第十七周 项目6.5 读取文件中数据并处理
- 把当前文件中的所有文本拷贝,存入一个txt文件,统计每个字符出现的次数并输出例如: a: 21 次 b: 15 次 c:: 15 次 把: 7 次 当: 9 次 前: 3 次
- 流实现低内存下读取大量数据和处理并存储大文件