【R笔记】R语言中的字符串处理函数
2016-03-23 11:00
169 查看
内容概览
尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要。从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高。R语言提供了很多字符串操作函数,本文仅简要以下几种常用的字符串函数。
字符串分割函数:strsplit( )
字符串连接函数:paste( )
计算字符串长度:nchar( )
字符串截取函数:substr( )及substring( )
字符串替换函数:chartr( )
大小写转换函数:toupper( )、tolower( )及casefold( )
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105909636-515370021.png)
paste( )函数用于字符串连接,其中sep 负责两组字符串间的连接;collapse 负责一组字符串内部的连接。
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105912823-521732225.png)
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105916151-1723387930.png)
substr( )函数:必须设置参数start和stop,如果缺少将出错。
substring( )函数:可以只设置first参数,last参数若不设置,则默认为1000000L,通常是指字符串的最大长度。
例子如下:
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105920479-215275268.png)
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105925526-1402473900.png)
其中参数old 表示原有字符串中内容;new 表示替换后的字符内容。
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105927917-1522638631.png)
tolower( )函数:将字符串统一转换为小写。
casefold( )函数:根据参数转换大小写。
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105930808-244820476.png)
温馨提示
本节只是为了说明每个函数的功能,所采用的调用形式都非常简单,通常省略了许多可选参数,请动手查找R的帮助文档获取更多技术细节!
来源: http://www.08kan.com/gwk/MzA3NDUxMjYzMA/208917055/3/32388af7b85aea0dfc89bfd959bbf433.html
来自为知笔记(Wiz)
尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串同样极为重要。从医疗研究数据里的出生日期到文本挖掘的应用,字符串数据在R程序中使用的频率非常高。R语言提供了很多字符串操作函数,本文仅简要以下几种常用的字符串函数。
字符串分割函数:strsplit( )
字符串连接函数:paste( )
计算字符串长度:nchar( )
字符串截取函数:substr( )及substring( )
字符串替换函数:chartr( )
大小写转换函数:toupper( )、tolower( )及casefold( )
字符串分割函数:strsplit( )
strsplit( )函数用于字符串分割,其中split 是分割参数。所得结果以默认以list形式展示。![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105909636-515370021.png)
字符串连接函数:paste( )
主要参数:paste(..., sep = " ", collapse = NULL)paste( )函数用于字符串连接,其中sep 负责两组字符串间的连接;collapse 负责一组字符串内部的连接。
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105912823-521732225.png)
计算字符串长度:nchar( )
nchar( )返回字符串的长度。![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105916151-1723387930.png)
字符串截取函数:substr( );substring( )
substr( )函数和substring( )函数是截取字符串最常用的函数,两个函数功能方面是一样的,只是其中参数设置不同。substr( )函数:必须设置参数start和stop,如果缺少将出错。
substring( )函数:可以只设置first参数,last参数若不设置,则默认为1000000L,通常是指字符串的最大长度。
例子如下:
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105920479-215275268.png)
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105925526-1402473900.png)
字符串替换函数:chartr( )
chartr( )函数:将原有字符串中特定字符替换成所需要的字符。其中参数old 表示原有字符串中内容;new 表示替换后的字符内容。
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105927917-1522638631.png)
大小写替换函数:toupper( )、tolower( )、casefold( )
toupper( )函数:将字符串统一转换为大写。tolower( )函数:将字符串统一转换为小写。
casefold( )函数:根据参数转换大小写。
![](http://images2015.cnblogs.com/blog/782100/201603/782100-20160323105930808-244820476.png)
温馨提示
本节只是为了说明每个函数的功能,所采用的调用形式都非常简单,通常省略了许多可选参数,请动手查找R的帮助文档获取更多技术细节!
来源: http://www.08kan.com/gwk/MzA3NDUxMjYzMA/208917055/3/32388af7b85aea0dfc89bfd959bbf433.html
来自为知笔记(Wiz)
相关文章推荐
- mousedos网络批量部署xp
- nagios–配置文件
- Lync通讯录重新同步解决搜不到人问题
- snort.conf--中文注释
- HOOK API
- 各种菜单
- JavaScript学习笔记之数组随机排序
- linux 下VSFTP 530 Permission denied错误的解决方法
- Problem C
- JAVA深入研究——Method的Invoke方法。
- rabbitMQ 介绍
- 思博伦测试接口方法
- 欢迎使用CSDN-markdown编辑器
- beatifulsoup windows下 乱码问题解决方案
- 还原SQLServer镜像数据库库普通数据库
- 效果插件网站收集
- 【R笔记】apply函数族
- DBscan算法及其Python实现
- iOS开发——UIImageView
- JVM参数配置大全