有关csv格式的数据转换成libsvm格式的数据
2017-05-13 23:13
447 查看
需要传入一个pandas的DataFrame格式的数据,将其转换为libsvm格式的数据
代码如下
代码如下
# -*- coding: utf-8 -*- """ Created on Sat May 13 21:50:03 2017 @author: Administrator """ import pandas as pd import time def df2ffm(df, fp): ''' Convert pandas.DataFrame to data format that libffm can directly use @Args: df: pandas.DataFrame to be converted fp: save libffm format data to fp<filepath> ''' now = time.time() print('Format Converting begin in time:...',now) columns = df.columns.values d = len(columns) feature_index = [i for i in range(d)] field_index = [0]*d field = [] for col in columns: field.append(col.split('_')[0]) index = -1 for i in range(d): if i==0 or field[i]!=field[i-1]: index+=1 field_index[i] = index with open(fp, 'w') as f: for row in df.values: line =str(int(row[0])) for i in range(1, len(row)): if row[i]!=0: line += " %d:%d" % (feature_index[i], row[i]) line+='\n' f.write(line) print('finish convert,the cost time is ',time.time()-now) print('[Done]') print() def main(): df = pd.read_csv(r'E:\tencent\input\train1.csv') df = df.fillna(0) fp = r'E:\tencent\output\train.csv' df2ffm(df,fp) if __name__ == '__main__': main()
相关文章推荐
- 把HDFS里的json数据转换成csv格式
- 读取csv文件转换成你自己想要格式的数据
- php导出csv格式数据并将数字转换成文本的思路以及代码分享
- 利用python将json数据转换为csv格式
- 利用python将json数据转换为csv格式的方法
- 数据预处理--数据格式csv、arff等之间的转换
- Weka中数据挖掘与机器学习系列之数据格式ARFF和CSV文件格式之间的转换(五)
- 使用python开发json、csv数据格式转换工具
- 如何把数据转换成libsvm可以接受的数据格式
- 把HDFS里的json数据转换成csv格式
- 我写的采用csv格式将数据转换为excel的函数,带有分栏功能_delphi教程
- python解决数据预处理:将KDDCPU99数据格式转换成libsvm可读的格式
- libsvm——数据格式的转换及使用
- 如何将matlab数据转换成libsvm格式文件
- .mat,.txt,.csv 数据转换为weka中的arff格式及matlab和Weka之间相互转换格式
- php导出csv格式数据并将数字转换成文本的思路以及代码分享
- php导出csv格式数据,以及将数字转换成文本解决办法
- 采用csv格式将数据转换为excel的函数,带有分栏功能
- 我写的采用csv格式将数据转换为excel的函数,带有分栏
- 使用python开发json、csv数据格式转换工具