数据存储模式变换:给定任意正整数得到Excel的列头
2018-02-13 16:12
176 查看
最近公司给了一批数据,excel格式存储,列头是这样的(字段名简化):
通过excel表头可知, 这批数据其实只有25个字段(c1, c2, ....., c52), 只不过是每个字段后面加上了日期(2014, 2015, 2016, 2017)。 因此打算把这批数据导入数据库前先做一下预处理,转换成以下字段格式:
想要得到以上结果,具体步骤如下(一些处理的具体细节不赘述)
1)读取列头,获取字段映射表 :原始字段名 --> 新字段名(去掉日期);
2)由步骤1得到新字段名的dict,为每一个新字段名分配一个excel的列标,如A, B, C,......;
3)根据1和2将原始字段名的excel列标映射到新的列标;
4)遍历原始原始数据的每一行,然后根据3将原始值存放到指定excel列位置。
关键是步骤2的实现,即将问题简化为:给定任意自然数得到Excel的列头,以下是我使用python语言实现代码:alphabet = [chr(x) for x in range(ord('A'), ord('Z') + 1)]
def generate_excel_col_index(num):
if num < 1:
print('输入提示:输入值必须大于1')
return None
else:
dividend = int(num) # 被除数
remainder = 26 if int(dividend % 26) == 0 else int(dividend % 26) # 余数
ls = [remainder]
dividend -= remainder
x = 1
flag = True
while dividend > 0 and flag:
quotient = int(dividend/26**x)
if quotient <= 26:
ls.append(quotient)
flag = False
else:
quotient = 26 if quotient % 26 == 0 else quotient % 26
ls.append(quotient)
dividend -= quotient * (26 ** x)
x += 1
str_ls = [alphabet[y-1] for y in ls]
result = ''.join(str_ls)[::-1]
return result给定任意一个正整数,得到excel列头的测试结果为:if __name__ == '__main__':
x = 1352
col = generate_excel_col_index(x)
print("{0} 转换为excel列头为 {1} ".format(x, col))
D:\Programs\Python\Python35\python.exe D:/pyWorkSpace/demo.py
1352 转换为excel列头为 AYZ
id | c1_2014 | c1_2015 | c1_2016 | c1_2017 | c2_2014 | c2_2015 | c2_2016 | c2_2017 | ...... | c52_2014 | c52_2015 | c52_2016 | c52_2017 |
01 | a11 | a12 | a13 | a14 | b11 | b12 | b13 | b14 | ..... | x11 | x12 | x13 | x14 |
02 | a21 | a22 | a23 | a24 | b21 | b22 | b23 | b24 | ...... | x21 | x22 | x23 | x24 |
id | year | c1 | c2 | ...... | c52 |
01 | 2014 | a11 | b11 | ...... | x11 |
01 | 2015 | a12 | b12 | ...... | x12 |
01 | 2016 | a13 | b13 | ...... | x13 |
01 | 2017 | a14 | b14 | ...... | x14 |
02 | 2014 | a21 | b21 | ...... | x21 |
02 | 2015 | a22 | b22 | ...... | x22 |
02 | 2016 | a23 | b23 | ...... | x23 |
02 | 2017 | a24 | b24 | ...... | x24 |
1)读取列头,获取字段映射表 :原始字段名 --> 新字段名(去掉日期);
2)由步骤1得到新字段名的dict,为每一个新字段名分配一个excel的列标,如A, B, C,......;
3)根据1和2将原始字段名的excel列标映射到新的列标;
4)遍历原始原始数据的每一行,然后根据3将原始值存放到指定excel列位置。
关键是步骤2的实现,即将问题简化为:给定任意自然数得到Excel的列头,以下是我使用python语言实现代码:alphabet = [chr(x) for x in range(ord('A'), ord('Z') + 1)]
def generate_excel_col_index(num):
if num < 1:
print('输入提示:输入值必须大于1')
return None
else:
dividend = int(num) # 被除数
remainder = 26 if int(dividend % 26) == 0 else int(dividend % 26) # 余数
ls = [remainder]
dividend -= remainder
x = 1
flag = True
while dividend > 0 and flag:
quotient = int(dividend/26**x)
if quotient <= 26:
ls.append(quotient)
flag = False
else:
quotient = 26 if quotient % 26 == 0 else quotient % 26
ls.append(quotient)
dividend -= quotient * (26 ** x)
x += 1
str_ls = [alphabet[y-1] for y in ls]
result = ''.join(str_ls)[::-1]
return result给定任意一个正整数,得到excel列头的测试结果为:if __name__ == '__main__':
x = 1352
col = generate_excel_col_index(x)
print("{0} 转换为excel列头为 {1} ".format(x, col))
D:\Programs\Python\Python35\python.exe D:/pyWorkSpace/demo.py
1352 转换为excel列头为 AYZ
相关文章推荐
- Greenplum 清理垃圾、修改存储模式(行列变换) 平滑方法 - 交换数据、交互分区
- Scrapy爬虫系列笔记之六:使用item以及对得到的数据进行存储以及处理_by_书訢
- 对于一个整数矩阵,存在一种运算,对矩阵中任意元素加一时,需要其相邻(上下左右),某一个元素也加一,现给出一正数矩阵,判断其是否能够由一个全零矩阵经过上述运算得到。
- 算法实战:给定一个带通配符问号的数W,问号可以代表任意一个一位数字。 再给定一个整数X,和W具有同样的长度。 问有多少个整数符合W的形式并且比X大?
- 导出数据库任意表数据为EXCEL
- [vba]excel中求选中数据和为给定数所有的组合
- 给定你任意正整数,请你输出这个正整数的二进制表示中有几个1。
- Android中使用SharedPreferences进行数据存储及文件操作模式
- 胖子哥的大数据之路(二)- 大数据结构化数据存储应用模式
- 吞噬大数据存储领域新机制——NoSQL模式解析
- Hive的数据存储模式
- BlogEngine.Net架构与源代码分析系列part3:数据存储——基于Provider模式的实现
- 给定一堆整数数据,你的工作是:执行尽可能少的删除操作,并使剩下的数据以升序排列(只做删除操作,不作排序)
- 任意给定一个大于等于10的整数A,请写一程序,以最小的时间复杂度找出比A小并且最接近A的一个整数B。要求:A的每位之和与B的每位之和相等 例:如果A=123 那么B=114
- mysql Field xxx doesn't have a default value STRICT_TRANS_TABLES(存储引擎启用严格模式,非法数据值被拒绝)
- 对于一个整数矩阵,存在一种运算,对矩阵中任意元素加一时,需要其相邻(上下左右),某一个元素也加一,现给出一正数矩阵,判断其是否能够由一个全零矩阵经过上述运算得到。
- 输出输入的任意整数的二进制存储形式
- 一种整数数据压缩存储的算法实现
- 导出数据库任意表数据为EXCEL
- 让你彻底明白hive数据存储各种模式