c语言实现url的编码和解码
2017-05-23 21:33
393 查看
url提交信息为何要转码呢?因为url本身会有很多特殊字符。而提交的参数中如果再有特殊字符的话,url就不能区分哪些是参数内容,哪些是分隔符。尤其是unicode,gb18030,big5等多字节的编码,不知道里面会隐藏什么字节,因此必须全部转码。
更多详情请看:《关于URL编码》
本文代码为从PHP代码中修改而来,只保留了2个函数。
字符’a’-‘z’,’A’-‘Z’,’0’-‘9’,’.’,’-‘,’*’和’_’ 都不被编码,维持原值;
空格’ ‘被转换为加号’+’。
其他每个字节都被表示成”%XY”的格式,X和Y分别代表一个十六进制位。编码为UTF-8。
示例代码:
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
编译运行效果如下:
本文转自:http://blog.csdn.net/langeldep
更多详情请看:《关于URL编码》
本文代码为从PHP代码中修改而来,只保留了2个函数。
字符’a’-‘z’,’A’-‘Z’,’0’-‘9’,’.’,’-‘,’*’和’_’ 都不被编码,维持原值;
空格’ ‘被转换为加号’+’。
其他每个字节都被表示成”%XY”的格式,X和Y分别代表一个十六进制位。编码为UTF-8。
示例代码:
#include <stdio.h> #include <string.h> #define BURSIZE 2048 int hex2dec(char c) { if ('0' <= c && c <= '9') { return c - '0'; } else if ('a' <= c && c <= 'f') { return c - 'a' + 10; } else if ('A' <= c && c <= 'F') { return c - 'A' + 10; } else { return -1; } } char dec2hex(short int c) { if (0 <= c && c <= 9) { return c + '0'; } else if (10 <= c && c <= 15) { return c + 'A' - 10; } else { return -1; } } //编码一个url void urlencode(char url[]) { int i = 0; int len = strlen(url); int res_len = 0; char res[BURSIZE]; for (i = 0; i < len; ++i) { char c = url[i]; if ( ('0' <= c && c <= '9') || ('a' <= c && c <= 'z') || ('A' <= c && c <= 'Z') || c == '/' || c == '.') { res[res_len++] = c; } else { int j = (short int)c; if (j < 0) j += 256; int i1, i0; i1 = j / 16; i0 = j - i1 * 16; res[res_len++] = '%'; res[res_len++] = dec2hex(i1); res[res_len++] = dec2hex(i0); } } res[res_len] = '\0'; strcpy(url, res); } // 解码url void urldecode(char url[]) { int i = 0; int len = strlen(url); int res_len = 0; char res[BURSIZE]; for (i = 0; i < len; ++i) { char c = url[i]; if (c != '%') { res[res_len++] = c; } else { char c1 = url[++i]; char c0 = url[++i]; int num = 0; num = hex2dec(c1) * 16 + hex2dec(c0); res[res_len++] = num; } } res[res_len] = '\0'; strcpy(url, res); } int main(int argc, char *argv[]) { char url[100] = "http://'测试/@mike"; urlencode(url); //编码后 printf("http://'测试/@mike ----> %s\n", url); char buf[100] = "http%3A//%27%E6%B5%8B%E8%AF%95/%40mike"; urldecode(buf); //解码后 printf("http%%3A//%%27%%E6%%B5%%8B%%E8%%AF%%95/%%40mike ----> %s\n", buf); return 0; }1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
编译运行效果如下:
本文转自:http://blog.csdn.net/langeldep
相关文章推荐
- C语言实现url的编码和解码
- JavaScript Base64编码和解码,实现URL参数传递
- base64编码、解码的C语言实现
- base64编码、解码的C语言实现
- Base64编码解码C语言实现
- C语言实现base64编码,base64解码
- C语言实现哈夫曼树、编码、解码及问题总结
- base64编码、解码的C语言实现
- Base64编码解码的实现(C语言)
- javascript 和php 内置实现 url 的编码和解码
- URL编解码C语言实现
- BASE64编码、解码的C语言实现
- base64编码、解码的C语言实现
- base64 编码解码 c语言实现
- base64编码、解码的C语言实现
- JavaScript Base64编码和解码,实现URL参数传递。
- Base64编码解码的实现(C语言)
- base64编码、解码的C语言实现
- JavaScript Base64编码和解码,实现URL参数传递。
- Base64编码解码C语言实现