Linux curl命令参数详解--转载
2016-02-03 15:51
585 查看
linux curl是通过url语法在命令行下上传或下载文件的工具软件,它支持http,https,ftp,ftps,telnet等多种协议,常被用来抓取网页和监控Web服务器状态。
一、Linux curl用法举例:
1. linux curl抓取网页:
抓取百度:
如发现乱码,可以使用iconv转码:
iconv的用法请参阅:在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题
2. Linux curl使用代理:
linux curl使用http代理抓取页面:
使用socks代理抓取页面:
代理服务器地址可以从爬虫代理上获取。
3. linux curl处理cookies
接收cookies:
发送cookies:
4. linux curl发送数据:
linux curl get方式提交数据:
linux curl post方式提交数据:
以表单的方式上传文件:
相当于设置form表单的method="POST"和enctype='multipart/form-data'两个属性。
5. linux curl http header处理:
设置http请求头信息:
设置http响应头处理:
6. linux curl认证:
6. 其他:
原文地址:http://www.aiezu.com/system/linux/linux_curl_syntax.html
linux 使用curl小经验教训:
http请求地址的url要使用""括起来。当有存在多个参数使用&连接时可能会出错。
一、Linux curl用法举例:
1. linux curl抓取网页:
抓取百度:
1 | curlhttp://www.baidu.com |
如发现乱码,可以使用iconv转码:
1 | curlhttp://iframe.ip138.com/ic.asp|iconv -fgb2312 |
2. Linux curl使用代理:
linux curl使用http代理抓取页面:
1 2 | curl-x 111.95.243.36:80http://iframe.ip138.com/ic.asp|iconv -fgb2312 curl -x111.95.243.36:80-U aiezu:password http://www.baidu.com |
使用socks代理抓取页面:
1 2 | curl--socks4 202.113.65.229:443http://iframe.ip138.com/ic.asp|iconv -fgb2312 curl --socks5202.113.65.229:443http://iframe.ip138.com/ic.asp|iconv -fgb2312 |
代理服务器地址可以从爬虫代理上获取。
3. linux curl处理cookies
接收cookies:
1 | curl-c /tmp/cookieshttp://www.baidu.com #cookies保存到/tmp/cookies文件 |
发送cookies:
1 2 | curl-b "key1=val1;key2=val2;" http://www.baidu.com #发送cookies文本 curl -b/tmp/cookieshttp://www.baidu.com #从文件中读取cookies |
4. linux curl发送数据:
linux curl get方式提交数据:
1 | curl-G -d "name=value&name2=value2"http://www.baidu.com |
linux curl post方式提交数据:
1 2 | curl-d "name=value&name2=value2" http://www.baidu.com #post数据 curl -da=b&c=d&txt@/tmp/txthttp://www.baidu.com #post文件 |
以表单的方式上传文件:
1 | curl-F file=@/tmp/me.txthttp://www.aiezu.com |
相当于设置form表单的method="POST"和enctype='multipart/form-data'两个属性。
5. linux curl http header处理:
设置http请求头信息:
1 2 3 | curl-A "Mozilla/5.0 Firefox/21.0" http://www.baidu.com #设置http请求头User-Agent curl -e"http://pachong.org/" http://www.baidu.com #设置http请求头Referer curl-H "Connection:keep-alive \n User-Agent: Mozilla/5.0" http://www.aiezu.com |
1 2 | curl-I http://www.aiezu.com #仅仅返回header curl -D/tmp/headerhttp://www.aiezu.com #将http header保存到/tmp/header文件 |
6. linux curl认证:
1 2 | curl-u aiezu:password http://www.aiezu.com #用户名密码认证 curl -Emycert.pem https://www.baidu.com #采用证书认证 |
6. 其他:
1 2 | curl-# http://www.baidu.com #以“#”号输出进度条 curl -o/tmp/aiezuhttp://www.baidu.com #保存http响应到/tmp/aiezu |
原文地址:http://www.aiezu.com/system/linux/linux_curl_syntax.html
linux 使用curl小经验教训:
http请求地址的url要使用""括起来。当有存在多个参数使用&连接时可能会出错。
相关文章推荐
- Linux socket 初步
- Linux Kernel 4.0 RC5 发布!
- linux lsof详解
- linux 文件权限
- Linux 执行数学运算
- 10 篇对初学者和专家都有用的 Linux 命令教程
- Linux 与 Windows 对UNICODE 的处理方式
- Ubuntu12.04下QQ完美走起啊!走起啊!有木有啊!
- 解決Linux下Android开发真机调试设备不被识别问题
- 运维入门
- 运维提升
- Linux 自检和 SystemTap
- Ubuntu Linux使用体验
- c语言实现hashmap(转载)
- Linux 信号signal处理机制
- linux下mysql添加用户
- Scientific Linux 5.5 图形安装教程
- Linux 下无损图片压缩小工具介绍