您的位置:首页 > 编程语言 > PHP开发

【函数应用】PHP中关于URL的函数处理

2017-09-16 04:00 435 查看

一,函数介绍

1.解析HTTP头信息:get_header()

array get_headers ( string 目标URL [, int $format = 0 【如果将可选的 [code]format
参数设为 1,则 get_headers() 会解析相应的信息并设定数组的键名】] )[/code]

返回包含有服务器响应一个 HTTP 请求所发送标头的索引或关联数组,如果失败则返回
FALSE


相似的还有

apache_request_headers(void) 返回包含当前Apache请求所有头信息的数组,失败返回
FALSE


apache_response_headers(void)成功时返回包含全部 Apache 响应头信息的数组, 或者在失败时返回
FALSE
.

2.解释meta标签:get_meta_tags()

array get_meta_tags ( string $filename [, bool $use_include_path = false ] )


参数:

filename


  HTML 文件的路径字符串。 此参数可以是本地文件也可以是一个 URL。

use_include_path


  将
use_include_path
设置为
TRUE
将使 PHP 尝试按照 include_path 标准包含路径中的每个指向去打开文件。这只用于本地文件,不适用于 URL。

打开
filename
逐行解析文件中的 <meta> 标签。解析工作将在 </head> 处停止。

返回一个数组,包含所有解析过的 meta 标签。

返回的关联数组以属性 name 的值作为键,属性 content 的值作为值,所以你可以很容易地使用标准数组函数遍历此关联数组或访问某个值。 属性 name 中的特殊字符将使用‘_’替换,而其它字符则转换成小写。如果有两个 meta 标签拥有相同的 name,则只返回最后出现的那一个。

3.生成URL请求字符串:http_build_query()

string http_build_query ( mixed $query_data [, string $numeric_prefix [, string $arg_separator [, int $enc_type = PHP_QUERY_RFC1738 ]]] )


参数:

query_data


  可以是数组或包含属性的对象。

  一个
query_data
数组可以是简单的一维结构,也可以是由数组组成的数组(其依次可以包含其它数组)。

  如果
query_data
是一个对象,只有 public 的属性会加入结果。

numeric_prefix


  如果在基础数组中使用了数字下标同时给出了该参数,此参数值将会作为基础数组中的数字下标元素的前缀。

  这是为了让 PHP 或其它 CGI 程序在稍后对数据进行解码时获取合法的变量名。

arg_separator


  除非指定并使用了这个参数,否则会用 arg_separator.output 来分隔参数。

enc_type


  默认使用
PHP_QUERY_RFC1738


  如果
enc_type
PHP_QUERY_RFC1738
,则编码将会以 » RFC 1738 标准和 application/x-www-form-urlencoded 媒体类型进行编码,空格会被编码成加号(+)。

  如果
enc_type
PHP_QUERY_RFC3986
,将根据 » RFC 3986 编码,空格会被百分号编码(%20)。

返回:

  返回一个 URL 编码后的字符串。

例:

<?php
$data = array(
'mother','father','son',
'foo'=>'bar',
'baz'=>'boom',
'cow'=>'milk',
'php'=>'hypertext processor',
'user'=>array(
'name'=>'bob',
'age'=>17,
'class'=>'one'
)
);

$query=http_build_query($data);
parse_str($query,$arr);
var_dump($arr);

/*
输出
array (size=8)
0 => string 'mother' (length=6)
1 => string 'father' (length=6)
2 => string 'son' (length=3)
'foo' => string 'bar' (length=3)
'baz' => string 'boom' (length=4)
'cow' => string 'milk' (length=4)
'php' => string 'hypertext processor' (length=19)
'user' =>
array (size=3)
'name' => string 'bob' (length=3)
'age' => string '17' (length=2)
'class' => string 'one' (length=3)
*/


View Code

6.URL参数字符串编码,解码:urlencode(),urldecode()

string urlencode ( string $str )


此函数便于将字符串编码并将其用于 URL 的请求部分,同时它还便于将变量传递给下一页。

返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 » RFC3896 编码(参见 rawurlencode())不同。

string urldecode ( string $str )


解码给出的已编码字符串中的任何 %##。 加号('+')被解码成一个空格字符。

返回解码后的字符串。

注意改函数仅用于对URL请求参数部分进行编解码。

7.URL参数字符串编码,解码:rawurlencode(),rawurldecode()

string rawurlencode ( string $str )


根据 » RFC 3986 编码指定的字符。

返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数。这是在 » RFC 3986 中描述的编码,是为了保护原义字符以免其被解释为特殊的 URL 定界符,同时保护 URL 格式以免其被传输媒体(像一些邮件系统)使用字符转换时弄乱。

string rawurldecode ( string $str )


返回字符串,此字符串中百分号(%)后跟两位十六进制数的序列都将被替换成原义字符。

rawurldecode() 不会把加号('+')解码为空格,而 urldecode() 可以。

8.获取文件路径信息:pathinfo()

mixed pathinfo ( string $path [, int $options = PATHINFO_DIRNAME | PATHINFO_BASENAME | PATHINFO_EXTENSION | PATHINFO_FILENAME ] )


pathinfo() 返回一个关联数组包含有 path 的信息。返回关联数组还是字符串取决于
options


参数:

path


  要解析的路径。

options


  如果指定了,将会返回指定元素;它们包括:
PATHINFO_DIRNAME
PATHINFO_BASENAME
PATHINFO_EXTENSION
PATHINFO_FILENAME


  如果没有指定
options
默认是返回全部的单元。

返回:

  如果没有传入
options
,将会返回包括以下单元的数组 array:dirname,basename 和 extension(如果有),以 及filename。如果有,则返回options所指定的值

相似的还有:

  dirname()返回文件路径目录部分,相当于pathinfo(path,PATHINFO_DIRNAME)

  basename()返回路径中文件名部分,相当于pathinfo(path,PATHINFO_BASENAME)

二,实践应用

1.获取URL中的参数

例:http://www.baidu.com/index.php?m=content&c=index&a=lists&catid=6&area=0&author=九把刀&h=嘿嘿嘿'


解决方法:

//第一种:切割字符串
function params($url)
{
$p=[];
$urls=explode('?',$url);
$params=str_replace('&&','&',$urls[1]);
$params_arr=explode('&',$params);
foreach($params as $param)
{
$_v=explode('=',$param);
$p[$_v[0]]=$_v[1];
}
return $p;
}


//第二种:使用正则匹配
function params($url)
{
$p=[];
preg_match_all('/([^\=\?\&]+)\=([^&$]+)/',$url,$matches);

foreach($matches[1] as $k=>$v)
{
$p[$matches[1][$k]]=$matches[2][$k];
}
return $p;
}


//第三种,使用parse_url配合parse_str,最简便
function params($url)
{
$query=parse_url($url,PHP_URL_QUERY);
//或parse_url($url)['query']
parse_str($query,$p);
return $p;
}


2,将HTML文档中的<img src="/images/1.jpg">替换为绝对路径,根目录http://www.pic.com

解决:

$newdoc=preg_replace_callback('/<img[\s\S]+src\s*=\s*[\'\"](\/[^\'\"]+)[\'\"]/',function($m){

if(empty(parse_url($m[1],PHP_URL_HOST)))
{
$newsrc='http://www.pic.com/'.ltrim($m[1],'/');
return str_replace($m[1],$newsrc,$m[0]);
}

},$html);


3.获取url中的文件扩展名

解决:

//方法一:exlode分隔
function getextension1($url)
{
$slice=explode('.',$url);
return $slice[count($slice)-1];
}


//方法二:substr分隔字符串,strrpos获取字符串最后一个位置
function getextension2($url)
{
return substr($url,strrpos($url,'.')+1);
}


对于标准的URL,则需要忽略请求url中的参数字符串

//方法三:使用parse_url获取标准URL中的文件扩展名
function getextension3($url)
{
$path=parse_url($url,PHP_URL_PATH);
return substr($path,strrpos($path,'.')+1);
}
//或方法四:
function getextension4($url)
{
$path=parse_url($url,PHP_URL_PATH);
$basename=basename($path);
return explode('.',$basename)[1];
}


对于如下的URL,很容易看出方法一二和三四的区别

http://image.baidu.com/search/down.php?tn=download&word=download&ie=utf8&fr=detail&url=http%3A%2F%2Fa.ikafan.com%2Fattachment%2Fforum%2F201307%2F10%2F064752oxbjxuhuiw0bfxrp.jpg&thumburl=http%3A%2F%2Fc.hiphotos.baidu.com%2Fimage%2Fh%253D220%2Fsign%3D01eff8eaf6039245beb5e60db794a4a8%2F4b90f603738da977fb33880cba51f8198618e3fd.jpg


未完...
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: