每秒万次查询,PHP实现 IP查询归属地
2014-04-16 18:38
489 查看
这两天接了个任务,描述如下:
建立一套IP查询系统,将IP对应到地区,实现每秒千次以上的查询。
1.MySQL+PHP的方式:
将网上的数据源扒下来,一条一条放到mysql中,然后使用sql语句查询,建立索引,数据库结构
SET FOREIGN_KEY_CHECKS=0;
-- Table structure for
ip_address
DROP TABLE IF EXISTS
ip_address;
CREATE TABLE
ip_address(
idint(11) unsigned NOT NULL AUTO_INCREMENT,
start_ipint(10) unsigned NOT NULL,
end_ipint(10) unsigned NOT NULL,
regionvarchar(50) NOT NULL,
addressvarchar(100) NOT NULL,
PRIMARY KEY (
id),
KEY
start(
start_ip)
USING BTREE,
KEY
end(
end_ip)
) ENGINE=MyISAM AUTO_INCREMENT=405037 DEFAULT CHARSET=utf8;
INSERT INTO ip_address VALUES ('1', '0', '16777215', 'IANA保留地址', 'CZ88.NET');
INSERT INTO ip_address VALUES ('2', '16777216', '16777471', '澳大利亚', 'CZ88.NET');
INSERT INTO ip_address VALUES ('3', '16777472', '16778239', '福建省', '电信');
INSERT INTO ip_address VALUES ('4', '16778240', '16779263', '澳大利亚', 'CZ88.NET');
INSERT INTO ip_address VALUES ('5', '16779264', '16781311', '广东省', '电信');
.......
查询数据的时候使用SELECT * FROM ip_address WHERE ip_startip <= ip AND ip_endip >= ip。
但是无论如何,我都达到不了想要的执行效率,最好的时候每秒查询的数据都超不过30条。
完成不了任务,只好去问问度娘。
2.diszuz中的实现方式:
function convertip_tiny($ip, $ipdatafile) {static $fp = NULL, $offset = array(), $index = NULL; $ipdot = explode('.', $ip); $ip = pack('N', ip2long($ip)); $ipdot[0] = (int)$ipdot[0]; $ipdot[1] = (int)$ipdot[1]; if($fp === NULL && $fp = @fopen($ipdatafile, 'rb')) { $offset = @unpack('Nlen', @fread($fp, 4)); $index = @fread($fp, $offset['len'] - 4); } elseif($fp == FALSE) { return '- Invalid IP data file'; } $length = $offset['len'] - 1028; $start = @unpack('Vlen', $index[$ipdot[0] * 4] . $index[$ipdot[0] * 4 + 1] . $index[$ipdot[0] * 4 + 2] . $index[$ipdot[0] * 4 + 3]); for ($start = $start['len'] * 8 + 1024; $start < $length; $start += 8) { if ($index{$start} . $index{$start + 1} . $index{$start + 2} . $index{$start + 3} >= $ip) { $index_offset = @unpack('Vlen', $index{$start + 4} . $index{$start + 5} . $index{$start + 6} . "\x0"); $index_length = @unpack('Clen', $index{$start + 7}); break; } } @fseek($fp, $offset['len'] + $index_offset['len'] - 1024); if($index_length['len']) { return '- '.@fread($fp, $index_length['len']); } else { return '- Unknown'; }
}
用的是二进制的文件,然后使用折半查找法。效率一下子提高了上来,每秒查询效率稳稳过5000次。哈哈!
3.PHP扩展的方式:
方式和PHP一样的,不过使用了C语言,效率直接超过了50000(五万)次。效率那就不用说了,扩展地址:http://pecl.php.net/package/qqwry
下载后安装方式按照phpize的方式即可
计入安装目录:
./phpize
./configure
make && makeinstall
然后要确保qqwry.so放到扩展目录下,并添加php.ini:
extension=qqwry.so
OK,已经好了
核心代码如下:
static uint32_t search_index(const uint32_t ip,FILE *qqwry_file) { uint32_t index_ip; unsigned char head[8]; unsigned char index_bytes[7]; fread(head,8,1,qqwry_file); uint32_t index_start,index_end,index_mid; index_start = (uint32_t)LE_32(&head[0]); index_end = (uint32_t)LE_32(&head[4]); while (1) { if ((index_end-index_start)==7) { break; } //printf("index:%u:%u\n",index_start,index_end); index_mid=index_end/7 - index_start/7; if (index_mid%2==0) { index_mid=index_mid/2; } else { index_mid=(index_mid+1)/2; } index_mid=index_start+index_mid*7; fseek(qqwry_file,index_mid,SEEK_SET); fread(index_bytes,7,1,qqwry_file); index_ip=(uint32_t)LE_32(&index_bytes[0]); if (index_ip==ip) { break; } else if (index_ip<ip) { index_start=index_mid; } else { index_end=index_mid; } } if (index_ip>ip) { fseek(qqwry_file,index_start,SEEK_SET); fread(index_bytes,7,1,qqwry_file); } return (uint32_t)LE_24(&index_bytes[4]);
}
这也是我目前为止找的效率最快的方式了,完全能够买足公司的需求了。如果有能够效率更高的方式,留个言哈。
所有需要的文件都可以从这里下载哈:
http://url.cn/QorZ2O
下载后把data.rar解压到当前目录,并执行index.php就可以查看后面的两种方式的执行效率了(前提是,有装qqwry扩展哈!)
相关文章推荐
- 数据库链接字符串查询网站
- DB2实例管理
- DB2实例管理
- mysql问答汇集
- 创建一个空的IBM DB2 ECO数据库的方法
- Access 2000 数据库 80 万记录通用快速分页类
- 开通一个数据库失败的原因的和解决办法
- 一个简单的asp数据库操作类
- EasyASP v1.5发布(包含数据库操作类,原clsDbCtrl.asp)第1/2页
- sql2008 还原数据库解决方案
- Oracle 数据库自动存储管理-安装配置
- Oracle 数据库 临时数据的处理方法
- 最近比较流行的数据库挂马
- 重装主控服务器后,数据库连接失败的解决办法:请正确还原数据库。
- 九种防MDB数据库被下载的方法小结
- asp向数据库插入数据的方法rs
- 浅析C# web访问mysql数据库-整理归纳总结
- SQL Server误区30日谈 第9天 数据库文件收缩不会影响性能
- CMD命令操作MSSQL2005数据库(命令整理)