您的位置:首页 > 其它

短网址ShortUrl的算法

2016-01-21 15:38 99 查看
场景:

我们在新浪微博上发布网址的时候,微博会自动判别网址,并将其转换,例如:http://t.cn/hrYnr0。为什么要这样做的,原因我想有这样几点:

1、微博限制字数为140字一条,那么如果我们需要发一些连接上去,但是这个连接非常的长,以至于将近要占用我们内容的一半篇幅,这肯定是不能被允许的,所以短网址应运而生了。

2、短网址可以在我们项目里可以很好的对开放级URL进行管理。有一部分网址可以会涵盖性、暴力、广告等信息,这样我们可以通过用户的举报,完全管理这个连接将不出现在我们的应用中,应为同样的URL通过加密算法之后,得到的地址是一样的。

3、我们可以对一系列的网址进行流量,点击等统计,挖掘出大多数用户的关注点,这样有利于我们对项目的后续工作更好的作出决策。

下面先来看看短网址映射算法的理论(网上找到的资料)

① 将长网址用md5算法生成32位签名串,分为4段,,每段8个字符;

② 对这4段循环处理,取每段的8个字符, 将他看成16进制字符串与0x3fffffff(30位1)的位与操作,超过30位的忽略处理;

③ 将每段得到的这30位又分成6段,每5位的数字作为字母表的索引取得特定字符,依次进行获得6位字符串;

④ 这样一个md5字符串可以获得4个6位串,取里面的任意一个就可作为这个长url的短url地址。

很简单的理论,我们并不一定说得到的URL是唯一的,但是我们能够取出4组URL,这样几乎不会出现太大的重复。

三、 跳转原理

当我们生成短链接之后,只需要在表中(数据库或者NoSql )存储原始链接与短链接的映射关系即可。当我们访问短链接时,只需要从映射关系中找到原始链接,即可跳转到原始链接。

Java代码




import util.Encript;



public class ShortUrl {

public static void main(String[] args) {

String url = "http://www.sunchis.com";

for (String string : ShortText(url)) {

print(string);

}

}



public static String[] ShortText(String string){

String key = "XuLiang"; //自定义生成MD5加密字符串前的混合KEY

String[] chars = new String[]{ //要使用生成URL的字符

"a","b","c","d","e","f","g","h",

"i","j","k","l","m","n","o","p",

"q","r","s","t","u","v","w","x",

"y","z","0","1","2","3","4","5",

"6","7","8","9","A","B","C","D",

"E","F","G","H","I","J","K","L",

"M","N","O","P","Q","R","S","T",

"U","V","W","X","Y","Z"

};



String hex = Encript.md5(key + string);

int hexLen = hex.length();

int subHexLen = hexLen / 8;

String[] ShortStr = new String[4];



for (int i = 0; i < subHexLen; i++) {

String outChars = "";

int j = i + 1;

String subHex = hex.substring(i * 8, j * 8);

long idx = Long.valueOf("3FFFFFFF", 16) & Long.valueOf(subHex, 16);



for (int k = 0; k < 6; k++) {

int index = (int) (Long.valueOf("0000003D", 16) & idx);

outChars += chars[index];

idx = idx >> 5;

}

ShortStr[i] = outChars;

}



return ShortStr;

}



private static void print(Object messagr){

System.out.println(messagr);

}

}

Java代码


public class Encript {

//十六进制下数字到字符的映射数组

private final static String[] hexDigits = {"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"};



/**把inputString加密*/

public static String md5(String inputStr){

return encodeByMD5(inputStr);

}



/**

* 验证输入的密码是否正确

* @param password 真正的密码(加密后的真密码)

* @param inputString 输入的字符串

* @return 验证结果,boolean类型

*/

public static boolean authenticatePassword(String password,String inputString){

if(password.equals(encodeByMD5(inputString))){

return true;

}else{

return false;

}

}



/**对字符串进行MD5编码*/

private static String encodeByMD5(String originString){

if (originString!=null) {

try {

//创建具有指定算法名称的信息摘要

MessageDigest md5 = MessageDigest.getInstance("MD5");

//使用指定的字节数组对摘要进行最后更新,然后完成摘要计算

byte[] results = md5.digest(originString.getBytes());

//将得到的字节数组变成字符串返回

String result = byteArrayToHexString(results);

return result;

} catch (Exception e) {

e.printStackTrace();

}

}

return null;

}



/**

* 轮换字节数组为十六进制字符串

* @param b 字节数组

* @return 十六进制字符串

*/

private static String byteArrayToHexString(byte[] b){

StringBuffer resultSb = new StringBuffer();

for(int i=0;i<b.length;i++){

resultSb.append(byteToHexString(b[i]));

}

return resultSb.toString();

}



//将一个字节转化成十六进制形式的字符串

private static String byteToHexString(byte b){

int n = b;

if(n<0)

n=256+n;

int d1 = n/16;

int d2 = n%16;

return hexDigits[d1] + hexDigits[d2];

}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: