微博缩短网址是如何实现的
2014-12-16 20:48
337 查看
由于微博字数限制,网址缩短被普遍使用。加上网址缩短服务提供商提供网址追踪等服务,这一业务日渐兴起。知名网址缩短服务商Bit.ly的主要业务便是为微博Twitter提供网址缩短服务。
比如sina微博的sinaurl.cn,腾讯微博的url.cn等。 实现原理很简单,主要是将用户提交的 url 地址转化成一个唯一的字串,这个字串就对应着真实的
url,怎么样实现这种转换呢? 数据库只有两个字段seq(自增长数字)和url(数字的url地址,建立索引)。 用户输入一个url地址,查询表是否包含此url,如果存在,则返回seq的数字, 如果不存在,则插入数据库,得到一个新增加的自增seq数字,为了缩短数字占用的字符数,我们可以把abc等字母的大小写用上。这样10个数字,26个小写字母,26个大小字母就组成了一个62进制了。比如数字10000000000(100亿)转换后就是aUKYOA,只有6位了,这样就能缩短很多的网址了。
得到缩短的网址以后,怎样实现网址的转发呢?可以利用 ttserver,将缩短网缩字串当作key,真实的 url 地址当作
value,存入ttserver中。ttserver本身就提供 http 访问,只需要稍加修改就可以直接利用 ttserver
进行缩短网址的转发: 在 ttserver 源码目录下找到 ttserver.c 这个文件,这里我用的是 tokyotyrant-1.1.39 ,跳到第
2981 行,将下面的几行改成图中所示: 保存退出,编译安装 ttserver,网上有很多安装教程,可以参考。 启动 ttserver,并向里面写入一条 key 为
aaaaaa,value为 http://www.baidu.com 的值。
http 还支持删除、修改、插入数据(当然也可以修改 ttserver 的 http
访问入口,屏蔽掉这几种操作)。负载均衡方面,可以通过添加多条 A 记录随机转发到不同的 ttserver
机器上,但这样每台机器上存放的数据必须相同,网上也有说过ttserver
存过千万左右的数据以后不太稳定。 利用 nginx 就能很好解决直接用 ttserver 的问题,用 nginx 过滤掉 http 访问 ttserver
的删除、修改、插入的操作,并为多台 ttserver 提供反向代理的功能。如下图所示: 安装 nginx,我这里采用的是 nginx-0.8.36.tar.gz。安装 nginx 请参考:http://blog.s135.com/nginx_php_v6。转至:http://www.codesky.net/article/201103/161590.html
比如sina微博的sinaurl.cn,腾讯微博的url.cn等。 实现原理很简单,主要是将用户提交的 url 地址转化成一个唯一的字串,这个字串就对应着真实的
url,怎么样实现这种转换呢? 数据库只有两个字段seq(自增长数字)和url(数字的url地址,建立索引)。 用户输入一个url地址,查询表是否包含此url,如果存在,则返回seq的数字, 如果不存在,则插入数据库,得到一个新增加的自增seq数字,为了缩短数字占用的字符数,我们可以把abc等字母的大小写用上。这样10个数字,26个小写字母,26个大小字母就组成了一个62进制了。比如数字10000000000(100亿)转换后就是aUKYOA,只有6位了,这样就能缩短很多的网址了。
得到缩短的网址以后,怎样实现网址的转发呢?可以利用 ttserver,将缩短网缩字串当作key,真实的 url 地址当作
value,存入ttserver中。ttserver本身就提供 http 访问,只需要稍加修改就可以直接利用 ttserver
进行缩短网址的转发: 在 ttserver 源码目录下找到 ttserver.c 这个文件,这里我用的是 tokyotyrant-1.1.39 ,跳到第
2981 行,将下面的几行改成图中所示: 保存退出,编译安装 ttserver,网上有很多安装教程,可以参考。 启动 ttserver,并向里面写入一条 key 为
aaaaaa,value为 http://www.baidu.com 的值。
curl -X PUT http://127.0.0.10:11221/aaaaaa -d "http://www.baidu.com"主要目的是用 http 访问 ttserver 时直接取得到真实的 url 并做转发。这样做很方便,但不安全,ttserver 的
http 还支持删除、修改、插入数据(当然也可以修改 ttserver 的 http
访问入口,屏蔽掉这几种操作)。负载均衡方面,可以通过添加多条 A 记录随机转发到不同的 ttserver
机器上,但这样每台机器上存放的数据必须相同,网上也有说过ttserver
存过千万左右的数据以后不太稳定。 利用 nginx 就能很好解决直接用 ttserver 的问题,用 nginx 过滤掉 http 访问 ttserver
的删除、修改、插入的操作,并为多台 ttserver 提供反向代理的功能。如下图所示: 安装 nginx,我这里采用的是 nginx-0.8.36.tar.gz。安装 nginx 请参考:http://blog.s135.com/nginx_php_v6。转至:http://www.codesky.net/article/201103/161590.html
相关文章推荐
- 微博缩短网址的实现
- 微博缩短网址的实现
- 关于如何使用 “最短的URL缩短网址 http://to/”
- iOS 像微博中可以点击连接、#text#、@somebody是如何做的,该怎样实现?
- PHP如何实现网址伪静态
- PHP如何实现网址伪静态
- 如何用Java实现利用搜索引擎收集网址的程序
- 微博URL短网址生成算法原理及(java版、php版实现实例)
- 微博和知乎中的 feed 流是如何实现的?
- C# 实现对微博短网址的重定向还原
- 微博和知乎中的 feed 流是如何实现的
- 如何实现输入网址,获取网址的title标题
- 微博140字,英文算半个字,中文算一个字,如何实现?
- 微博的短url如何实现
- 前端如何用面向对象的方法实现一个微博信息流列表
- 微博的短url如何实现
- 如何在richtextbox里实现网址的超链接,当点击该网址时就会打开网站
- JAVA实现网址缩短
- PHP如何实现网址伪静态(转)
- 微博转发的内容如何实现点击人名跳转到个人主页