您的位置:首页 > 数据库

2011数据库技术大会印象与笔记

2011-04-17 23:06 357 查看
数据库技术大会(http://dtcc.it168.com/)是IT168等媒体主办的一个数据库方面的技术人员的会议。今年是第二届。去年第一届,时间与清明节假期冲突,我没参加。今年时间上有了改进,没有与小长假冲突,时间是4月15,16两天,分别是周五周六。

会议地点是永泰福朋喜来登酒店,具体位置在西四环内侧四海桥与四季青桥之间,交通还算方便,附近不算太拥堵。第一天租了三个会议室。第二天改成了两个。我估计参会人数有500-800之间。招来了几家卖书的摆了书摊。

两天的会我都参加了。以下是一些印象与笔记。

先说一点总体印象:国内做IT应用水平最高的是淘宝、阿里、百度、新浪这些互联网老大们的技术人员。他们的业务需求没有现成的软件产品可以满足,只能自己去做,他们需要解决的问题在国内是最复杂、最难处理的、最没有先例可循的。接下来是给银行电信金融等大佬做项目的人员,面对的问题也比较复杂比较难处理,经常需要给这些行业定制开发一些产品。再下来是垄断行业的技术人员,有厂家给他们现成的方案供选择。

第一场讲百度数据库架构(主要应用是百度知道和百度贴吧)(http://tech.it168.com/a2011/0415/1178/000001178522.shtml),第二场讲新浪微博数据库架构(http://tech.it168.com/a2011/0415/1178/000001178546.shtml)。百度的数据库架构经历了三个阶段:分散式、集中式和分布式。新浪也经历了三个阶段:MySQL+MemCache,MySQL+UDF,Cache按冷热度分两层。
个人感觉两家面对的问题大致相同,但是新浪微博更复杂,因为百度知道和百度贴吧相对来说更容易拆分。新浪微博由于用户间有复杂的关系,根本没法按用户去拆分。实际上新浪的做法是有多个可读的从库,每个从库的拆分方法不一定相同,比如可能有一个从库是按用户拆的,另外一个从库是按主题拆的。基本思路是把索引当作不同的拆分标准(这个解决思路一笔带过,参会的人不一定注意到、意识到)。

上午剩下两场演讲印象不深。

下午听SQL Server专场。第一讲“SQL Server 探秘”,演讲者非常重视日志,认为不了解日志就是把SQL Server当Excel Access使用。
最后两场圆桌会议,快结束的时候有演讲者说了些很有意思的话题:工行与建行的技术的比较。工行的技术人员并非个个都是高手,大部分也都是普通技术人员,技术人员的水平并不比建行强,但是工行的技术,就是比建行强。强在严格执行管理制度,包括:上线时间非常严格(每季度一次),技术人员对bug负责(与占收入一半的年底奖金直接挂钩),DBA严格执行修改数据的规范,轻易不同意业务部门直接改数据库中数据的请求,因而数据质量比较高。

第二天上午听商业智能专场。第一场和第三场不错。第一场“阿里巴巴:海量数据分析平台”,介绍了阿里巴巴的数据挖掘平台的一些情况,我觉得不错,挺有收获。有个小插曲:会后主持人说时间紧张,只给一个提问机会,有一个小姑娘问数据挖掘是不是侵犯隐私。演讲者居然跟她来回问答了几个回合。我觉得这个问题完全不应该在这个会场来讨论。演讲者没意识到他在这个方面不是专家,在这个会上讨论这个问题是耽误大家时间。

第三场“国内电信领域数据仓库建设与应用实践”,演讲者有不少电信业数据仓库项目的实施经验,基本是项目经验介绍,讲的比较快。也值得一听。

下午的演讲中觉得不错的是第一场“随需应变的云数据库架构与设计”,演讲者李强是华为首席DBA,讲了许多华为数据库设计方面的组织体系、流程、工具。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: