您的位置:首页 > 大数据

关于建设微型大数据知识库应用系统的计划

2013-03-19 11:20 736 查看
海量的电子书资料经过数字化识别,建立索引之后,存放在硬盘中,通过网站查询接口向网络用户公开,这算是一个大数据的应用吧

然后最关键的地方是,一套人工智能系统要链接到这个知识库上面,把用户的查询信息经过分析,然后提取知识库数据,向用户输出最终信息,这就不仅仅是一个查询的过程,而是一个对问题进行分析和综合判断,并同时查询相关知识数据的综合过程。。。。。

但是难度最大的是如果把海量的电子书资料数字化,很多电子书都是手工扫描版的,要识别为可索引的文字版本的DOC文档,量非常大,手工搞,速度太慢了。。。哎。。。郁闷啊

准备还是自己DIY一台磁盘阵列机,硬盘就用N个2T的机械磁盘,其它零部件用二手货,最大限度的降低成本。。。自筹资金搞实验就是这样的。。。比不过大公司和有预算的实验室。。。。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: