云存储及其余数据处理相关项目

这本书相对来说还算相比新,是从英文版翻译过来的。英文版二〇〇九年问世。汉语版二零一零年九月出版。由20篇互相独立的小说结合。每篇讲一个多少处理相关的门类。不涉及具体的技术细节,仅仅是概括表达原理、思路、进程、结果。

一体化来说,阅读起来有些生硬。感觉小编基本都精晓英文版的情致,可是有些地点普通话表明上不够通顺。那在IT业的翻译书中早已算不错的整合了,强过中文过关然而不懂技术的事态。

其中讲数量可视化的稿子有几篇。还都比较有趣。比如第六章“照片档案的地理之美”,说的是U.K.的一个叫作“Geograph”的品类,收集了汪洋的大不列颠及北爱尔兰联合王国的照片及普通用户对照片的标签,小编分析这个标签,并且用图形化的格局把广大解析结果突显出来;第11章“都市数据可视化”,讲的是把警方的非法暴发的数目与地图结合起来,预测犯罪暴发的地方与项目从而提前预防;第12章“Sense.us的统筹”讲以可视化手段分析美利坚合作国150年以来的人头数据,得出许多妙趣横生的下结论;第17章“数据解析:探索形形色色的社会定型”说的是用图形化方法分析一个网站的大度用户互相之间的评介;第19章“赏心悦目的政治数据”同样使用可视化手段分析选举有关数据。

第4章“PNUTShell中的云存储设计”,说的是雅虎的一个云存储的品类PNUTShell的规划思路和优缺点。那一个序列面对的应用关键是交际方面的利用,数据一致性须要不高,可用性、增加性必要很高。因而就对一致性做了一部分捐躯,满意相比高的可用性和伸张性。数据假如最后根据操作顺序执行了连带的操作,最终一致就足以了。每一条数据都记录了版本号,好明白自己执行到丰硕步骤了。每一条记下还需求记录自己是还是不是主备份。写操作要先写主备份然后逐步联合到任何数据库上。要是系统发现用户相比较频仍地写多少只是主备份所在服务器的物理距离与用户的大体距离比较远,就自行把主备份记录转移到距离用户更近的服务器上。假若主备份损坏,系统也会从剩下的数据中甄选最合适的一条做主备份。

第9章“探寻Deep
Web”说的是怎样让追寻引擎自动搜索Form表单。Form表单能够有无穷个组成,这篇小说给出一些基本思路来让寻找引擎判断哪些去接纳下拉列表或者去填写文本框,目标是用尽量少的操作步骤尽量多地收获form表单前边的数据库中的内容。

相关文章