coderplay
1/29/2013 - 1:32 AM

Google PowerDrill论文翻译

Google PowerDrill论文翻译

一次鼠标点击,处理万亿条数据

摘要

列存储数据系统已成为业界游戏规则的改变者. 高度定制化和调优的系统让 #引言

背景

贡献

相关工作

基础方法

全扫描和数据跳跃的威力

数据分区

基本数据结构

如何计算一条查询

基础实验

关键优化

将数据分区成块

优化列元素的编码

优化全局字典

通用压缩算法

行的重排序

分布式执行

将数据分布在多台机器

可靠的分布式执行查询

扩展话题

复杂表达式

Count Distinct

其它压缩算法

全局字典的进一步优化

改进的缓存启发

在生产环境的性能

总结

参考文献