click house如何保障数据一致性（ClickHouse性能提升-SQL使用规范）

不够尽兴 2023-06-01 05:27:38

收藏赞分享

click house如何保障数据一致性（ClickHouse性能提升-SQL使用规范）(1)

不要用select *

反例：

select * from app.user_model

正例：

select login_id,name,sex from app.user_model

理由：只查询需要的字段可以减少磁盘io和网络io，提升查询性能

不要在大结果集上构造虚拟列

反例：

select id ,pv, uv , pv/uv rate from app.scene_model

正例：

select id ,pv, uv from app.scene_model

理由：虚拟列非常消耗资源浪费性能，拿到pv uv后在前端显示时构造比率。

不要在唯一列或大基数列上进行分组或去重操作

反例：

select id, count(1) cn from app.user_model group by id

正例：

select id from app.user_model

理由：基数太大会消耗过多的io和内存。

根据需要查询指定范围的数据（where）

反例：

select login_id,name,sex from app.user_model

正例：

select login_id,name,sex from app.user_model where create_time>'2020-03-30'

理由：减少磁盘io和网络io，提升查询性能

关联查询时小表在后（大表 join 小表）

反例：

select login_id,name,sex,a.scene_name from app.scene_model a join app.user_model b on a.create_user=b.id

正例：

select login_id,name,sex,a.scene_name from app.user_model a join app.scene_model b on a.id=b.create_user

理由：无论是Left Join 、Right Join还是Inner Join永远都是拿着右表中的每一条记录到左表中查找该记录是否存在

使用 uniqCombined 替代 distinct

反例：

SELECT count( DISTINCT create_user ) from app.scene_model

正例：

SELECT uniqCombined( create_user ) from app.scene_model

理由：uniqCombined对去重进行了优化，通过近似去重提升十倍查询性能

通过使用 limit 限制返回数据条数

反例：

select id,scene_name,code,pv from app.scene_model order by pv desc

正例：

select id,scene_name,code,pv from app.scene_model order by pv desc limit 100

理由：使用limit返回指定的结果集数量，不会进行向下扫描，大大提升了查询效率

尽量不去使用字符串类型

反例：

CREATE TABLE scene_model ( id String, scene_name String, pv String, create_time String ) ENGINE = <Engine> ...

正例：

CREATE TABLE scene_model ( id String, scene_name String, pv Int32, create_time Date ) ENGINE = <Engine> ...

理由：时间类型最终会转换成数值类型进行处理，数值类型在执行效率和存储上远好过字符串

指定查询分区获取必要的数据

假设分区字段是day反例：

select type,count(1) from app.user_model group by type

正例：

select type,count(1) from app.user_model where day ='2020-03-30' group by type

理由：通过指定分区字段会减少底层数据库扫描的文件数量，提升查询性能

分组前过滤不必要的字段

反例：

select type,count(1) from app.user_model group by type

正例：

select type,count(1) from app.user_model where type ='1' or type ='2' group by type

理由：通过限制分组前结果集数量，查询性能一般能提示数十倍，甚至上百倍。

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

秒懂生活

click house如何保障数据一致性（ClickHouse性能提升-SQL使用规范）

猜您喜欢

孔尚任的桃花扇是元杂剧吗（清代孔尚任名作桃花扇登上粤剧舞台）

赵冬苓编剧厉害吗（赵冬苓打造民国桃花扇）

进口车vs国产车（王丹凤力荐冯喆出演桃花扇）

松岛菜菜子身材照（红遍亚洲的松岛菜菜子）

豆干怎么做好吃又简单不辣（豆干这样做真香）

三七粉山楂粉丹参粉能降低压高吗（三七粉丹参粉山楂粉）

余罪细思极恐细节（余罪妖孽的不行）

热门推荐

排行榜