国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

Apache Doris的Bitmap索引和BloomFilter索引使用及注意事項

瀏覽:120日期:2023-03-07 14:40:47
目錄
  • 1. Bitmap索引的使用
    • 1.1 Bitmap索引介紹
    • 1.2 Bitmap索引使用的注意事項
    • 1.3 Bitmap索引的使用
  • 2. BloomFilter索引
    • 2.1 BloomFilter索引介紹
    • 2.2 BloomFilter原理
    • 2.3 BloomFilter索引的使用
    • 2.4 Doris BloomFilter使用場景
    • 2.5 Doris BloomFilter使用注意事項

1. Bitmap索引的使用

1.1 Bitmap索引介紹

bitmap index是一種位圖索引,是一種快速數(shù)據(jù)結(jié)構(gòu),能夠加快查詢速度

1.2 Bitmap索引使用的注意事項

使用限制

  • 目前索引僅支持bitmap類型的索引
  • bitmap索引僅在單列上創(chuàng)建
  • bitmap索引能夠應用在Duplicate、Uniq數(shù)據(jù)模型的所有列和Aggregate模型的key列上
  • bitmap索引僅在Segment V2儲存格式下生效。當創(chuàng)建index時,表的存儲格式將默認轉(zhuǎn)換為V2格式

bitmap索引支持的數(shù)據(jù)類型:

  • TINYINT
  • SMALLINT
  • INT
  • UNSIGNEDINT
  • BIGINT
  • CHAR
  • VARCHAR
  • DATE
  • DATETIME
  • LARGEINT
  • DECIMAL
  • BOOL

1.3 Bitmap索引的使用

創(chuàng)建索引

mysql> create index if not exists click_bitmap_index on test_db.click (user_id) using bitmap comment "bitmap index test";Query OK, 0 rows affected (0.05 sec)mysql> 

查看索引

mysql> show index from test_db.click;+-------------------------------+------------+--------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+-------------------+| Table | Non_unique | Key_name   | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment   |+-------------------------------+------------+--------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+-------------------+| default_cluster:test_db.click |    | click_bitmap_index |      | user_id     |   |     |  ||      | BITMAP     | bitmap index test |+-------------------------------+------------+--------------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+-------------------+1 row in set (0.04 sec)mysql> 

刪除索引

mysql> drop index if exists click_bitmap_index on test_db.click;Query OK, 0 rows affected (0.03 sec)mysql> 

2. BloomFilter索引

2.1 BloomFilter索引介紹

是一種多哈希函數(shù)映射的快速查找算法,本質(zhì)上是一種位圖結(jié)構(gòu)。通常應用在一些需要快速判斷某個元素是否屬于集合,但是并不嚴格要求100%正確的場合,因為BloomFilter會告訴調(diào)用者一個元素存在或不存在一個集合。但存在不一定準確

2.2 BloomFilter原理

實際上是由一個超長的二進制位數(shù)組和一系列的哈希函數(shù)組成。二進制位數(shù)組初始全部為0,當給定一個元素時,這個元素會被一系列哈希函數(shù)計算映射出一系列的值,所有的值在位數(shù)組的偏移量處置為1。而對于一個待查詢的元素,也會用相同的哈希函數(shù)映射到位數(shù)組上,只要有一個哈希函數(shù)映射沒有命中之前的元素的偏移量,則不存在于集合中

下圖所示出一個m=18, k=3(m是該Bit數(shù)組的大小,k是Hash函數(shù)的個數(shù))的Bloom Filter示例。集合中的x、y、z三個元素通過3個不同的哈希函數(shù)散列到位數(shù)組中。當查詢元素w時,通過Hash函數(shù)計算之后因為有一個比特為0,因此w不在該集合中

BloomFilter索引也是以Block為粒度創(chuàng)建的。每個Block中,指定列的值作為一個集合生成一個BloomFilter索引條目,用于在查詢是快速過濾不滿足條件的數(shù)據(jù)

2.3 BloomFilter索引的使用

創(chuàng)建表使用BloomFilter索引

mysql> create table order_tb(    -> user_id bigint,    -> order_date date,    -> city varchar(32),    -> url varchar(512)    -> ) distributed by hash(user_id, city) buckets 8    -> properties(    -> "bloom_filter_columns"="user_id,order_date"    -> );Query OK, 0 rows affected (0.07 sec)mysql> 

查看BloomFilter索引

mysql> show create table order_tb;

刪除BloomFilter索引

mysql> alter table test_db.order_tb set ("bloom_filter_columns" = "");Query OK, 0 rows affected (0.05 sec)mysql>

修改BloomFilter索引

mysql> alter table test_db.order_tb set ("bloom_filter_columns" = "user_id,city");Query OK, 0 rows affected (0.05 sec)mysql> 

2.4 Doris BloomFilter使用場景

  • 首先BloomFilter適用于非前綴過濾
  • 查詢會根據(jù)該列高頻過濾,而且查詢條件大多是in和=過濾
  • 不同于Bitmap, BloomFilter適用于高基數(shù)列。比如UserID。因為如果創(chuàng)建在低基數(shù)的列上,比如”性別“列,則每個Block幾乎都會包含所有取值,導致BloomFilter索引失去意義

2.5 Doris BloomFilter使用注意事項

  • 不支持對Tinyint、Float、Double 類型的列建Bloom Filter索引
  • Bloom Filter索引只對in和=過濾查詢有加速效果
  • 如果要查看某個查詢是否命中了Bloom Filter索引,可以通過查詢的Profile信息查看

到此這篇關于Apache Doris的Bitmap索引和BloomFilter索引使用的文章就介紹到這了,更多相關Apache Doris索引內(nèi)容請搜索以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持!

標簽: Linux Apache
主站蜘蛛池模板: 青岛市| 老河口市| 原平市| 监利县| 洪湖市| 西昌市| 无锡市| 镇沅| 苏尼特右旗| 平潭县| 温州市| 安远县| 中宁县| 泰来县| 贞丰县| 若羌县| 汽车| 长治市| 浦县| 宝清县| 晋中市| 元氏县| 托克托县| 安顺市| 麟游县| 米林县| 宜兰县| 邯郸市| 宣威市| 图们市| 马尔康县| 宁武县| 蓝山县| 新余市| 信宜市| 盐亭县| 洛浦县| 孟连| 丹巴县| 景泰县| 阿荣旗|