Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火-

01 七月

星期三, 01 七月 2020 23:00 Last Updated on 星期三, 01 七月 2020 23:00 0 Comments

大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客主页：https://buwenbuhuo.blog.csdn.net/

此篇为大家带来的是一文教你如何在Phoenix中创建 HBase 二级索引。

一. HBase 的二级索引

在前面的学习中, 我们知道 HBase 只能通过 rowkey 进行搜索, 一般把 rowkey 称作一级索引. 在很长的一段时间里 HBase 就只支持一级索引.
HBase 里面只有 rowkey 作为一级索引，如果要对库里的非 rowkey 字段进行数据检索和查询，往往要通过 MapReduce/Spark 等分布式计算框架进行，硬件资源消耗和时间延迟都会比较高。
为了 HBase 的数据查询更高效、适应更多的场景，诸如使用非 rowkey 字段检索也能做到秒级响应，或者支持各个字段进行模糊查询和多字段组合查询等，因此需要在 HBase 上面构建二级索引，以满足现实中更复杂多样的业务需求。
从 0.94 版本开始, HBase 开始支持二级索引.
HBase 索引有多种放方案, 我们今天要做的是使用 Phoenix 给 HBase 添加二级索引.

二. 配置 HBase 支持 Phoenix 创建二级索引

需要先给 HBase 配置支持创建二级索引

1. 添加如下配置到 HBase 的 Hregionerver 节点的 hbase-site.xml

[bigdata@hadoop002 conf]$ vim hbase-site.xml   <!-- phoenix regionserver 配置参数 --> <property> <name>hbase.regionserver.wal.codec</name> <value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value> </property> <property> <name>hbase.region.server.rpc.scheduler.factory.class</name> <value>org.apache.hadoop.hbase.ipc.PhoenixRpcSchedulerFactory</value> <description>Factory to create the Phoenix RPC Scheduler that uses separate queues for index and metadata updates</description> </property> <property> <name>hbase.rpc.controllerfactory.class</name> <value>org.apache.hadoop.hbase.ipc.controller.ServerRpcControllerFactory</value> <description>Factory to create the Phoenix RPC Scheduler that uses separate queues for index and metadata updates</description> </property>

2. 添加如下配置到 HBase 的 Hmaster 节点的 hbase-site.xml

<!-- phoenix master 配置参数 --> <property> <name>hbase.master.loadbalancer.class</name> <value>org.apache.phoenix.hbase.index.balancer.IndexLoadBalancer</value> </property> <property> <name>hbase.coprocessor.master.classes</name> <value>org.apache.phoenix.hbase.index.master.IndexMasterObserver</value> </property>

3. 测试是否支持
准备数据:

create table user_1(id varchar primary key, name varchar, addr varchar)  upsert into user_1 values ('1', 'zs', 'beijing'); upsert into user_1 values ('2', 'lisi', 'shanghai'); upsert into user_1 values ('3', 'ww', 'sz');

默认情况下, 只要 rowkey 支持索引(就是上面的 id)
Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火-
其他字段是不支持索引的:

给 name 字段添加索引:

create index idx_user_1 on user_1(name)

Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火-

注意: 这种索引, 对 name 创建的索引, 则查询的时候也必须只查询 name 字段.

三. Phoenix 创建索引

1. Phoenix 索引分类

Phoenix 索引分全局索引和局部索引

1. 全局索引

global index 是默认的索引格式。
适用于多读少写的业务场景。写数据的时候会消耗大量开销，因为索引表也要更新，而索引表是分布在不同的数据节点上的，跨节点的数据传输带来了较大的性能消耗。
在读数据的时候 Phoenix 会选择索引表来降低查询消耗的时间。
如果想查询的字段不是索引字段的话索引表不会被使用，也就是说不会带来查询速度的提升。
创建全局索引的方法:

CREATE INDEX my_index ON my_table (my_col)

2.局部索引

local index 适用于写操作频繁的场景。索引数据和数据表的数据是存放在相同的服务器中的，避免了在写操作的时候往不同服务器的索引表中写索引带来的额外开销。
查询的字段不是索引字段索引表也会被使用，这会带来查询速度的提升。
创建局部索引的方法(相比全局索引多了一个关键字 local):

CREATE LOCAL INDEX my_index ON my_table (my_index)

Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火-

3. Local index 和 Global index区别：

Local index 由于是数据与索引在同一服务器上，所以要查询的数据在哪台服务器的哪个region是无法定位的，只能先找到region然后再利用索引。
Global index 是一种分布式索引，可以直接利用索引定位服务器和region，速度更快，但是由于分布式的原因，数据一旦出现新增变化，分布式的索引要进行跨服务的同步操作，带来大量的通信消耗。所以在写操作频繁的字段上不适合建立Global index。

2. 创建索引总结

1. 创建全局索引, 也支持查询其他字段

CREATE INDEX my_index ON my_table (v1) INCLUDE (v2)  SELECT v2 FROM my_table WHERE v1 = 'foo'

2. 创建局部索引

CREATE LOCAL INDEX my_index ON my_table (v1)

3. 删除索引

DROP INDEX my_index ON my_table

本次的就到这里了,

Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火-

好书不厌读百回，熟读课思子自知。而我想要成为全场最靓的仔，就必须坚持通过学习来获取更多知识，用知识改变命运，用博客见证成长，用行动证明我在努力。
如果我的博客对你有帮助、如果你喜欢我的博客内容，请“” “评论”“”一键三连哦！听说的人运气不会太差，每一天都会元气满满呦！如果实在要白嫖的话，那祝你开心每一天，欢迎常来我博客看看。
码字不易，大家的支持就是我坚持下去的动力。后不要忘了关注我哦！

Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火-

展开阅读全文

36
评论 32
x
海报

扫一扫，海报
手机看

到微信朋友圈

x

扫一扫，手机阅读
- 打赏
打赏

不温卜火

“你的鼓励将是我创作的最大动力”

5C币 10C币 20C币 50C币 100C币 200C币

确定
关注

大数据与数据仓库入门到精通

09-20

本课程以CDH作为大数据平台，详细介绍CDH平台各个组件在生产环境的应用及开发，并结合实际的业务场景，离线数仓，实时数仓，构建企业核心的数据架构。在实际的工作当中，大数据架构，运维或者开发人员会与多个公司团队合作，ETL团队，爬虫团队，算法团队，运营团队等等，指导大家如何与个个团队打交道，提升工作效率。减少团队之间不愉快的沟通。希望学习者最好从事过数据库相关工作，有一些 JAVA开发基础，或者有其他工作经验，想学习大数据及数据仓库的同学，对于没有工作经验，或者对开发，数据完全小白的同学，建议先了解相关知识再学习。本课程的宗旨只有一条，任何学习完本课程的同学，都能熟悉企业主流的数据架构，都有能力维护一个中等HADOOP集群，也就是1P左右的数据的集群或者多个集群。

不温卜火

06-29 Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火- 1079

Phoenix快速入门系列(2) | 一文教你如何使用Phoenix

此篇为大家带来的是一文教你如何使用Phoenix。目录一. Phoenix 表操作二. Phoenix 表映射1. Phoenix 表和 HBase 表的关系2 准备工作3. 视图映射4. 表映射5. 视图映射和表映射的对比与总结一. Phoenix 表操作 1. 显示所有表!tables# 或者!table 2 创建表CREATE TABLE IF NOT EXISTS us_population ( state CHAR(2) NOT NULL, …

本页所有内容来自官方网站 https://www.imapbox.com 新闻来源：互联网搜索引擎和新闻站

本网页所有图片由 ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片，下载并得到。

ImageBox 图片批量下载器工具地址: 网页图片批量下载工具-最新版本下载

非凡下载站地址：https://www.crsky.com/soft/35838.html

本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器下载并得到。

ImovieBox网页视频下载器下载地址: ImovieBox网页视频下载器-最新版本下载

本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.

阅读和此文章类似的: 全球云计算

Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火-

目录

一. HBase 的二级索引

二. 配置 HBase 支持 Phoenix 创建二级索引

三. Phoenix 创建索引

1. Phoenix 索引分类

2. 创建索引总结

大数据与数据仓库入门到精通

Phoenix快速入门系列(2) | 一文教你如何使用Phoenix

文章目录

近期文章

官方链接

关于我们

软件产品

事业方向

联系我们

ImapBox Technology Research Group

Phoenix快速入门系列(3) | 一文教你如何在Phoenix中创建 HBase 二级索引不温卜火-

目录

一. HBase 的二级索引

二. 配置 HBase 支持 Phoenix 创建二级索引

三. Phoenix 创建索引

1. Phoenix 索引分类

2. 创建索引总结

大数据与数据仓库入门到精通

Phoenix快速入门系列(2) | 一文教你如何使用Phoenix

文章目录

近期文章

官方链接

关于我们

软件产品

事业方向

联系我们

ImapBox Technology Research Group

登录