Привет, ребята. Пытаюсь понять проблему, описанную в книге hbase (раздел 37.3). Интуитивно

понимаю, что большие ключи ведут к большим накладным расходам, но полного понимания нет.
Вопросы:
1. Про какие индексы там идёт речь?
2. Как понять, что storefileIndexSize большой? по сравнению с чем большой? По этой ссылке было такое умозаключение.
3. Какой командой можно получить вывод таких метрик?

15 ответов

25 просмотров

У хбейз ток один индекс - лексикографический (если вопрос в этом); сами индексы (key твоей key/value) могут быть большими оч

Aleksey-Stavrov Автор вопроса

Ага, т.е. там (по ссылке в офицальной книге) имеется ввиду стандартный индекс по rowid (который по факту ввобще не индекс, а упорядоченный по rowid кусок данных)?

это _индекс_; да имеется ввиду ключ строк

Aleksey-Stavrov Автор вопроса

Видимо осталось 2 вопроса. Возможно они про HDFS. Туда я просто вообще ещё не смотрел.

а что за структура под этим индексом B-Tree или какоя то Hash ?

1. Store File Index это структура в памяти которую держит Region Server чтобы знать по каким HFile искать https://github.com/apache/hbase/blob/889049eab666f99bc300c070ced5505d0a59d3c5/hbase-server/src/main/java/org/apache/hadoop/hbase/io/hfile/HFileReaderImpl.java#L245

2. Все относительно, надо смотреть сколько у вас всего в куче, и сколько эти индексы едят 3. Через JMX достают с Region Server

Aleksey-Stavrov Автор вопроса

Спасибо. Стало яснее немножко.

вы напишите какую проблему решаете, может подскажут что-то более опытные коллеги

Aleksey-Stavrov Автор вопроса

Я читаю книгу по порядку и увидел такое, что мой мозг не воспринял. Кажется, что читателя не подготовили к этому, хотя может я невнимателен)

вы хорошо читаете эту книгу) самый важный месседж в этой главе передан верно - лучше чтобы ключи и колонки были маленькие

а почему бы не хранить сразу связку ключа, офсета на диски внутри sstable?

Присылайте PR, люди рассмотрят)

если это не так во многих реализациях, то значит на это есть основания. мне просто интересно. понять эти основания. какие ограничения мешают это сделать. пока видится - что это не работает из-за того, что при слиянии нужно будет обновлять эту структуру и это заблочит читателей

я не уверен что понял ваше предложение, прочитаю после обеда еще раз

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта