Всем привет, народ Может кто-то обьяснить в какой ситуации нужно

Question

Всем привет, народ Может кто-то обьяснить в какой ситуации нужно

строить кластерные индексы, а в какой некластерные?
Их отличия я знаю, но что-то непонятно пока для меня когда какие использовать

#database #dba #it #russian #software

0

11.03.2021

31 ответов

51 просмотр

Ваня Автор вопроса

Anatoly Shirokov
ну давай на примере. есть районы города. твоя сист...

То есть в такой ситуации кластерный индекс имеет выигрыш перед некластерным, верно?

0

11.03.2021

Anatoly Shirokov

Ваня
То есть в такой ситуации кластерный индекс имеет в...

в такой ситуации записи локализуются физически по указанному тобой в индексе полю, как бы кластерный индекс разделяет множество твоих данных на физические корзины

0

11.03.2021

Ваня Автор вопроса

Anatoly Shirokov
ну давай на примере. есть районы города. твоя сист...

и если рассмотреть ситуацию, что город - Москва и у нас районы добавляются просто постоянно ? тогда какой из индексов покажет себя лучше?

0

11.03.2021

Yaroslav Schekin

А СУБД-то какая, на всякий случай (вдруг не MS SQL)?

0

11.03.2021

Ваня Автор вопроса

Yaroslav Schekin
А СУБД-то какая, на всякий случай (вдруг не MS SQL...

MS)

0

11.03.2021

Yaroslav Schekin

Ваня
MS)

Ну так там clustered index — это knee-jerk reaction best practice по умолчанию, если я правильно помню. ;) Можно и "наколоться", конечно — https://use-the-index-luke.com/blog/2014-01/unreasonable-defaults-primary-key-clustering-key И я подобные случаи видел на практике, кстати.

0

11.03.2021

Ваня Автор вопроса

Yaroslav Schekin
Ну так там clustered index — это knee-jerk reactio...

то есть я правильно понял что комбинировать кластерные индексы и обычные в одной таблице - это не самый лучший подход?

0

11.03.2021

Yaroslav Schekin

Ваня
то есть я правильно понял что комбинировать класте...

В смысле "индексы"? "Кластерный индекс" только один, а остальное зависит от ситуации — я же про это и дал ссылку.

0

11.03.2021

Ilya Zviagin

ТУПО: для PK - кластерный, для всего остального — нет. СОВСЕМ ТУПО: не знаешь, какой индекс делать кластерным — делай все некластерными. ПО-УМНОМУ: если надо делать большие range scan -ы по индексу — делай его кластерным. Но повезёт только один раз...

0

11.03.2021

Ilya Zviagin

Ваня
То есть в такой ситуации кластерный индекс имеет в...

Кластерный перед некластерным вообще имеет очень маленький выигрышь, хотя и имеет конечно, но у него есть один существенный недостаток (у кластерного) - он в таблице может быть ТОЛЬКО ОДИН.

0

11.03.2021

Ваня Автор вопроса

Ilya Zviagin
ТУПО: для PK - кластерный, для всего остального — ...

Хорошо, а если представим ситуацию такую Вот есть у нас мессенджер, есть какая-то таблица сообщений с 10 миллионами записей Мы зафигачили кластер-индекс по диалогу например К примеру у нас есть диалог с миллионом записей - то есть какая-то выборка по нему будет все равно не очень быстрая И мне например надо там еще выбирать по каким-то свойствам сообщения с этого диалога (по каким сложно придумать, но пусть этих свойств еще будет 3) Стоит ли строить некластерный индекс по этим полям в такой ситуации?

0

11.03.2021

Ilya Zviagin

Yaroslav Schekin
А СУБД-то какая, на всякий случай (вдруг не MS SQL...

А сейчас уже почти всё равно... очень расхожая схема сейчас у многих СУБД — кластерный PK

0

11.03.2021

Ilya Zviagin

Ваня
Хорошо, а если представим ситуацию такую Вот есть...

Стоит ли строить (некластерный) индекс по этим полям в такой ситуации? — это вообще другой, совершенно отдельный вопрос. НИКАК не связанный с предыдущим вопросом.

0

11.03.2021

Ilya Zviagin

Ваня
Хорошо, а если представим ситуацию такую Вот есть...

Судя по всему, тебе подойдёт, на твоём уровне понимания, пункт "ТУПО" , тем более, что SQLServer

0

11.03.2021

Alexander E

Ваня
Хорошо, а если представим ситуацию такую Вот есть...

Там в диалогах текст Идексы текста работают по другому Наверняка этот индекс будет отдельным столбцом в таблице Или типа того Вроде

0

11.03.2021

Yaroslav Schekin

Ilya Zviagin
ТУПО: для PK - кластерный, для всего остального — ...

И вот ровно с таким подходом (на уровне коленного рефлекса) я и видел ситуации (суть которых описана по ссылке), когда "умница"-консультант или DBA, глядя на heap-таблицу с десятком индексов, говорил "ну что же вы, это же плохая практика! Срочно переделать!"... и после внедрения "улучшения" производительность падала в разы. ;) Так что лучше думать, если ситуация такая, когда это может иметь значение, вот в чём был мой посыл.

0

11.03.2021

Ваня Автор вопроса

Alexander E
Там в диалогах текст Идексы текста работают по д...

я имею ввиду не по тексту выборку делаем, а по каким-то абстрактным свойствам ну, например, какое сообщение не прочитано и так далее, это вообще не важно сложно придумать просто свойства сообщений)

0

11.03.2021

Ilya Zviagin

Yaroslav Schekin
И вот ровно с таким подходом (на уровне коленного ...

Так это был наверное консультант по SQLServer...

0

11.03.2021

Ilya Zviagin

Yaroslav Schekin
И вот ровно с таким подходом (на уровне коленного ...

Ярослав, там же был и пункт "СОВСЕМ ТУПО"

0

11.03.2021

Yaroslav Schekin

Ilya Zviagin
Так это был наверное консультант по SQLServer...

Да. А где ещё "основное" название index-organized table сейчас "кластерный индекс", кстати?

0

11.03.2021

Ilya Zviagin

Ваня
я имею ввиду не по тексту выборку делаем, а по как...

Сложно говорить о индексах абстрактно...

0

11.03.2021

Ilya Zviagin

Yaroslav Schekin
Да. А где ещё "основное" название index-organized ...

Везде, кроме оракла и PG... AFAIK

0

11.03.2021

Ваня Автор вопроса

Ilya Zviagin
Сложно говорить о индексах абстрактно...

Хорошо, ок Пусть будет делаем выборку в этом диалоге (это будет груповой чат) сообщений, которые были прочитаны и которые написали женщины допустим Так лучше ?

0

11.03.2021

Alexander E

Yaroslav Schekin
И вот ровно с таким подходом (на уровне коленного ...

Я каждый запрос из моих сервисов к бд проверяю руками Смотрю где индексы настроены, а где нужно настроить И да, это ведет к большему количеству индексов чем вроде как нужно Но я ж могу добавить всегда шард на запись А если все совсем плохо станет, то позвать консультанта :)

0

11.03.2021

Ilya Zviagin

Ваня
Хорошо, ок Пусть будет делаем выборку в этом диал...

Нет, хуже. Индекс не нужен для этих условий.

0

11.03.2021

Ваня Автор вопроса

Ilya Zviagin
Нет, хуже. Индекс не нужен для этих условий.

Я понимаю что не нужен так как это булевые значения

0

11.03.2021

Yaroslav Schekin

Ilya Zviagin
Везде, кроме оракла и PG... AFAIK

Да, похоже на то, спасибо! Всё-таки не очень удачное название (по самому названию непонятно, что это такое... а некоторые и вовсе понимают иначе), IMHO.

0

11.03.2021

Anatoly Shirokov

Ваня
Я понимаю что не нужен так как это булевые значени...

А можно ответный вопрос? Для чего данные физически размещают вместе? Ты спросил про кластерные, получил несколько ответов. Но для чего эти кластерные индексы были придуманы?

0

11.03.2021

Ваня Автор вопроса

Anatoly Shirokov
А можно ответный вопрос? Для чего данные физически...

В моем понимании для более быстрой выборки

0

11.03.2021

Anatoly Shirokov

Ваня
В моем понимании для более быстрой выборки

отлично

0

11.03.2021

Anatoly Shirokov · Accepted Answer

ну давай на примере. есть районы города. твоя система работает с районом, то район отличный кандидат на кластерный индекс, почему? потому что все твои регулярные запросы будут иметь район в качестве одного из фильтрующий полей. это значит, что СУБД будет работать с данными локализованными физически в одном "кластере", районе, а не носится по диску в поисках физических записей, разбросанных как бог на душу положит.

72 похожих чатов

Всем привет, народ Может кто-то обьяснить в какой ситуации нужно

31 ответов

Похожие вопросы