Skip to content

데이터베이스 인덱싱

sieun edited this page Dec 4, 2024 · 1 revision

참고 자료: 효과적인 DB index 설정하기

카디널리티 (Cardinality)

카디널리티가 높으면(↑) 인덱스 설정에 좋은 컬럼이다.

  • 카디널리티가 높다 = 한 컬럼이 갖고 있는 값의 중복도가 낮음. (= 값들이 대부분 다른 값을 가짐)

  • 카디널리티가 낮다 = 한 컬럼이 갖고 있는 값의 중복도가 높음. (= 값들이 거의 같은 값을 가짐 )

선택도 (Selectivity)

선택도가 낮으면(↓) 인덱스 설정에 좋은 컬럼이다.

  • 선택도가 높다 = 한 컬럼이 갖고 있는 값 하나로 여러 row가 찾아진다.

  • 선택도가 낮다 = 한 컬럼이 갖고 있는 값 하나로 적은 row가 찾아진다.

조회 활용도

조회 활용도가 높으면(↑) 인덱스 설정에 좋은 컬럼이다.

  • 해당 컬럼이 실제 작업에서 얼마나 활용되는 지에 대한 값. (WHERE의 대상 컬럼으로 많이 활용되는지로 판단하면 된다.)

수정 빈도

수정 빈도가 낮으면(↓) 인덱스 설정에 좋은 컬럼이다.

  • 인덱스도 테이블이기 때문에, 인덱스로 지정된 컬럼의 값이 바뀌게 되면 인덱스 테이블도 새롭게 갱신되어야 하기 때문.

우리 서비스의 order 테이블에서 빈번하게 사용하는 쿼리는 크게 다음 두 가지로 나뉜다.

SELECT * FROM orders WHERE status = 'PENDING' AND stock_code = '005930' AND trade_type = 'SELL';
SELECT * FROM orders WHERE user_id = '1' AND status = 'PENDING';
EXPLAIN SELECT * FROM orders WHERE status = 'PENDING' AND stock_code = '005930' AND trade_type = 'SELL';
EXPLAIN SELECT * FROM orders WHERE user_id = '1' AND status = 'PENDING';

위와 같은 코드를 실행했을 때, 기존 인덱스가 없는 실행 결과는 다음과 같이 full scan을 진행 중이라는 사실을 알 수 있다.

image

image

status나 trade_type 같은 경우에는 카디널리티가 높기 때문에 인덱스가 필요하지 않다고 생각하고, user_id와 stock_code에만 각각 인덱스를 걸어주었다.

인덱스를 생성한 후, 같은 쿼리를 실행하면 아래와 같이 인덱스를 이용해 조회하는 것을 확인할 수 있다.

image

image

order 테이블 외에도 asset, bookmark 테이블에 인덱스를 설정해 주었다.

📜 개발 일지

⚠️ 트러블 슈팅

❗ 규칙

🗒️ 기록

기획
회의록
데일리스크럼
그룹 멘토링
그룹 회고

😲 개별 멘토링

고동우
김진
서산
이시은
박진명
Clone this wiki locally