블로그

데이터 분석

장바구니 분석의 기본 개념과 원리

fanruan blog avatar

Seongbin

2025년 10월 22일

장바구니 분석은 고객의 구매 기록을 바탕으로 상품 간의 연관성을 파악하는 데이터 분석 방법입니다. 소매업에서는 이 분석을 통해 고객의 구매 패턴을 발견하고, 예를 들어 빵과 우유처럼 자주 함께 구매되는 상품을 가까이 배치하거나 프로모션에 활용합니다.

이점설명
교차 판매 기회 예측고객이 원하는 제품을 미리 파악하여 교차 판매 수익을 높일 수 있습니다.
고객 평생 가치 최적화고객 경험을 맞춤화하여 유지율을 높이고 비용을 절감할 수 있습니다.
숨겨진 시장 기회 발견새로운 시장 세그먼트나 제품 기회를 발견하여 추가 수익을 창출할 수 있습니다.

주요 지표에는 지지도, 신뢰도, 향상도가 있습니다. 지지도는 특정 상품 조합의 구매 비율, 신뢰도는 한 상품을 구매한 고객이 다른 상품도 함께 구매할 확률, 향상도는 두 상품의 관계가 실질적으로 의미 있는지 나타냅니다. FanRuan의 FineBI와 같은 셀프 서비스 분석 도구를 활용하면 코딩 없이도 누구나 손쉽게 장바구니 분석을 수행할 수 있습니다.

장바구니 분석

fe6a5154a3af41dc8ce6b918402ce656.webp

개념

장바구니 분석은 고객의 구매 데이터를 바탕으로 상품 간의 연관성을 파악하는 데이터 분석 기법입니다. 이 분석은 소매업과 전자상거래 분야에서 널리 활용되고 있습니다. 대표적인 사례로 자주 언급되는 '맥주와 기저귀' 사례가 있습니다. 실제로 마트에서는 기저귀를 구매하는 고객 중 40%가 맥주도 함께 구매하는 경향을 보였습니다. 전체 고객 중 맥주 구매율이 30%임을 고려할 때, 기저귀 구매자에게 맥주를 추천하면 매출 증가가 기대됩니다.

장바구니 분석은 상품 조합의 구매 패턴을 발견하여, 고객 행동을 이해하고 판매 전략을 수립하는 데 중요한 역할을 합니다.

목적

장바구니 분석의 주요 목적은 다음과 같습니다.

  • 고객의 구매 패턴을 이해합니다.
  • 상품 간의 연관성을 파악합니다.
  • 마케팅 전략과 재고 관리에 활용합니다.
  • 매출 증대를 도모합니다.
  • 고객 만족도를 향상시킵니다.
  • 효율적인 재고 관리를 실현합니다.

기업은 장바구니 분석을 통해 자주 함께 구매되는 상품을 묶어 할인 프로모션을 진행하거나, 매장 내에서 관련 상품을 가까이 배치하여 추가 구매를 유도할 수 있습니다. 예를 들어, 우유와 빵을 묶어 판매하거나 치약과 칫솔을 같은 진열대에 배치하는 전략이 있습니다. FanRuanFineBI는 이러한 분석을 손쉽게 수행할 수 있도록 지원합니다. FineBI를 활용하면 과거의 운영 및 재무 성과를 분석하고, 수요를 예측하여 교차 판매와 고객 경험 개선을 위한 전략을 제안할 수 있습니다.

장바구니 분석은 기업이 데이터 기반 의사결정을 내릴 수 있도록 돕는 핵심 도구입니다. FineBI와 같은 셀프 서비스 분석 솔루션을 활용하면 누구나 쉽게 장바구니 분석을 실행할 수 있습니다.

韩文FineBI.png

장바구니 분석의 연관성 분석 원리

규칙 구조

장바구니 분석에서 연관 규칙은 주로 'IF-THEN' 형식으로 정의됩니다. 이 구조는 조건과 결과를 명확하게 구분하여, 데이터 내에서 상품 간의 상호 관련성을 분석하는 데 활용됩니다.

  • 'IF' 부분은 특정 상품이나 상품 조합이 구매된 경우를 의미합니다.
  • 'THEN' 부분은 그 조건이 만족될 때 함께 구매될 가능성이 높은 다른 상품을 나타냅니다.
  • 이러한 규칙 구조는 데이터에서 유의미한 정보를 추출하고, 실제 매장 진열이나 추천 시스템에 적용할 수 있습니다.

예를 들어, "만약 고객이 우유를 구매한다면, 빵도 함께 구매할 확률이 높다"라는 규칙이 도출될 수 있습니다. 이처럼 규칙 구조는 상품 간의 관계를 직관적으로 이해할 수 있도록 돕습니다.

데이터 분석을 통해 핵심 데이터 포인트 간의 패턴이나 연관성을 발견할 수 있습니다. 이러한 패턴 분석은 새로운 통찰과 추론을 가능하게 하여 효과적인 의사결정으로 이어집니다.

알고리즘

연관성 분석에서 대표적으로 사용되는 알고리즘에는  Apriori와 FP-Growth가 있습니다. 각 알고리즘은 빈발 항목 집합을 찾고, 이를 기반으로 연관 규칙을 생성하는 과정을 거칩니다.

알고리즘장점단점
Apriori원리가 간단하여 이해하기 쉽고, 다양한 패턴을 찾아준다.데이터가 커질수록 속도가 느려진다. 너무 많은 연관상품을 나타낸다.
FP-growthTree 구조를 사용하여 빠르며, DB 스캔 횟수를 줄인다.대용량 데이터 셋에서 메모리 사용이 비효율적이다. 설계가 어렵다.

연관 규칙 도출 과정은 다음과 같이 진행됩니다.

  1. 빈발 항목 집합 찾기: 최소 지지도 기준을 만족하는 항목들을 탐색합니다.
  2. 연관 규칙 생성: 빈발 항목 집합을 기반으로 신뢰도가 높은 연관 규칙을 만듭니다.
  3. 규칙 평가: 생성된 연관 규칙을 향상도 등 다양한 지표로 평가합니다.

이 과정에서 데이터 기반 패턴 발견은 비즈니스 의사결정에 중요한 역할을 합니다. 기업은 진단 분석을 통해 판매 감소나 고객 불만의 원인을 파악할 수 있습니다. 데이터 디스커버리와 상관관계 식별을 통해 새로운 비즈니스 전략을 수립할 수 있습니다.

장바구니 분석의 연관성 분석 원리는 다른 데이터 마이닝 기법과 비교했을 때 다음과 같은 장점을 가집니다.

  • 목적 변수 없이 규칙 관계를 설명할 수 있습니다.
  • 탐색적 기법으로 결과의 이해가 쉽습니다.
  • 데이터 변환 없이 직접 이용할 수 있습니다.
  • 상품 추천 및 진열에 바로 활용할 수 있습니다.
  • 동시에 구매될 확률이 높은 상품 간의 관계를 효과적으로 찾아냅니다.

장바구니 분석을 통해 기업은 데이터 기반으로 고객 행동을 이해하고, 판매 전략을 최적화할 수 있습니다.

장바구니 분석의 주요 지표

1733132350169587.png
FineBI로 제작한 장바구니 분석 대시보드

장바구니 분석에서는 세 가지 핵심 지표가 자주 활용됩니다. 바로 지지도, 신뢰도, 향상도입니다. 이 지표들은 상품 간의 연관성을 수치로 표현하여, 실제 비즈니스 전략 수립에 중요한 역할을 합니다.

지지도

지지도는 두 상품이 동시에 구매된 비율을 의미합니다. 예를 들어, 전체 1,000건의 장바구니 중 100건에서 상품 A와 상품 B가 함께 담겼다면, 지지도는 10%가 됩니다.
아래 표는 지지도의 정의와 계산 방법, 예시를 정리한 것입니다.

지표명설명
정의상품 A와 상품 B가 동시에 주문될 확률
계산 방법상품 A, B가 함께 담긴 장바구니 수 / 전체 장바구니 수
예시100건 / 1,000건 = 10%

지지도는 상품 조합이 얼마나 자주 함께 구매되는지 보여줍니다. 기업에서는 지지도가 높은 상품 조합을 중심으로 묶음 할인, 진열 전략, 추천 시스템을 설계할 수 있습니다.

신뢰도

신뢰도는 한 상품을 구매한 고객이 다른 상품도 함께 구매할 확률을 나타냅니다. 예를 들어, 100명의 고객이 상품 A를 구매했고, 이 중 80명이 상품 B도 함께 구매했다면 신뢰도는 80%입니다.
아래 표는 신뢰도의 의미를 쉽게 설명합니다.

신뢰수준설명
80%100번 조사 시 80번은 같은 결과가 나올 것임
95%100번 조사 시 95번은 같은 결과가 나와야 함

신뢰도는 추천 상품 선정에 활용됩니다. 신뢰도가 높은 상품 조합을 기반으로, 고객이 특정 상품을 구매할 때 추가로 추천할 상품을 결정할 수 있습니다.

신뢰도가 높을수록 고객의 구매 행동을 예측하기 쉬워집니다. 이는 교차 판매 전략이나 개인화 마케팅에 큰 도움이 됩니다.

향상도

향상도는 한 상품을 구매했을 때 다른 상품의 구매 확률이 얼마나 증가하는지를 보여줍니다.
향상도는 다음과 같은 특징을 가집니다.

  • 향상도가 1보다 크면 두 상품 간에 양의 상관관계가 있습니다.
  • 향상도가 1보다 작으면 음의 상관관계가 있습니다.
  • 향상도는 상품 A와 상품 B가 함께 구매된 비율을, 상품 B만 단독으로 구매된 비율과 비교하여 계산합니다.

예를 들어, 상품 A를 구매한 고객이 상품 B도 구매할 확률이 전체 고객의 상품 B 구매 확률보다 높다면, 향상도는 1보다 크게 나타납니다.

향상도는 실제로 상품 추천의 효과를 검증하거나, 프로모션 전략의 타당성을 판단하는 데 활용됩니다.
기업에서는 향상도가 높은 상품 조합을 중심으로 마케팅 예산을 집중하거나, 매장 내 진열 위치를 조정할 수 있습니다.

세 가지 지표를 함께 분석하면, 단순히 많이 팔리는 상품 조합뿐 아니라 실제로 시너지 효과가 큰 조합을 찾아낼 수 있습니다. 이는 장바구니 분석의 실질적인 가치를 높여줍니다.

FineBI를 활용한 장바구니 분석의 단계

1. 분석 주제 생성 및 데이터 추가

  1. 분석 주제를 생성하고 데이터 세트 상품 판매 테이블을 추가합니다.

  2. 데이터를 추가하고, 문서 코드상품명을 선택합니다.

장바구니 분석

2. 데이터 조인

1.다시 상품 판매 테이블을 추가하고, 조인을 클릭합니다.

2. 상품 판매 테이블 1에서 문서 코드상품명을 선택하여 두 데이터 세트를 조인합니다.

1733132463292029.png

3. 좌측 조인(Left Join)을 클릭하고, 문서 코드를 병합 기준으로 선택합니다.

장바구니 분석

4. 필드 설정(Field Settings)에서 필드명을 변경합니다.

  • 상품명상품 A 이름

  • 상품 판매 테이블 1 - 상품명상품 B 이름

장바구니 분석

3. 기본 지표 계산

필요 지표:

  • 상품 A와 B가 함께 구매된 주문 수

  • 상품 A 구매 수

  • 상품 B 구매 수

  • 총 주문 수

3.1 상품 A 구매 수

  1. 요약 열(Summary Column)을 클릭합니다.

  2. 그룹 필드(Group Field): 상품 A 이름

  3. 요약 필드(Summary Field): 문서 코드

  4. 요약 방식(Summary Method): 중복 제거 수(Distinct Count)

1733132668229635.png

3.2 상품 B 구매 수

  1. 요약 열(Summary Column)을 클릭합니다.

  2. 그룹 필드: 상품 B 이름

  3. 요약 필드: 문서 코드

  4. 요약 방식: 중복 제거 수(Distinct Count)

1733132692542107.png

3.3 상품 A와 B가 함께 구매된 주문 수

  1. 요약 열(Summary Column)을 클릭합니다.

  2. 그룹 필드: 상품 A 이름, 상품 B 이름

  3. 요약 필드: 문서 코드

  4. 요약 방식: 중복 제거 수(Distinct Count)

장바구니 분석

3.4 총 주문 수

  1. 요약 열(Summary Column)을 클릭합니다.

  2. 요약 필드: 문서 코드

  3. 요약 방식: 중복 제거 수(Distinct Count)

장바구니 분석

위 단계 완료 후, 지원도(Support), 신뢰도(Confidence), 향상도(Lift)를 계산할 준비가 완료됩니다.

4. 지원도, 신뢰도, 향상도 계산

4.1 지원도(Support)

  1. 수식 열(Formula Column)을 클릭합니다.

  2. 추가할 수식 열 이름: Support

  3. 수식 입력: 상품 A와 B가 함께 구매된 주문 수 / 총 주문 수
     

1733132879375468.png

4.2 신뢰도(Confidence)

  1. 수식 열(Formula Column)을 클릭합니다.

  2. 추가할 수식 열 이름: Confidence

  3. 수식 입력: 상품 A와 B가 함께 구매된 주문 수 / 상품 A 구매 수

1733132889976838.png

4.3 향상도(Lift)

  1. 수식 열(Formula Column)을 클릭합니다.

  2. 추가할 수식 열 이름: Lift

  3. 수식 입력: Support / ((상품 A 구매 수 / 총 주문 수) * (상품 B 구매 수 / 총 주문 수))

1733132898510950.png

4.4 동일 상품 조합 제거

  1. 조합에서 상품 A 이름과 상품 B 이름이 동일한 경우, 지원도, 신뢰도, 향상도 계산은 의미가 없습니다.

  2. 동일 상품 조합은 필터링하여 제거합니다.

  3. 모든 계산이 완료되면 분석 주제를 저장하고 업데이트합니다.

1733132915572088.png

5. 컴포넌트 생성

5.1 그래프 컴포넌트

  1. 저장한 주제 Market Basket Analysis를 이용하여 컴포넌트를 생성합니다.

  2. 사용자 정의 차트(Custom Chart)를 선택합니다.

  3. 가로 축(Horizontal Axis): 상품 A 이름

  4. 세로 축(Vertical Axis): 상품 B 이름

  5. 그래픽 속성에서 직사각형 블록(Rectangular Block)을 선택하고, Support를 색상 옆 막대에 드래그합니다.

  6. 여러 주문의 값이 합산되므로, 막대에 드래그한 Support의 요약 모드(Summary Mode)를 평균(Average)으로 설정합니다.

장바구니 분석

5.2 지원도, 신뢰도, 향상도 세부 데이터 컴포넌트

  1. 지원도, 신뢰도, 향상도 세부 데이터를 표시할 컴포넌트를 생성합니다.

  2. 여러 주문이 병합 요약되므로 Support, Confidence, Lift 모두 평균(Average)으로 요약 모드를 설정합니다.

  3. 값 형식(Value Format)을 백분율(Percentage)로 설정합니다.

1733132967817628.png

6. 효과 예시

1733132350169587.png
FineBI로 제작한 장바구니 분석 대시보드

FineBI는 60종 이상의 차트와 다양한 대시보드 기능을 제공합니다. 분석 결과를 직관적으로 시각화하여, 담당자가 쉽게 이해하고 의사결정에 활용할 수 있습니다.

features_dynamicmap_1_ab4bc8bf82.gif

FineBI는 데이터 분석 경험이 부족한 사용자도 손쉽게 장바구니 분석을 수행할 수 있도록 설계되었습니다.
기업은 FineBI를 통해 실시간으로 데이터를 통합하고, 분석 결과를 팀원과 공유하며, 빠르게 비즈니스 전략을 수립할 수 있습니다.

韩文FineBI.png

FAQ

장바구니 분석이란 무엇인가요?
장바구니 분석은 고객의 구매 데이터를 바탕으로 상품 간의 연관성을 찾아내는 데이터 분석 기법입니다. 기업은 이를 통해 교차 판매 전략이나 추천 시스템을 효과적으로 설계할 수 있습니다.
FineBI를 사용하면 코딩 없이도 분석이 가능한가요?
네, FineBI는 사용자가 코딩 지식 없이도 드래그 앤 드롭 방식으로 데이터를 분석할 수 있도록 설계되었습니다. 누구나 손쉽게 장바구니 분석을 진행할 수 있습니다.
fanruan blog author avatar

작성자

Seongbin

FanRuan에서 재직하는 고급 데이터 분석가