장바구니 분석은 고객의 구매 기록을 바탕으로 상품 간의 연관성을 파악하는 데이터 분석 방법입니다. 소매업에서는 이 분석을 통해 고객의 구매 패턴을 발견하고, 예를 들어 빵과 우유처럼 자주 함께 구매되는 상품을 가까이 배치하거나 프로모션에 활용합니다.
| 이점 | 설명 |
|---|---|
| 교차 판매 기회 예측 | 고객이 원하는 제품을 미리 파악하여 교차 판매 수익을 높일 수 있습니다. |
| 고객 평생 가치 최적화 | 고객 경험을 맞춤화하여 유지율을 높이고 비용을 절감할 수 있습니다. |
| 숨겨진 시장 기회 발견 | 새로운 시장 세그먼트나 제품 기회를 발견하여 추가 수익을 창출할 수 있습니다. |
주요 지표에는 지지도, 신뢰도, 향상도가 있습니다. 지지도는 특정 상품 조합의 구매 비율, 신뢰도는 한 상품을 구매한 고객이 다른 상품도 함께 구매할 확률, 향상도는 두 상품의 관계가 실질적으로 의미 있는지 나타냅니다. FanRuan의 FineBI와 같은 셀프 서비스 분석 도구를 활용하면 코딩 없이도 누구나 손쉽게 장바구니 분석을 수행할 수 있습니다.

장바구니 분석은 고객의 구매 데이터를 바탕으로 상품 간의 연관성을 파악하는 데이터 분석 기법입니다. 이 분석은 소매업과 전자상거래 분야에서 널리 활용되고 있습니다. 대표적인 사례로 자주 언급되는 '맥주와 기저귀' 사례가 있습니다. 실제로 마트에서는 기저귀를 구매하는 고객 중 40%가 맥주도 함께 구매하는 경향을 보였습니다. 전체 고객 중 맥주 구매율이 30%임을 고려할 때, 기저귀 구매자에게 맥주를 추천하면 매출 증가가 기대됩니다.
장바구니 분석은 상품 조합의 구매 패턴을 발견하여, 고객 행동을 이해하고 판매 전략을 수립하는 데 중요한 역할을 합니다.
장바구니 분석의 주요 목적은 다음과 같습니다.
기업은 장바구니 분석을 통해 자주 함께 구매되는 상품을 묶어 할인 프로모션을 진행하거나, 매장 내에서 관련 상품을 가까이 배치하여 추가 구매를 유도할 수 있습니다. 예를 들어, 우유와 빵을 묶어 판매하거나 치약과 칫솔을 같은 진열대에 배치하는 전략이 있습니다. FanRuan의 FineBI는 이러한 분석을 손쉽게 수행할 수 있도록 지원합니다. FineBI를 활용하면 과거의 운영 및 재무 성과를 분석하고, 수요를 예측하여 교차 판매와 고객 경험 개선을 위한 전략을 제안할 수 있습니다.
장바구니 분석은 기업이 데이터 기반 의사결정을 내릴 수 있도록 돕는 핵심 도구입니다. FineBI와 같은 셀프 서비스 분석 솔루션을 활용하면 누구나 쉽게 장바구니 분석을 실행할 수 있습니다.
장바구니 분석에서 연관 규칙은 주로 'IF-THEN' 형식으로 정의됩니다. 이 구조는 조건과 결과를 명확하게 구분하여, 데이터 내에서 상품 간의 상호 관련성을 분석하는 데 활용됩니다.
예를 들어, "만약 고객이 우유를 구매한다면, 빵도 함께 구매할 확률이 높다"라는 규칙이 도출될 수 있습니다. 이처럼 규칙 구조는 상품 간의 관계를 직관적으로 이해할 수 있도록 돕습니다.
데이터 분석을 통해 핵심 데이터 포인트 간의 패턴이나 연관성을 발견할 수 있습니다. 이러한 패턴 분석은 새로운 통찰과 추론을 가능하게 하여 효과적인 의사결정으로 이어집니다.
연관성 분석에서 대표적으로 사용되는 알고리즘에는 Apriori와 FP-Growth가 있습니다. 각 알고리즘은 빈발 항목 집합을 찾고, 이를 기반으로 연관 규칙을 생성하는 과정을 거칩니다.
| 알고리즘 | 장점 | 단점 |
|---|---|---|
| Apriori | 원리가 간단하여 이해하기 쉽고, 다양한 패턴을 찾아준다. | 데이터가 커질수록 속도가 느려진다. 너무 많은 연관상품을 나타낸다. |
| FP-growth | Tree 구조를 사용하여 빠르며, DB 스캔 횟수를 줄인다. | 대용량 데이터 셋에서 메모리 사용이 비효율적이다. 설계가 어렵다. |
연관 규칙 도출 과정은 다음과 같이 진행됩니다.
이 과정에서 데이터 기반 패턴 발견은 비즈니스 의사결정에 중요한 역할을 합니다. 기업은 진단 분석을 통해 판매 감소나 고객 불만의 원인을 파악할 수 있습니다. 데이터 디스커버리와 상관관계 식별을 통해 새로운 비즈니스 전략을 수립할 수 있습니다.
장바구니 분석의 연관성 분석 원리는 다른 데이터 마이닝 기법과 비교했을 때 다음과 같은 장점을 가집니다.
장바구니 분석을 통해 기업은 데이터 기반으로 고객 행동을 이해하고, 판매 전략을 최적화할 수 있습니다.

장바구니 분석에서는 세 가지 핵심 지표가 자주 활용됩니다. 바로 지지도, 신뢰도, 향상도입니다. 이 지표들은 상품 간의 연관성을 수치로 표현하여, 실제 비즈니스 전략 수립에 중요한 역할을 합니다.
지지도는 두 상품이 동시에 구매된 비율을 의미합니다. 예를 들어, 전체 1,000건의 장바구니 중 100건에서 상품 A와 상품 B가 함께 담겼다면, 지지도는 10%가 됩니다.
아래 표는 지지도의 정의와 계산 방법, 예시를 정리한 것입니다.
| 지표명 | 설명 |
|---|---|
| 정의 | 상품 A와 상품 B가 동시에 주문될 확률 |
| 계산 방법 | 상품 A, B가 함께 담긴 장바구니 수 / 전체 장바구니 수 |
| 예시 | 100건 / 1,000건 = 10% |
지지도는 상품 조합이 얼마나 자주 함께 구매되는지 보여줍니다. 기업에서는 지지도가 높은 상품 조합을 중심으로 묶음 할인, 진열 전략, 추천 시스템을 설계할 수 있습니다.
신뢰도는 한 상품을 구매한 고객이 다른 상품도 함께 구매할 확률을 나타냅니다. 예를 들어, 100명의 고객이 상품 A를 구매했고, 이 중 80명이 상품 B도 함께 구매했다면 신뢰도는 80%입니다.
아래 표는 신뢰도의 의미를 쉽게 설명합니다.
| 신뢰수준 | 설명 |
|---|---|
| 80% | 100번 조사 시 80번은 같은 결과가 나올 것임 |
| 95% | 100번 조사 시 95번은 같은 결과가 나와야 함 |
신뢰도는 추천 상품 선정에 활용됩니다. 신뢰도가 높은 상품 조합을 기반으로, 고객이 특정 상품을 구매할 때 추가로 추천할 상품을 결정할 수 있습니다.
신뢰도가 높을수록 고객의 구매 행동을 예측하기 쉬워집니다. 이는 교차 판매 전략이나 개인화 마케팅에 큰 도움이 됩니다.
향상도는 한 상품을 구매했을 때 다른 상품의 구매 확률이 얼마나 증가하는지를 보여줍니다.
향상도는 다음과 같은 특징을 가집니다.
예를 들어, 상품 A를 구매한 고객이 상품 B도 구매할 확률이 전체 고객의 상품 B 구매 확률보다 높다면, 향상도는 1보다 크게 나타납니다.
향상도는 실제로 상품 추천의 효과를 검증하거나, 프로모션 전략의 타당성을 판단하는 데 활용됩니다.
기업에서는 향상도가 높은 상품 조합을 중심으로 마케팅 예산을 집중하거나, 매장 내 진열 위치를 조정할 수 있습니다.
세 가지 지표를 함께 분석하면, 단순히 많이 팔리는 상품 조합뿐 아니라 실제로 시너지 효과가 큰 조합을 찾아낼 수 있습니다. 이는 장바구니 분석의 실질적인 가치를 높여줍니다.
분석 주제를 생성하고 데이터 세트 상품 판매 테이블을 추가합니다.
데이터를 추가하고, 문서 코드와 상품명을 선택합니다.

1.다시 상품 판매 테이블을 추가하고, 조인을 클릭합니다.
2. 상품 판매 테이블 1에서 문서 코드와 상품명을 선택하여 두 데이터 세트를 조인합니다.

3. 좌측 조인(Left Join)을 클릭하고, 문서 코드를 병합 기준으로 선택합니다.

4. 필드 설정(Field Settings)에서 필드명을 변경합니다.
상품명 → 상품 A 이름
상품 판매 테이블 1 - 상품명 → 상품 B 이름

필요 지표:
상품 A와 B가 함께 구매된 주문 수
상품 A 구매 수
상품 B 구매 수
총 주문 수
요약 열(Summary Column)을 클릭합니다.
그룹 필드(Group Field): 상품 A 이름
요약 필드(Summary Field): 문서 코드
요약 방식(Summary Method): 중복 제거 수(Distinct Count)

요약 열(Summary Column)을 클릭합니다.
그룹 필드: 상품 B 이름
요약 필드: 문서 코드
요약 방식: 중복 제거 수(Distinct Count)

요약 열(Summary Column)을 클릭합니다.
그룹 필드: 상품 A 이름, 상품 B 이름
요약 필드: 문서 코드
요약 방식: 중복 제거 수(Distinct Count)

요약 열(Summary Column)을 클릭합니다.
요약 필드: 문서 코드
요약 방식: 중복 제거 수(Distinct Count)

위 단계 완료 후, 지원도(Support), 신뢰도(Confidence), 향상도(Lift)를 계산할 준비가 완료됩니다.
수식 열(Formula Column)을 클릭합니다.
추가할 수식 열 이름: Support
수식 입력: 상품 A와 B가 함께 구매된 주문 수 / 총 주문 수

수식 열(Formula Column)을 클릭합니다.
추가할 수식 열 이름: Confidence
수식 입력: 상품 A와 B가 함께 구매된 주문 수 / 상품 A 구매 수

수식 열(Formula Column)을 클릭합니다.
추가할 수식 열 이름: Lift
수식 입력: Support / ((상품 A 구매 수 / 총 주문 수) * (상품 B 구매 수 / 총 주문 수))

조합에서 상품 A 이름과 상품 B 이름이 동일한 경우, 지원도, 신뢰도, 향상도 계산은 의미가 없습니다.
동일 상품 조합은 필터링하여 제거합니다.
모든 계산이 완료되면 분석 주제를 저장하고 업데이트합니다.

저장한 주제 Market Basket Analysis를 이용하여 컴포넌트를 생성합니다.
사용자 정의 차트(Custom Chart)를 선택합니다.
가로 축(Horizontal Axis): 상품 A 이름
세로 축(Vertical Axis): 상품 B 이름
그래픽 속성에서 직사각형 블록(Rectangular Block)을 선택하고, Support를 색상 옆 막대에 드래그합니다.
여러 주문의 값이 합산되므로, 막대에 드래그한 Support의 요약 모드(Summary Mode)를 평균(Average)으로 설정합니다.

지원도, 신뢰도, 향상도 세부 데이터를 표시할 컴포넌트를 생성합니다.
여러 주문이 병합 요약되므로 Support, Confidence, Lift 모두 평균(Average)으로 요약 모드를 설정합니다.
값 형식(Value Format)을 백분율(Percentage)로 설정합니다.


FineBI는 60종 이상의 차트와 다양한 대시보드 기능을 제공합니다. 분석 결과를 직관적으로 시각화하여, 담당자가 쉽게 이해하고 의사결정에 활용할 수 있습니다.

FineBI는 데이터 분석 경험이 부족한 사용자도 손쉽게 장바구니 분석을 수행할 수 있도록 설계되었습니다.
기업은 FineBI를 통해 실시간으로 데이터를 통합하고, 분석 결과를 팀원과 공유하며, 빠르게 비즈니스 전략을 수립할 수 있습니다.

작성자
Seongbin
FanRuan에서 재직하는 고급 데이터 분석가
관련 기사

생산관리에서 MRP가 어떻게 자재 소요를 최적화하는지 알아보기
MRP는 생산관리에서 자재 소요를 정확히 예측·관리하여 재고 비용을 절감하고 생산성 향상 및 납기 준수율 개선에 기여합니다.
Seongbin
2025년 10월 31일

데이터 분석 프로젝트 실무자가 꼭 알아야 할 핵심 팁
데이터 분석 프로젝트 성공률을 높이는 실무 핵심 팁과 협업, 데이터 품질, 목표 설정 방법을 현장 경험 기반으로 안내합니다.
Seongbin
2025년 10월 31일

빅데이터 활용사례 분석으로 본 비즈니스 성공 전략
빅데이터 활용사례 분석을 통해 데이터 기반 의사결정, 운영 효율성, KPI 설정 등 비즈니스 성공 전략과 실질적 성과를 확인하세요.
Seongbin
2025년 10월 30일