블로그

데이터 시각화

분산형 차트의 개념부터 활용까지: 데이터 시각화 가이드

fanruan blog avatar

Lewis

2024년 8월 05일

산점도는 데이터 간의 상관관계를 시각적으로 표현할 때 주로 사용하는 차트로, 두 개의 수치형 변수 간의 관계를 직관적으로 보여줍니다. 산점도를 통해 데이터의 분포나 추세를 쉽게 파악할 수 있어, 품질 관리의 7대 기법 중 하나로 널리 사용되고 있습니다.

산점도는 특히 Excel에서 자주 사용되는 차트 중 하나지만, 여전히 많은 데이터 분석가들이 Excel에서 산점도를 포함한 기본 그래프를 효과적으로 활용하는 방법에 대해 궁금해합니다. 오늘은 산점도를 만드는 방법에 대해 자세히 살펴보겠습니다.

본 글에서 사용된 그래프는 FineReport라는 대용량 데이터 분석 도구를 통해 제작되었습니다. FineReport는 19종의 대분류 그래프와 60종 이상의 동적 그래프 스타일을 제공하며, 필요하신 분들은 무료로 다운로드하여 사용해 보실 수 있습니다

데이터 분석 도구

분산형 차트란? 기본 개념과 활용 목적

산점도는 종속 변수가 독립 변수에 따라 어떻게 변하는지의 대체적인 추세를 보여주는 그래프입니다. 데이터 점이 직교 좌표 평면 위에 놓이며, 하나의 변수를 가로축으로, 다른 변수를 세로축으로 사용합니다. 산점도는 좌표 점들의 분포 형태를 통해 변수 간의 통계적 관계를 반영합니다.

산점도의 장점은 영향을 주는 요인과 예측 대상 간의 전반적인 관계 추세를 직관적으로 보여줄 수 있다는 것입니다. 직관적인 그래프 형식을 통해 변수 간의 형태 변화를 파악하여 변수 간의 관계를 모형화할 수 있습니다.

하지만 산점도의 단점은 다소 복잡해 보일 수 있다는 점입니다. 기본적으로 산점도는 상관성, 분포 및 집합만을 보여줄 수 있으며, 다른 정보는 잘 표현되지 않습니다. 또한 충분한 데이터 포인트가 있어야 하고, 데이터 간의 상관성이 있을 때 더 좋은 결과를 나타냅니다.

데이터 분석 도구

분산형 차트활용 가이드: 데이터 시각화의 핵심 전략

산점도는 다음 두 가지 경우에 사용하기 적합합니다:

분산형 차트사용 시기 1: 상관성 비교 관계 분석

상관성 비교 관계는 두 변수 간의 관계를 나타내며, 이 관계가 특정 패턴을 증명할 수도 있고 아닐 수도 있습니다.

예를 들어, 이익이 매출 증가에 따라 증가하는 것을 증명할 수 있으며, 할인율 증가에 따라 매출이 증가하는 것을 증명할 수도 있습니다:

  • 5월의 판매 상황을 보면, 매출액과 판매원의 경험은 관계가 없다.

  • CEO의 급여는 회사 규모에 따라 달라지지 않는다.

  • 보험 계약의 크기는 보험 고객의 수입과 비례한다.

주제가 무엇과 관련 있는지, 무엇에 따라 증가하는지, 무엇에 따라 감소하는지, 무엇에 따라 변화하는지 또는 무엇에 따라 증가하지 않는지 포함하는 경우, 이는 상관성 비교 관계라고 할 수 있습니다.

상관성 비교 관계는 두 변수 간의 관계를 나타내므로 두 축 모두 수치 축입니다. 이는 일반적인 다른 그래프 유형인 막대 그래프, 세로 막대 그래프, 꺾은선 그래프 등이 한 축은 범주 축(또는 시간 축)이고, 다른 축은 수치 축인 것과 다릅니다.

산점도는 주로 수치를 표시하고 비교하는 데 사용되며, 추세를 보여줄 뿐만 아니라 데이터 클러스터의 형태와 데이터 점 간의 관계도 나타낼 수 있습니다.

산점도

분산형 차트사용 시기 2: 분포 관계

상관성 비교 관계 외에도 산점도는 데이터의 분포 상황을 나타내고, 이로부터 특정한 연관성, 이상값 및 데이터 클러스터를 찾을 수 있습니다.

  • 일반적인 사용 사례는 다음과 같습니다:

  • 고객의 연령대 분포

  • 단일 티켓 비용과 수량의 분포 상황

  • 제품 보스턴 매트릭스

구체적으로 어떻게 사용할까요? 예를 들어, 아래 그림은 특정 회사의 전국 지점의 단일 티켓 비용/수입 분포 상황을 나타냅니다.

산점도
단표원가/소득분포도

 

이 그림을 통해 어떤 대구역의 단일 티켓 이익이 낮아 개선이 필요한지 알 수 있습니다. 예를 들어, 오른쪽 아래에 널리 분포된 제4 대구역은 단일 티켓 수익이 평균선보다 낮고 단일 티켓 비용이 평균선보다 높습니다.

분산형 차트제작 단계: 데이터 시각화의 단계별 가이드

Excel은 가장 일반적인 산점도 제작 도구이지만, Excel을 사용하는 것은 번거롭습니다. 매번 반복적으로 데이터를 추출하고, 테이블 형식을 설정하고, 공식을 추가하고, 그래프를 그리는 등의 번거로운 과정을 거쳐야 하며, 효율이 매우 낮습니다. 특히 월말 보고서 작성 시 여러 데이터 분석 그래프를 만들어야 할 때 매우 번거롭습니다. 또한 Excel의 그래프 스타일도 단조롭습니다.

오늘 소프트걸이 추천하는 FineReport는 Excel처럼 반복적으로 표를 만들 필요가 없습니다. FineReport 사용하면 동일한 테이블을 템플릿으로 쉽게 재사용할 수 있습니다. 한 번 보고서 템플릿을 만든 후, 나중에 사용할 때 그대로 적용하면 됩니다. 여러 개의 수작업 Excel을 대체할 수 있습니다! 

diverse visualization types.png

기술적인 관점에서 FineReport는 일부 비즈니스 시각화 요구를 충족할 뿐만 아니라 전체 비즈니스 시스템에도 사용할 수 있습니다. 소프트걸의 동료는 FineReport를 사용하여 출석 시스템을 개발했으며, 동료들 중 일부는 이를 사용하여 구매 관리 시스템, 시험 시스템, 소형 회계 시스템을 성공적으로 개발한 사례가 있습니다~

decision-making platform.png

이제 FineReport에서 네 가지 간단한 단계로 전문적이고 아름다운 산점도를 빠르게 완성하는 방법을 소개하겠습니다.

韩文版FR.png

분산형 차트삽입 방법: 데이터 시각화의 핵심 기술

첫 번째 단계는 FineReport 보고서 디자이너에서 그래프를 삽입하는 것입니다.

FineReport의 보고서 디자이너 인터페이스는 Excel과 유사하여 사용하기 쉽습니다.

셀에 삽입하거나 부유 요소로 삽입할 수 있습니다. 부유 요소로 삽입하는 예로, [삽입] → [부유 요소] → [그래프 삽입] → [산점도]를 클릭합니다.

산점도 데이터 바인딩

두 번째 단계는 방금 만든 산점도와 데이터를 바인딩하는 것입니다.

데이터를 추출한 후, 속성 관리 패널에서 산점도와 데이터를 바인딩합니다.

예를 들어, 산점도는 특정 학급의 남녀 키와 몸무게 분포를 나타내는 데이터입니다. [시리즈명]은 [sex], [x축]은 [height], [y축]은 [weight]로 설정합니다.

산점도 스타일 설정

오른쪽 속성 관리 패널에서 산점도의 스타일을 다양하게 설정할 수 있습니다. 원하는 스타일과 형식으로 설정할 수 있습니다.

설정 가능한 속성에는 제목, 범례, 라벨, 시리즈, 좌표축, 데이터 테이블, 배경, 툴팁 등이 포함됩니다. 아래 버튼을 클릭하여 최신 버전의 FineReport를 무료로 체험해보세요. 원하는 스타일로 설정해보세요.

韩文版FR.png

산점도 완성품 미리보기

[미리보기]를 클릭하면 브라우저에서 제작된 산점도의 효과를 확인할 수 있습니다.

파란색 점은 여성, 녹색 점은 남성을 나타내며, 점의 분포 상황을 통해 남성과 여성의 키와 몸무게 분포를 알 수 있습니다.

분산형 차트제작 주의사항: 효과적인 데이터 시각화를 위한 팁

마지막으로 산점도 제작 시 주의해야 할 몇 가지 팁을 공유하겠습니다. 그래프의 시각적 표현을 최적화할 수 있습니다:

눈금의 균일한 분포

좌표축에서 눈금은 균일하게 분포되어야 하며, 그래프 효과가 왜곡되지 않도록 해야 합니다.

Y축은 가능한 0에서 시작

일부 경우에서는 좌표축을 접어 사용하여 데이터를 더 아름답게 나타낼 수 있지만, 일반적으로 Y축은 가능한 0에서 시작해야 합니다. 그래프 표현 방식이 왜곡되지 않도록 주의해야 합니다.

데이터와 변수는 많을수록 좋음

다른 그래프 유형과 달리, 산점도에 포함된 데이터와 변수는 많을수록 좋으며, 혼란을 초래하지 않습니다. 또한, 다양한 크기와 색상으로 점을 변경하여 더 나은 시각적 효과를 나타낼 수 있습니다.

이상값의 신중한 사용

이상값을 신중하게 사용합니다. 이상값의 값이 정확하지 않다고 의심되거나 이상값의 사용이 작업에 가치가 없는 경우, 이상값을 제외할 수 있습니다.

추세선 사용

추세선을 사용합니다. FineReport를 사용하면 추세선을 쉽게 그릴 수 있습니다. 추세선은 추세를 한눈에 쉽게 파악할 수 있도록 도와줍니다. 추세선은 두 개 이상 사용하지 않는 것이 좋습니다. 그렇지 않으면 혼란을 초래할 수 있습니다.

분산 그래프
분산 그래프에 추세선 사용하기

 

FineReport는 개인 사용자에게는 완전히 무료이며, 기업의 경우 개별 요구 사항에 따라 다양한 가격 옵션을 제공합니다.

FineReport는 대만, 홍콩, 마카오, 싱가포르, 말레이시아 등 지역에서 현지 서비스를 제공하며, 원래 개발팀이 기술 지원, 이차 개발 및 프로젝트 구현을 담당합니다. 아래 이미지를 클릭하여 FineReport 보고서 소프트웨어를 무료로 다운로드하고 체험해보세요. 기술적인 질문이 있으면 언제든지 기술 지원 엔지니어에게 연락하여 산점도 제작 여정을 도와드립니다!

데이터 분석

보고 도구 관련 정보 확인하기

대시보드(Dashboard)는 무엇이고, 왜 필수적인가요?

막대그래프란 무엇인가 정의와 특징 알아보기

그래프 그리기 사이트 추천 TOP10 모음 [2025 업데이트]

히스토그램의 정의와 기본 개념

엑셀 그래프 쉽게 만드는 방법

엑셀에서 막대 그래프 쉽게 만드는 방법

데이터 시각화를 위한 그래프 종류와 사용법

수학 그래프 그리는 사이트 추천: 그래프 그리는 사이트를 활용해보세요!

fanruan blog author avatar

작성자

Lewis

FanRuan의 선임 데이터 분석가