맨위로가기

줄기 잎 그림

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

줄기 잎 그림은 데이터를 시각적으로 표현하는 방법으로, 관측치를 오름차순으로 정렬하여 줄기와 잎으로 구분하여 나타낸다. 데이터의 분포, 이상치, 최빈값을 파악하는 데 유용하며, 중간 크기의 데이터 세트(약 15~150개)에 적합하다. 줄기는 숫자의 자릿수를 나타내고, 잎은 각 줄기에 해당하는 마지막 자릿수를 나열한다. 대한민국 중학교 수학 교육 과정에서 자료 해석 능력을 키우는 데 활용된다.

더 읽어볼만한 페이지

  • 통계 차트와 다이어그램 - 레이더 차트
    레이더 차트는 여러 변수의 상대적 크기를 시각적으로 비교하는 차트로, 중심점에서 방사형으로 뻗어나가는 축을 사용하여 데이터 패턴 파악, 유사성 비교, 이상치 탐색 등에 활용되지만, 면적 왜곡 등의 단점도 존재하여 데이터 해석 시 주의가 필요하다.
  • 통계 차트와 다이어그램 - 연표
    연표는 시간 순서에 따라 사건, 현상, 변화 등을 시각적으로 표현하는 방식으로, 역사 기록에서 시작하여 표 형태로 발전했으며 다양한 분야에서 활용되고 여러 형태로 정보를 제시한다.
줄기 잎 그림
개요
유형기술통계학
설명자료의 분포 형태를 시각적으로 표현하는 방법
관련 항목히스토그램, 상자 수염 그림
정의
목적데이터 집합의 분포를 간결하게 보여주고 데이터의 중심 경향과 퍼짐 정도를 파악하는 데 도움을 준다.
특징데이터를 정렬하여 줄기 부분과 잎 부분으로 나눈다.
줄기는 일반적으로 가장 왼쪽 자릿수를 나타내고, 잎은 그 다음 자릿수를 나타낸다.
자료의 원래 값을 보존하면서 시각적인 정보를 제공한다.
사용법
구성 요소줄기: 가장 왼쪽 자릿수 (예: 십의 자리)
잎: 그 다음 자릿수 (예: 일의 자리)
작성 방법


예시데이터: 12, 15, 21, 23, 23, 29, 31, 35, 42, 43
줄기-잎 그림:



장단점
장점데이터의 분포를 쉽게 파악할 수 있다.
자료의 원래 값을 유지한다.
간단하고 쉽게 만들 수 있다.
단점데이터 양이 많을 경우 표현하기 어렵다.
연속적인 데이터에는 적합하지 않을 수 있다.
다른 시각화 방법에 비해 정보 전달력이 제한적일 수 있다.
추가 정보
변형분할 줄기-잎 그림: 각 줄기를 여러 번 사용하여 더 자세한 분포를 나타낸다.
정렬된 줄기-잎 그림: 잎을 크기 순서대로 정렬하여 분포를 더 명확하게 보여준다.
활용 분야교육: 데이터 분포를 쉽게 이해하도록 돕는다.
통계 분석: 데이터의 특징을 파악하고 분석하는 데 활용된다.
품질 관리: 공정 데이터의 분포를 모니터링하는 데 사용된다.
참고 문헌

2. 구성 방법

줄기 잎 그림을 구성하려면, 먼저 관측치를 오름차순으로 정렬해야 한다.[1] 그런 다음, 줄기와 잎이 무엇을 나타낼지 결정해야 하는데, 일반적으로 잎은 숫자의 마지막 자릿수를, 줄기는 나머지 자릿수를 포함한다. 매우 큰 숫자는 특정 자릿수(예: 백의 자리)로 반올림하여 잎에 사용하고, 나머지 숫자는 줄기로 사용한다.

줄기 잎 그림은 수직선으로 구분된 두 개의 열로 그리며, 줄기는 왼쪽에, 잎은 오른쪽에 오름차순으로 나열한다. 각 줄기는 한 번만, 잎이 없는 줄도 숫자를 건너뛰지 않고 나열해야 한다. 데이터에 반복되는 숫자가 있으면 모두 표시해야 한다.

반올림이 필요할 수 있으며, 음수는 줄기 단위 앞에 배치하고, 정수가 아닌 숫자는 반올림한다. 이를 통해 복잡한 데이터 집합에서도 줄기 잎 그림의 모양을 유지할 수 있다.

2. 1. 데이터 정렬

줄기 잎 그림을 만들려면 먼저 관측치를 오름차순으로 정렬해야 한다.[1] 손으로 작업하는 경우, 잎을 정렬하지 않은 상태로 줄기 잎 그림 초안을 작성한 다음, 잎을 정렬하여 최종 줄기 잎 그림을 생성하는 것이 가장 쉽다.[1]

다음은 정렬된 데이터 값의 예시이다.

: 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

2. 2. 줄기와 잎 결정

일반적으로 잎은 숫자의 마지막 자릿수를 포함하고 줄기는 다른 모든 자릿수를 포함한다. 매우 큰 숫자의 경우 데이터 값을 특정 자릿수(예: 백 자리)로 반올림할 수 있으며, 이 자릿수가 잎에 사용된다. 반올림된 자릿수의 왼쪽에 있는 나머지 숫자는 줄기로 사용된다.

잎은 일의 자릿수를 나타내고 줄기는 나머지 숫자(십의 자릿수 이상)를 나타낸다.

줄기 잎 그림은 수직선으로 구분된 두 개의 열로 그려진다. 줄기는 수직선의 왼쪽에 나열된다. 각 줄기는 한 번만 나열되어야 하며, 일부 줄에 잎이 없더라도 숫자가 건너뛰지 않아야 한다. 잎은 각 줄기의 오른쪽에 있는 행에 오름차순으로 나열된다.

데이터에 반복되는 숫자가 있는 경우(예: 72가 두 개), 플롯에 반영되어야 한다(따라서 72 72 75 76 77이 있는 경우 플롯은 7 | 2 2 5 6 7처럼 보일 것이다).

StemLeaf
44 6 7 9
5
63 4 6 8 8
72 2 5 6
81 4 8
9
106



Key: 6 \mid 3 = 63

Leaf unit: 1.0

Stem unit: 10.0

줄기 잎 그림을 만들려면 반올림이 필요할 수 있다. 음수의 경우 음수가 줄기 단위 앞에 배치되며, 이는 여전히 X / 10의 값이다. 정수가 아닌 숫자는 반올림된다. 이를 통해 줄기 잎 플롯이 더 복잡한 데이터 집합에서도 모양을 유지할 수 있다.

StemLeaf
-24
-12
-03
04 6 6
17
25
3
4
57



Key: -2 \mid 4 = -24

2. 3. 그림 그리기

관측치를 오름차순으로 정렬한다. 손으로 작업하는 경우, 먼저 잎을 정렬하지 않은 상태로 초안을 작성한 다음, 잎을 정렬하여 최종 줄기 잎 그림을 생성하는 것이 가장 쉽다. 다음은 정렬된 데이터 값의 예시이다.

: 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

다음으로 줄기가 무엇을 나타내고 잎이 무엇을 나타낼지 결정해야 한다. 일반적으로 잎은 숫자의 마지막 자릿수를 포함하고 줄기는 다른 모든 자릿수를 포함한다. 매우 큰 숫자의 경우 데이터 값을 특정 자릿수 (예: 백 자리)로 반올림할 수 있으며, 이 자릿수가 잎에 사용된다. 반올림된 자릿수의 왼쪽에 있는 나머지 숫자는 줄기로 사용된다.

이 예제에서 잎은 일의 자릿수를 나타내고 줄기는 나머지 숫자(십의 자릿수 이상)를 나타낸다.

줄기 잎 그림은 수직선으로 구분된 두 개의 열로 그려진다. 줄기는 수직선의 왼쪽에 나열된다. 각 줄기는 한 번만 나열되어야 하며, 일부 줄에 잎이 없더라도 숫자가 건너뛰지 않아야 한다. 잎은 각 줄기의 오른쪽에 있는 행에 오름차순으로 나열된다.

데이터에 반복되는 숫자가 있는 경우(예: 72가 두 개)는 모두 표시해야 한다.

줄기
44 6 7 9
5
63 4 6 8 8
72 2 5 6
81 4 8
9
106



:Key: 6|3 = 63

:Leaf unit: 1.0

:Stem unit: 10.0

줄기 잎 그림을 만들려면 반올림이 필요할 수 있다. 다음 데이터 집합을 기반으로 아래와 같이 줄기 잎 그림이 생성된다.

: −23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8

음수의 경우 음수가 줄기 단위 앞에 배치되며, 이는 여전히 X / 10의 값이다. 정수가 아닌 숫자는 반올림된다.

줄기
-24
-12
-03
04 6 6
17
25
3
4
57



:Key: -2|4 = -24

2. 4. 예시

관측치를 오름차순으로 정렬하면 다음과 같다.

: 44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

일반적으로 잎은 숫자의 마지막 자릿수를 포함하고 줄기는 다른 모든 자릿수를 포함한다. 이 예제에서 잎은 일의 자릿수를 나타내고 줄기는 나머지 숫자(십의 자릿수 이상)를 나타낸다. 줄기 잎 그림은 수직선으로 구분된 두 개의 열로 그려진다. 줄기는 수직선의 왼쪽에 나열되며, 각 줄기는 한 번만 나열된다. 잎은 각 줄기의 오른쪽에 있는 행에 오름차순으로 나열된다. 데이터에 반복되는 숫자가 있는 경우(예: 72가 두 개), 플롯에 반영되어야 한다.

줄기
44 6 7 9
5
63 4 6 8 8
72 2 5 6
81 4 8
9
106



Key: 6|3 = 63

3. 활용

줄기 잎 그림은 데이터의 상대적인 밀도와 모양을 시각적으로 보여주어 자료의 분포를 파악하는 데 유용하다. 또한 이상치를 강조하거나 최빈값을 찾는 데도 도움이 된다.

3. 1. 장점

줄기 잎 그림은 데이터의 상대적인 밀도와 모양을 표시하여 독자에게 분포에 대한 빠른 개요를 제공하는 데 유용하다. (대부분의) 원시 수치 데이터를 그대로 유지하면서 이상치를 강조하고 최빈값을 찾는 데 유용하다.

하지만 줄기 잎 그림은 약 15~150개 데이터 포인트 정도의 중간 크기의 데이터 세트에만 유용하다. 데이터 세트가 매우 작을 경우, 줄기 잎 그림은 결정적인 분포 속성을 설정하는 데 필요한 데이터 포인트 수가 부족하여 거의 쓸모가 없을 수 있으며, 이런 경우에는 점 그림이 더 적합하다. 반대로 데이터 세트가 매우 큰 경우에는 각 데이터 포인트를 숫자적으로 나타내야 하므로 줄기 잎 그림이 매우 복잡해지고, 상자 그림 또는 히스토그램이 더 적절할 수 있다.

3. 2. 한계

줄기 잎 그림은 중간 크기의 데이터 세트(약 15~150개의 데이터 포인트)에만 유용하다. 데이터 세트가 매우 작으면 줄기 잎 그림은 결정적인 분포 속성을 설정하는 데 필요한 데이터 포인트 수가 부족하여 유용성이 떨어질 수 있다. 이러한 경우에는 점 그림이 더 적합할 수 있다. 반대로 데이터 세트가 매우 크면 각 데이터 포인트를 숫자로 나타내야 하므로 줄기 잎 그림이 매우 복잡해진다. 데이터 크기가 증가함에 따라 상자 그림 또는 히스토그램이 더 적절해질 수 있다.

4. 비수치적 활용

줄기 잎 그림은 비수치 정보를 전달하는 데에도 사용할 수 있다. 예를 들어 콜린스 스크래블 단어집(미국 이외 지역의 스크래블 토너먼트에서 사용되는 단어 목록)에 있는 유효한 두 글자 단어를 나타낼 때, 단어의 첫 글자를 줄기로 사용하여 시각화 할 수 있다.



a│abdeghilmnrstwxy

b│aeioy

c│h

d│aeio

e│adefhlmnrstwx

f|aey

g│iou

h│aeimo

i│dfnost

j│ao

k│aioy

l│aio

m│aeimouy

n│aeouy

o│bdefhikmnoprsuwxy

p│aeio

q│i

r│e

s│hiot

t│aeio

u│ghmnprst

v│

w│eo

x│iu

y│aeou

z│aeo


위의 그림을 통해 가장 흔한 세 개의 첫 글자가 o, a, e임을 쉽게 알 수 있다.[5]

일부 철도 시간표는 시간을 줄기로, 분을 잎으로 사용하는 줄기 잎 그림을 사용한다

참조

[1] 서적 Exploratory Data Analysis https://archive.org/[...] Pearson 1977
[2] 문서 Function in Octave https://octave.sourc[...]
[3] 문서 Function in R https://www.rdocumen[...]
[4] 문서 MATLAB's and Matplotlib's stem functions http://www.mathworks[...]
[5] 웹사이트 Two-Letter Scrabble Words Visualized as Stem and Leaf Plot http://gideongoldin.[...] 2020-10-01



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com