Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 351 |
Missing cells | 22 |
Missing cells (%) | 1.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 17.6 KiB |
Average record size in memory | 51.4 B |
Variable types
Text | 2 |
---|---|
Categorical | 2 |
Numeric | 2 |
Dataset
Description | 문화포털(https://www.culture.go.kr/)내에 제공하는 예술지식백과(상위메뉴: 문화지식) 메뉴에서 제공하는 예술용어 관련 설명자료 입니다. |
---|---|
Author | 한국문화정보원 |
URL | https://www.data.go.kr/data/15067530/fileData.do |
분류체계 사용여부 has constant value "" | Constant |
정보분류체계 상위코드 has 22 (6.3%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 22:51:12.990940 |
---|---|
Analysis finished | 2023-12-12 22:51:13.843559 |
Duration | 0.85 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
정보분류체계 제목
Text
Distinct | 242 |
---|---|
Distinct (%) | 68.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
Value | Count | Frequency (%) |
이후 | 10 | 2.5% |
작품 | 8 | 2.0% |
예술가 | 8 | 2.0% |
예술단체 | 8 | 2.0% |
출판목록 | 8 | 2.0% |
영상 | 7 | 1.7% |
교육/학술 | 7 | 1.7% |
웹사이트 | 6 | 1.5% |
음반 | 6 | 1.5% |
출판 | 6 | 1.5% |
Other values (251) | 328 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 103 | 6.1% |
9 | 98 | 5.8% |
년 | 89 | 5.2% |
51 | 3.0% | |
0 | 51 | 3.0% |
대 | 40 | 2.4% |
술 | 38 | 2.2% |
화 | 34 | 2.0% |
문 | 33 | 1.9% |
예 | 33 | 1.9% |
Other values (191) | 1132 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1259 | |
Decimal Number | 352 | 20.7% |
Space Separator | 51 | 3.0% |
Math Symbol | 25 | 1.5% |
Other Punctuation | 12 | 0.7% |
Dash Punctuation | 3 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
년 | 89 | 7.1% |
대 | 40 | 3.2% |
술 | 38 | 3.0% |
화 | 34 | 2.7% |
문 | 33 | 2.6% |
예 | 33 | 2.6% |
가 | 32 | 2.5% |
이 | 31 | 2.5% |
연 | 26 | 2.1% |
전 | 26 | 2.1% |
Other values (175) | 877 |
Decimal Number
Value | Count | Frequency (%) |
1 | 103 | |
9 | 98 | |
0 | 51 | |
5 | 18 | 5.1% |
4 | 17 | 4.8% |
8 | 16 | 4.5% |
6 | 14 | 4.0% |
2 | 13 | 3.7% |
7 | 12 | 3.4% |
3 | 10 | 2.8% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 9 | |
, | 2 | 16.7% |
· | 1 | 8.3% |
Space Separator
Value | Count | Frequency (%) |
51 |
Math Symbol
Value | Count | Frequency (%) |
~ | 25 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1259 | |
Common | 443 | 26.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
년 | 89 | 7.1% |
대 | 40 | 3.2% |
술 | 38 | 3.0% |
화 | 34 | 2.7% |
문 | 33 | 2.6% |
예 | 33 | 2.6% |
가 | 32 | 2.5% |
이 | 31 | 2.5% |
연 | 26 | 2.1% |
전 | 26 | 2.1% |
Other values (175) | 877 |
Common
Value | Count | Frequency (%) |
1 | 103 | |
9 | 98 | |
51 | ||
0 | 51 | |
~ | 25 | 5.6% |
5 | 18 | 4.1% |
4 | 17 | 3.8% |
8 | 16 | 3.6% |
6 | 14 | 3.2% |
2 | 13 | 2.9% |
Other values (6) | 37 | 8.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1259 | |
ASCII | 442 | 26.0% |
None | 1 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 103 | |
9 | 98 | |
51 | ||
0 | 51 | |
~ | 25 | 5.7% |
5 | 18 | 4.1% |
4 | 17 | 3.8% |
8 | 16 | 3.6% |
6 | 14 | 3.2% |
2 | 13 | 2.9% |
Other values (5) | 36 | 8.1% |
Hangul
Value | Count | Frequency (%) |
년 | 89 | 7.1% |
대 | 40 | 3.2% |
술 | 38 | 3.0% |
화 | 34 | 2.7% |
문 | 33 | 2.6% |
예 | 33 | 2.6% |
가 | 32 | 2.5% |
이 | 31 | 2.5% |
연 | 26 | 2.1% |
전 | 26 | 2.1% |
Other values (175) | 877 |
None
Value | Count | Frequency (%) |
· | 1 |
정보분류체계 상위코드
Text
MISSING
 
Distinct | 116 |
---|---|
Distinct (%) | 35.3% |
Missing | 22 |
Missing (%) | 6.3% |
Memory size | 2.9 KiB |
Value | Count | Frequency (%) |
d001 | 10 | 3.0% |
a001 | 9 | 2.7% |
h051 | 8 | 2.4% |
h031 | 7 | 2.1% |
g011 | 7 | 2.1% |
a021 | 7 | 2.1% |
h041 | 7 | 2.1% |
b002 | 6 | 1.8% |
h061 | 6 | 1.8% |
a000 | 5 | 1.5% |
Other values (106) | 257 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 523 | |
1 | 230 | |
2 | 90 | 6.8% |
A | 63 | 4.8% |
B | 54 | 4.1% |
H | 52 | 4.0% |
5 | 38 | 2.9% |
3 | 37 | 2.8% |
4 | 37 | 2.8% |
D | 35 | 2.7% |
Other values (12) | 157 | 11.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 987 | |
Uppercase Letter | 329 | 25.0% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
A | 63 | |
B | 54 | |
H | 52 | |
D | 35 | |
G | 26 | |
C | 26 | |
E | 21 | 6.4% |
J | 19 | 5.8% |
X | 14 | 4.3% |
F | 9 | 2.7% |
Other values (2) | 10 | 3.0% |
Decimal Number
Value | Count | Frequency (%) |
0 | 523 | |
1 | 230 | |
2 | 90 | 9.1% |
5 | 38 | 3.9% |
3 | 37 | 3.7% |
4 | 37 | 3.7% |
6 | 17 | 1.7% |
9 | 6 | 0.6% |
7 | 6 | 0.6% |
8 | 3 | 0.3% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 987 | |
Latin | 329 | 25.0% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
A | 63 | |
B | 54 | |
H | 52 | |
D | 35 | |
G | 26 | |
C | 26 | |
E | 21 | 6.4% |
J | 19 | 5.8% |
X | 14 | 4.3% |
F | 9 | 2.7% |
Other values (2) | 10 | 3.0% |
Common
Value | Count | Frequency (%) |
0 | 523 | |
1 | 230 | |
2 | 90 | 9.1% |
5 | 38 | 3.9% |
3 | 37 | 3.7% |
4 | 37 | 3.7% |
6 | 17 | 1.7% |
9 | 6 | 0.6% |
7 | 6 | 0.6% |
8 | 3 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1316 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 523 | |
1 | 230 | |
2 | 90 | 6.8% |
A | 63 | 4.8% |
B | 54 | 4.1% |
H | 52 | 4.0% |
5 | 38 | 2.9% |
3 | 37 | 2.8% |
4 | 37 | 2.8% |
D | 35 | 2.7% |
Other values (12) | 157 | 11.9% |
정보 분류체계 깊이
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
4 | |
---|---|
3 | |
2 | |
1 | 14 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
4 | 188 | |
3 | 102 | |
2 | 47 | 13.4% |
1 | 14 | 4.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
4 | 188 | |
3 | 102 | |
2 | 47 | 13.4% |
1 | 14 | 4.0% |
정보 분류체계 일련번호
Real number (ℝ)
Distinct | 77 |
---|---|
Distinct (%) | 21.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 24.965812 |
Minimum | 1 |
---|---|
Maximum | 82 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 9 |
median | 20 |
Q3 | 37 |
95-th percentile | 63.5 |
Maximum | 82 |
Range | 81 |
Interquartile range (IQR) | 28 |
Descriptive statistics
Standard deviation | 19.787268 |
---|---|
Coefficient of variation (CV) | 0.79257458 |
Kurtosis | -0.16055902 |
Mean | 24.965812 |
Median Absolute Deviation (MAD) | 14 |
Skewness | 0.83012301 |
Sum | 8763 |
Variance | 391.53597 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 14 | 4.0% |
4 | 11 | 3.1% |
5 | 11 | 3.1% |
6 | 11 | 3.1% |
2 | 11 | 3.1% |
9 | 11 | 3.1% |
8 | 10 | 2.8% |
7 | 10 | 2.8% |
14 | 9 | 2.6% |
15 | 9 | 2.6% |
Other values (67) | 244 |
Value | Count | Frequency (%) |
1 | 14 | |
2 | 11 | |
3 | 9 | |
4 | 11 | |
5 | 11 | |
6 | 11 | |
7 | 10 | |
8 | 10 | |
9 | 11 | |
10 | 9 |
Value | Count | Frequency (%) |
82 | 1 | |
81 | 1 | |
80 | 1 | |
79 | 1 | |
78 | 1 | |
73 | 1 | |
72 | 2 | |
71 | 1 | |
69 | 2 | |
68 | 1 |
정보분류체계 그룹 번호
Real number (ℝ)
Distinct | 15 |
---|---|
Distinct (%) | 4.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.5698006 |
Minimum | 1 |
---|---|
Maximum | 22 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 5 |
Q3 | 9 |
95-th percentile | 21 |
Maximum | 22 |
Range | 21 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 5.2246777 |
---|---|
Coefficient of variation (CV) | 0.79525666 |
Kurtosis | 2.245353 |
Mean | 6.5698006 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 1.4816822 |
Sum | 2306 |
Variance | 27.297257 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 64 | |
3 | 55 | |
9 | 53 | |
5 | 37 | |
4 | 28 | |
8 | 27 | |
11 | 26 | |
7 | 22 | 6.3% |
22 | 15 | 4.3% |
21 | 9 | 2.6% |
Other values (5) | 15 | 4.3% |
Value | Count | Frequency (%) |
1 | 64 | |
3 | 55 | |
4 | 28 | |
5 | 37 | |
6 | 9 | 2.6% |
7 | 22 | 6.3% |
8 | 27 | |
9 | 53 | |
10 | 3 | 0.9% |
11 | 26 |
Value | Count | Frequency (%) |
22 | 15 | 4.3% |
21 | 9 | 2.6% |
19 | 1 | 0.3% |
13 | 1 | 0.3% |
12 | 1 | 0.3% |
11 | 26 | |
10 | 3 | 0.9% |
9 | 53 | |
8 | 27 | |
7 | 22 |
분류체계 사용여부
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
사용 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 사용 |
---|---|
2nd row | 사용 |
3rd row | 사용 |
4th row | 사용 |
5th row | 사용 |
Common Values
Value | Count | Frequency (%) |
사용 | 351 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
사용 | 351 |
정보 분류체계 깊이 | 정보 분류체계 일련번호 | 정보분류체계 그룹 번호 | |
---|---|---|---|
정보 분류체계 깊이 | 1.000 | 0.330 | 0.564 |
정보 분류체계 일련번호 | 0.330 | 1.000 | 0.345 |
정보분류체계 그룹 번호 | 0.564 | 0.345 | 1.000 |
정보 분류체계 일련번호 | 정보분류체계 그룹 번호 | 정보 분류체계 깊이 | |
---|---|---|---|
정보 분류체계 일련번호 | 1.000 | -0.298 | 0.201 |
정보분류체계 그룹 번호 | -0.298 | 1.000 | 0.278 |
정보 분류체계 깊이 | 0.201 | 0.278 | 1.000 |
정보분류체계 제목 | 정보분류체계 상위코드 | 정보 분류체계 깊이 | 정보 분류체계 일련번호 | 정보분류체계 그룹 번호 | 분류체계 사용여부 | |
---|---|---|---|---|---|---|
0 | 무용 | <NA> | 1 | 1 | 4 | 사용 |
1 | 연극 | <NA> | 1 | 1 | 1 | 사용 |
2 | 음악 | <NA> | 1 | 1 | 3 | 사용 |
3 | 미술 | <NA> | 1 | 1 | 5 | 사용 |
4 | 건축 | <NA> | 1 | 1 | 7 | 사용 |
5 | 영상 | <NA> | 1 | 1 | 8 | 사용 |
6 | 문학 | <NA> | 1 | 1 | 9 | 사용 |
7 | 문화정책 | <NA> | 1 | 1 | 10 | 사용 |
8 | 축제문화공간 | <NA> | 1 | 1 | 11 | 사용 |
9 | 관람지원정보 | <NA> | 1 | 1 | 22 | 사용 |
정보분류체계 제목 | 정보분류체계 상위코드 | 정보 분류체계 깊이 | 정보 분류체계 일련번호 | 정보분류체계 그룹 번호 | 분류체계 사용여부 | |
---|---|---|---|---|---|---|
341 | 문학관 | <NA> | 4 | 55 | 11 | 사용 |
342 | 공연장 | <NA> | 4 | 13 | 11 | 사용 |
343 | 영화관 | <NA> | 4 | 14 | 11 | 사용 |
344 | 박물관 | J021 | 4 | 48 | 11 | 사용 |
345 | 전시실 | J021 | 4 | 49 | 11 | 사용 |
346 | 미술관 | J021 | 4 | 50 | 11 | 사용 |
347 | 화랑 | J021 | 4 | 51 | 11 | 사용 |
348 | 문화복지시설 | <NA> | 4 | 52 | 11 | 사용 |
349 | 도서관 | <NA> | 4 | 53 | 11 | 사용 |
350 | 문화보급전수시설 | <NA> | 4 | 54 | 11 | 사용 |