Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.6 KiB |
Average record size in memory | 78.3 B |
Variable types
Categorical | 8 |
---|---|
Numeric | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 지디에스컨설팅그룹 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=e8039240-2dff-11ea-9713-eb3e5186fb38 |
오염원 지역 코드 has constant value "" | Constant |
오염원 경도 is highly overall correlated with 오염원 고유번호 and 3 other fields | High correlation |
오염원 고유번호 is highly overall correlated with 오염원 종류 명 and 3 other fields | High correlation |
오염원 종류 명 is highly overall correlated with 오염원 고유번호 and 3 other fields | High correlation |
오염원 상세 종류 명 is highly overall correlated with 오염원 고유번호 and 3 other fields | High correlation |
오염원 위도 is highly overall correlated with 오염원 고유번호 and 3 other fields | High correlation |
인구수 is highly overall correlated with 연령대 | High correlation |
연령대 is highly overall correlated with 인구수 | High correlation |
Reproduction
Analysis started | 2023-12-10 12:33:57.701455 |
---|---|
Analysis finished | 2023-12-10 12:33:58.963659 |
Duration | 1.26 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
오염원 고유번호
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
1 | |
---|---|
2 | |
3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 40 | |
2 | 40 | |
3 | 20 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 40 | |
2 | 40 | |
3 | 20 |
오염원 지역 코드
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
27000 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 27000 |
---|---|
2nd row | 27000 |
3rd row | 27000 |
4th row | 27000 |
5th row | 27000 |
Common Values
Value | Count | Frequency (%) |
27000 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
27000 | 100 |
오염원 종류 명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
주유소 | |
---|---|
세차장 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 주유소 |
---|---|
2nd row | 주유소 |
3rd row | 주유소 |
4th row | 주유소 |
5th row | 주유소 |
Common Values
Value | Count | Frequency (%) |
주유소 | 60 | |
세차장 | 40 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
주유소 | 60 | |
세차장 | 40 |
오염원 상세 종류 명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
주유소 | |
---|---|
세차장 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 주유소 |
---|---|
2nd row | 주유소 |
3rd row | 주유소 |
4th row | 주유소 |
5th row | 주유소 |
Common Values
Value | Count | Frequency (%) |
주유소 | 60 | |
세차장 | 40 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
주유소 | 60 | |
세차장 | 40 |
오염원 경도
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
1095595.01174 | |
---|---|
1096153.37895 | |
1096684.3279 |
Length
Max length | 13 |
---|---|
Median length | 13 |
Mean length | 12.8 |
Min length | 12 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1095595.01174 |
---|---|
2nd row | 1095595.01174 |
3rd row | 1095595.01174 |
4th row | 1095595.01174 |
5th row | 1095595.01174 |
Common Values
Value | Count | Frequency (%) |
1095595.01174 | 40 | |
1096153.37895 | 40 | |
1096684.3279 | 20 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1095595.01174 | 40 | |
1096153.37895 | 40 | |
1096684.3279 | 20 |
오염원 위도
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
1760933.90633 | |
---|---|
1761643.77909 | |
1761283.12639 |
Length
Max length | 13 |
---|---|
Median length | 13 |
Mean length | 13 |
Min length | 13 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1760933.90633 |
---|---|
2nd row | 1760933.90633 |
3rd row | 1760933.90633 |
4th row | 1760933.90633 |
5th row | 1760933.90633 |
Common Values
Value | Count | Frequency (%) |
1760933.90633 | 40 | |
1761643.77909 | 40 | |
1761283.12639 | 20 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1760933.90633 | 40 | |
1761643.77909 | 40 | |
1761283.12639 | 20 |
연령대
Categorical
HIGH CORRELATION
 
Distinct | 20 |
---|---|
Distinct (%) | 20.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
0 - 4세 | 6 |
---|---|
45 - 49세 | 6 |
15 - 19세 | 6 |
25 - 29세 | 6 |
20 - 24세 | 6 |
Other values (15) |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.76 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 - 4세 |
---|---|
2nd row | 75 - 79세 |
3rd row | 45 - 49세 |
4th row | 15 - 19세 |
5th row | 15 - 19세 |
Common Values
Value | Count | Frequency (%) |
0 - 4세 | 6 | 6.0% |
45 - 49세 | 6 | 6.0% |
15 - 19세 | 6 | 6.0% |
25 - 29세 | 6 | 6.0% |
20 - 24세 | 6 | 6.0% |
35 - 39세 | 6 | 6.0% |
5 - 9세 | 6 | 6.0% |
30 - 34세 | 6 | 6.0% |
10 - 14세 | 6 | 6.0% |
40 - 44세 | 6 | 6.0% |
Other values (10) | 40 |
Length
Value | Count | Frequency (%) |
100 | ||
0 | 6 | 2.0% |
35 | 6 | 2.0% |
40 | 6 | 2.0% |
14세 | 6 | 2.0% |
10 | 6 | 2.0% |
34세 | 6 | 2.0% |
30 | 6 | 2.0% |
9세 | 6 | 2.0% |
5 | 6 | 2.0% |
Other values (31) | 146 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
F | |
---|---|
M |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | F |
---|---|
2nd row | M |
3rd row | F |
4th row | F |
5th row | M |
Common Values
Value | Count | Frequency (%) |
F | 50 | |
M | 50 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
f | 50 | |
m | 50 |
인구수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 60 |
---|---|
Distinct (%) | 60.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 545.01 |
Minimum | 2 |
---|---|
Maximum | 1094 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 20 |
Q1 | 334.75 |
median | 492 |
Q3 | 802 |
95-th percentile | 1082 |
Maximum | 1094 |
Range | 1092 |
Interquartile range (IQR) | 467.25 |
Descriptive statistics
Standard deviation | 321.67282 |
---|---|
Coefficient of variation (CV) | 0.59021453 |
Kurtosis | -1.0250131 |
Mean | 545.01 |
Median Absolute Deviation (MAD) | 282 |
Skewness | 0.05902979 |
Sum | 54501 |
Variance | 103473.4 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
320 | 2 | 2.0% |
210 | 2 | 2.0% |
492 | 2 | 2.0% |
472 | 2 | 2.0% |
666 | 2 | 2.0% |
339 | 2 | 2.0% |
736 | 2 | 2.0% |
10 | 2 | 2.0% |
71 | 2 | 2.0% |
369 | 2 | 2.0% |
Other values (50) | 80 |
Value | Count | Frequency (%) |
2 | 2 | |
10 | 2 | |
20 | 2 | |
54 | 2 | |
71 | 2 | |
88 | 1 | |
119 | 1 | |
158 | 1 | |
160 | 1 | |
166 | 1 |
Value | Count | Frequency (%) |
1094 | 2 | |
1089 | 2 | |
1082 | 2 | |
1046 | 2 | |
1036 | 2 | |
1007 | 2 | |
994 | 2 | |
926 | 2 | |
893 | 2 | |
854 | 2 |
오염원 고유번호 | 오염원 종류 명 | 오염원 상세 종류 명 | 오염원 경도 | 오염원 위도 | 연령대 | 성별 | 인구수 | |
---|---|---|---|---|---|---|---|---|
오염원 고유번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.481 |
오염원 종류 명 | 1.000 | 1.000 | 0.999 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
오염원 상세 종류 명 | 1.000 | 0.999 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
오염원 경도 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.481 |
오염원 위도 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.481 |
연령대 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.936 |
성별 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.201 |
인구수 | 0.481 | 0.000 | 0.000 | 0.481 | 0.481 | 0.936 | 0.201 | 1.000 |
오염원 경도 | 오염원 고유번호 | 오염원 종류 명 | 오염원 상세 종류 명 | 연령대 | 오염원 위도 | 성별 | |
---|---|---|---|---|---|---|---|
오염원 경도 | 1.000 | 1.000 | 0.995 | 0.995 | 0.000 | 1.000 | 0.000 |
오염원 고유번호 | 1.000 | 1.000 | 0.995 | 0.995 | 0.000 | 1.000 | 0.000 |
오염원 종류 명 | 0.995 | 0.995 | 1.000 | 0.979 | 0.000 | 0.995 | 0.000 |
오염원 상세 종류 명 | 0.995 | 0.995 | 0.979 | 1.000 | 0.000 | 0.995 | 0.000 |
연령대 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 |
오염원 위도 | 1.000 | 1.000 | 0.995 | 0.995 | 0.000 | 1.000 | 0.000 |
성별 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
인구수 | 오염원 고유번호 | 오염원 종류 명 | 오염원 상세 종류 명 | 오염원 경도 | 오염원 위도 | 연령대 | 성별 | |
---|---|---|---|---|---|---|---|---|
인구수 | 1.000 | 0.317 | 0.000 | 0.000 | 0.317 | 0.317 | 0.576 | 0.144 |
오염원 고유번호 | 0.317 | 1.000 | 0.995 | 0.995 | 1.000 | 1.000 | 0.000 | 0.000 |
오염원 종류 명 | 0.000 | 0.995 | 1.000 | 0.979 | 0.995 | 0.995 | 0.000 | 0.000 |
오염원 상세 종류 명 | 0.000 | 0.995 | 0.979 | 1.000 | 0.995 | 0.995 | 0.000 | 0.000 |
오염원 경도 | 0.317 | 1.000 | 0.995 | 0.995 | 1.000 | 1.000 | 0.000 | 0.000 |
오염원 위도 | 0.317 | 1.000 | 0.995 | 0.995 | 1.000 | 1.000 | 0.000 | 0.000 |
연령대 | 0.576 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
성별 | 0.144 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
오염원 고유번호 | 오염원 지역 코드 | 오염원 종류 명 | 오염원 상세 종류 명 | 오염원 경도 | 오염원 위도 | 연령대 | 성별 | 인구수 | |
---|---|---|---|---|---|---|---|---|---|
0 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 0 - 4세 | F | 320 |
1 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 75 - 79세 | M | 369 |
2 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 45 - 49세 | F | 893 |
3 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 15 - 19세 | F | 584 |
4 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 15 - 19세 | M | 485 |
5 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 25 - 29세 | M | 780 |
6 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 65 - 69세 | F | 926 |
7 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 45 - 49세 | M | 1007 |
8 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 50 - 54세 | F | 1036 |
9 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 20 - 24세 | M | 727 |
오염원 고유번호 | 오염원 지역 코드 | 오염원 종류 명 | 오염원 상세 종류 명 | 오염원 경도 | 오염원 위도 | 연령대 | 성별 | 인구수 | |
---|---|---|---|---|---|---|---|---|---|
90 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 0 - 4세 | F | 88 |
91 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 0 - 4세 | M | 119 |
92 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 5 - 9세 | F | 166 |
93 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 15 - 19세 | F | 187 |
94 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 35 - 39세 | F | 367 |
95 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 40 - 44세 | F | 346 |
96 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 5 - 9세 | M | 158 |
97 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 40 - 44세 | M | 384 |
98 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 45 - 49세 | F | 427 |
99 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 45 - 49세 | M | 453 |