Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 247 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 16.5 KiB |
Average record size in memory | 68.5 B |
Variable types
Numeric | 3 |
---|---|
Text | 1 |
Categorical | 3 |
Boolean | 1 |
Dataset
Description | 한국환경공단에서 운영하는 폐기물처분부담금시스템의 지역별 사업장 및 사업자에 대한 우편번호 등록 시 현황 정보 입니다. |
---|---|
URL | https://www.data.go.kr/data/15069390/fileData.do |
사용여부 has constant value "" | Constant |
기타 is highly overall correlated with 레벨 | High correlation |
레벨 is highly overall correlated with 기타 | High correlation |
시군구코드 is highly overall correlated with 시도코드 and 1 other fields | High correlation |
시도코드 is highly overall correlated with 시군구코드 and 1 other fields | High correlation |
시도명 is highly overall correlated with 시군구코드 and 1 other fields | High correlation |
레벨 is highly imbalanced (63.8%) | Imbalance |
기타 is highly imbalanced (63.8%) | Imbalance |
시군구코드 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 14:46:32.398280 |
---|---|
Analysis finished | 2023-12-12 14:46:33.897336 |
Duration | 1.5 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군구코드
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 247 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.8250947 × 109 |
Minimum | 1.1 × 109 |
---|---|
Maximum | 5.183 × 109 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.3 KiB |
Quantile statistics
Minimum | 1.1 × 109 |
---|---|
5-th percentile | 1.1389 × 109 |
Q1 | 2.8485 × 109 |
median | 4.3745 × 109 |
Q3 | 4.714 × 109 |
95-th percentile | 5.1204 × 109 |
Maximum | 5.183 × 109 |
Range | 4.083 × 109 |
Interquartile range (IQR) | 1.8655 × 109 |
Descriptive statistics
Standard deviation | 1.212776 × 109 |
---|---|
Coefficient of variation (CV) | 0.31705778 |
Kurtosis | -0.065304792 |
Mean | 3.8250947 × 109 |
Median Absolute Deviation (MAD) | 4.375 × 108 |
Skewness | -1.0361967 |
Sum | 9.447984 × 1011 |
Variance | 1.4708257 × 1018 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1100000000 | 1 | 0.4% |
4680000000 | 1 | 0.4% |
5176000000 | 1 | 0.4% |
4380000000 | 1 | 0.4% |
4477000000 | 1 | 0.4% |
4575000000 | 1 | 0.4% |
4679000000 | 1 | 0.4% |
4772000000 | 1 | 0.4% |
4874000000 | 1 | 0.4% |
1138000000 | 1 | 0.4% |
Other values (237) | 237 |
Value | Count | Frequency (%) |
1100000000 | 1 | |
1111000000 | 1 | |
1114000000 | 1 | |
1117000000 | 1 | |
1120000000 | 1 | |
1121500000 | 1 | |
1123000000 | 1 | |
1126000000 | 1 | |
1129000000 | 1 | |
1130500000 | 1 |
Value | Count | Frequency (%) |
5183000000 | 1 | |
5182000000 | 1 | |
5181000000 | 1 | |
5180000000 | 1 | |
5179000000 | 1 | |
5178000000 | 1 | |
5177000000 | 1 | |
5176000000 | 1 | |
5175000000 | 1 | |
5173000000 | 1 |
시군구명
Text
Distinct | 223 |
---|---|
Distinct (%) | 90.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
Value | Count | Frequency (%) |
동구 | 6 | 2.4% |
중구 | 6 | 2.4% |
서구 | 5 | 2.0% |
남구 | 4 | 1.6% |
북구 | 4 | 1.6% |
군위군 | 2 | 0.8% |
세종특별자치시 | 2 | 0.8% |
고성군 | 2 | 0.8% |
강서구 | 2 | 0.8% |
서대문구 | 1 | 0.4% |
Other values (213) | 213 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 87 | 11.4% |
군 | 87 | 11.4% |
구 | 75 | 9.8% |
천 | 23 | 3.0% |
주 | 22 | 2.9% |
성 | 18 | 2.4% |
양 | 18 | 2.4% |
산 | 18 | 2.4% |
동 | 17 | 2.2% |
남 | 15 | 2.0% |
Other values (129) | 382 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 762 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 87 | 11.4% |
군 | 87 | 11.4% |
구 | 75 | 9.8% |
천 | 23 | 3.0% |
주 | 22 | 2.9% |
성 | 18 | 2.4% |
양 | 18 | 2.4% |
산 | 18 | 2.4% |
동 | 17 | 2.2% |
남 | 15 | 2.0% |
Other values (129) | 382 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 762 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 87 | 11.4% |
군 | 87 | 11.4% |
구 | 75 | 9.8% |
천 | 23 | 3.0% |
주 | 22 | 2.9% |
성 | 18 | 2.4% |
양 | 18 | 2.4% |
산 | 18 | 2.4% |
동 | 17 | 2.2% |
남 | 15 | 2.0% |
Other values (129) | 382 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 762 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 87 | 11.4% |
군 | 87 | 11.4% |
구 | 75 | 9.8% |
천 | 23 | 3.0% |
주 | 22 | 2.9% |
성 | 18 | 2.4% |
양 | 18 | 2.4% |
산 | 18 | 2.4% |
동 | 17 | 2.2% |
남 | 15 | 2.0% |
Other values (129) | 382 |
레벨
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
1 | |
---|---|
0 | 17 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
1 | 230 | |
0 | 17 | 6.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 230 | |
0 | 17 | 6.9% |
시도명
Categorical
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 6.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
경기도 | |
---|---|
서울특별시 | |
경상북도 | |
전라남도 | |
강원특별자치도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.4939271 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 부산광역시 |
3rd row | 대구광역시 |
4th row | 인천광역시 |
5th row | 광주광역시 |
Common Values
Value | Count | Frequency (%) |
경기도 | 32 | |
서울특별시 | 26 | |
경상북도 | 24 | |
전라남도 | 23 | |
강원특별자치도 | 19 | |
경상남도 | 19 | |
부산광역시 | 17 | 6.9% |
충청남도 | 16 | 6.5% |
전라북도 | 15 | 6.1% |
충청북도 | 12 | 4.9% |
Other values (7) | 44 |
Length
Value | Count | Frequency (%) |
경기도 | 32 | |
서울특별시 | 26 | |
경상북도 | 24 | |
전라남도 | 23 | |
강원특별자치도 | 19 | |
경상남도 | 19 | |
부산광역시 | 17 | 6.9% |
충청남도 | 16 | 6.5% |
전라북도 | 15 | 6.1% |
충청북도 | 12 | 4.9% |
Other values (7) | 44 |
시도코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 6.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.7821862 × 109 |
Minimum | 1.1 × 109 |
---|---|
Maximum | 5.1 × 109 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.3 KiB |
Quantile statistics
Minimum | 1.1 × 109 |
---|---|
5-th percentile | 1.1 × 109 |
Q1 | 2.8 × 109 |
median | 4.3 × 109 |
Q3 | 4.7 × 109 |
95-th percentile | 5.1 × 109 |
Maximum | 5.1 × 109 |
Range | 4 × 109 |
Interquartile range (IQR) | 1.9 × 109 |
Descriptive statistics
Standard deviation | 1.205242 × 109 |
---|---|
Coefficient of variation (CV) | 0.31866278 |
Kurtosis | -0.018415962 |
Mean | 3.7821862 × 109 |
Median Absolute Deviation (MAD) | 5 × 108 |
Skewness | -1.0526831 |
Sum | 9.342 × 1011 |
Variance | 1.4526082 × 1018 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4100000000 | 32 | |
1100000000 | 26 | |
4700000000 | 24 | |
4600000000 | 23 | |
4800000000 | 19 | |
5100000000 | 19 | |
2600000000 | 17 | 6.9% |
4400000000 | 16 | 6.5% |
4500000000 | 15 | 6.1% |
4300000000 | 12 | 4.9% |
Other values (7) | 44 |
Value | Count | Frequency (%) |
1100000000 | 26 | |
2600000000 | 17 | |
2700000000 | 10 | 4.0% |
2800000000 | 11 | 4.5% |
2900000000 | 6 | 2.4% |
3000000000 | 6 | 2.4% |
3100000000 | 6 | 2.4% |
3600000000 | 2 | 0.8% |
4100000000 | 32 | |
4300000000 | 12 | 4.9% |
Value | Count | Frequency (%) |
5100000000 | 19 | |
5000000000 | 3 | 1.2% |
4800000000 | 19 | |
4700000000 | 24 | |
4600000000 | 23 | |
4500000000 | 15 | |
4400000000 | 16 | |
4300000000 | 12 | 4.9% |
4100000000 | 32 | |
3600000000 | 2 | 0.8% |
기타
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
지자체 | |
---|---|
광역시도 | 17 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0688259 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 광역시도 |
---|---|
2nd row | 광역시도 |
3rd row | 광역시도 |
4th row | 광역시도 |
5th row | 광역시도 |
Common Values
Value | Count | Frequency (%) |
지자체 | 230 | |
광역시도 | 17 | 6.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지자체 | 230 | |
광역시도 | 17 | 6.9% |
정렬
Real number (ℝ)
Distinct | 32 |
---|---|
Distinct (%) | 13.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10.182186 |
Minimum | 1 |
---|---|
Maximum | 32 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 4 |
median | 9 |
Q3 | 15 |
95-th percentile | 23.7 |
Maximum | 32 |
Range | 31 |
Interquartile range (IQR) | 11 |
Descriptive statistics
Standard deviation | 7.1427949 |
---|---|
Coefficient of variation (CV) | 0.70149914 |
Kurtosis | -0.072259808 |
Mean | 10.182186 |
Median Absolute Deviation (MAD) | 5 |
Skewness | 0.75760583 |
Sum | 2515 |
Variance | 51.019519 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
1 | 17 | 6.9% |
2 | 17 | 6.9% |
3 | 16 | 6.5% |
4 | 15 | 6.1% |
5 | 15 | 6.1% |
6 | 15 | 6.1% |
7 | 12 | 4.9% |
8 | 12 | 4.9% |
9 | 12 | 4.9% |
10 | 12 | 4.9% |
Other values (22) | 104 |
Value | Count | Frequency (%) |
1 | 17 | |
2 | 17 | |
3 | 16 | |
4 | 15 | |
5 | 15 | |
6 | 15 | |
7 | 12 | |
8 | 12 | |
9 | 12 | |
10 | 12 |
Value | Count | Frequency (%) |
32 | 1 | 0.4% |
31 | 1 | 0.4% |
30 | 1 | 0.4% |
29 | 1 | 0.4% |
28 | 1 | 0.4% |
27 | 1 | 0.4% |
26 | 2 | |
25 | 2 | |
24 | 3 | |
23 | 4 |
사용여부
Boolean
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 379.0 B |
True |
---|
Value | Count | Frequency (%) |
True | 247 |
시군구코드 | 레벨 | 시도명 | 시도코드 | 기타 | 정렬 | |
---|---|---|---|---|---|---|
시군구코드 | 1.000 | 0.166 | 0.978 | 0.960 | 0.166 | 0.326 |
레벨 | 0.166 | 1.000 | 0.000 | 0.172 | 0.999 | 0.545 |
시도명 | 0.978 | 0.000 | 1.000 | 1.000 | 0.000 | 0.085 |
시도코드 | 0.960 | 0.172 | 1.000 | 1.000 | 0.172 | 0.316 |
기타 | 0.166 | 0.999 | 0.000 | 0.172 | 1.000 | 0.545 |
정렬 | 0.326 | 0.545 | 0.085 | 0.316 | 0.545 | 1.000 |
시도명 | 기타 | 레벨 | |
---|---|---|---|
시도명 | 1.000 | 0.000 | 0.000 |
기타 | 0.000 | 1.000 | 0.968 |
레벨 | 0.000 | 0.968 | 1.000 |
시군구코드 | 시도코드 | 정렬 | 레벨 | 시도명 | 기타 | |
---|---|---|---|---|---|---|
시군구코드 | 1.000 | 0.996 | 0.120 | 0.083 | 0.880 | 0.083 |
시도코드 | 0.996 | 1.000 | 0.051 | 0.112 | 0.979 | 0.112 |
정렬 | 0.120 | 0.051 | 1.000 | 0.414 | 0.028 | 0.414 |
레벨 | 0.083 | 0.112 | 0.414 | 1.000 | 0.000 | 0.968 |
시도명 | 0.880 | 0.979 | 0.028 | 0.000 | 1.000 | 0.000 |
기타 | 0.083 | 0.112 | 0.414 | 0.968 | 0.000 | 1.000 |
시군구코드 | 시군구명 | 레벨 | 시도명 | 시도코드 | 기타 | 정렬 | 사용여부 | |
---|---|---|---|---|---|---|---|---|
0 | 1100000000 | 서울특별시 | 0 | 서울특별시 | 1100000000 | 광역시도 | 1 | Y |
1 | 2600000000 | 부산광역시 | 0 | 부산광역시 | 2600000000 | 광역시도 | 1 | Y |
2 | 2700000000 | 대구광역시 | 0 | 대구광역시 | 2700000000 | 광역시도 | 1 | Y |
3 | 2800000000 | 인천광역시 | 0 | 인천광역시 | 2800000000 | 광역시도 | 1 | Y |
4 | 2900000000 | 광주광역시 | 0 | 광주광역시 | 2900000000 | 광역시도 | 1 | Y |
5 | 3000000000 | 대전광역시 | 0 | 대전광역시 | 3000000000 | 광역시도 | 1 | Y |
6 | 3100000000 | 울산광역시 | 0 | 울산광역시 | 3100000000 | 광역시도 | 1 | Y |
7 | 3600000000 | 세종특별자치시 | 0 | 세종특별자치시 | 3600000000 | 광역시도 | 1 | Y |
8 | 4100000000 | 경기도 | 0 | 경기도 | 4100000000 | 광역시도 | 1 | Y |
9 | 5100000000 | 강원특별자치도 | 0 | 강원특별자치도 | 5100000000 | 광역시도 | 1 | Y |
시군구코드 | 시군구명 | 레벨 | 시도명 | 시도코드 | 기타 | 정렬 | 사용여부 | |
---|---|---|---|---|---|---|---|---|
237 | 1171000000 | 송파구 | 1 | 서울특별시 | 1100000000 | 지자체 | 25 | Y |
238 | 4159000000 | 화성시 | 1 | 경기도 | 4100000000 | 지자체 | 25 | Y |
239 | 1174000000 | 강동구 | 1 | 서울특별시 | 1100000000 | 지자체 | 26 | Y |
240 | 4161000000 | 광주시 | 1 | 경기도 | 4100000000 | 지자체 | 26 | Y |
241 | 4163000000 | 양주시 | 1 | 경기도 | 4100000000 | 지자체 | 27 | Y |
242 | 4165000000 | 포천시 | 1 | 경기도 | 4100000000 | 지자체 | 28 | Y |
243 | 4167000000 | 여주시 | 1 | 경기도 | 4100000000 | 지자체 | 29 | Y |
244 | 4180000000 | 연천군 | 1 | 경기도 | 4100000000 | 지자체 | 30 | Y |
245 | 4182000000 | 가평군 | 1 | 경기도 | 4100000000 | 지자체 | 31 | Y |
246 | 4183000000 | 양평군 | 1 | 경기도 | 4100000000 | 지자체 | 32 | Y |