Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 733 |
Missing cells (%) | 1.5% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 2 |
Numeric | 2 |
Dataset
Description | 측정일자,물재생센터명칭,처리장구분,1차하수처리량,2차하수처리량 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15561/S/1/datasetView.do |
2차하수처리량 is highly overall correlated with 물재생센터명칭 and 1 other fields | High correlation |
물재생센터명칭 is highly overall correlated with 2차하수처리량 and 1 other fields | High correlation |
처리장구분 is highly overall correlated with 2차하수처리량 and 1 other fields | High correlation |
1차하수처리량 has 733 (7.3%) missing values | Missing |
1차하수처리량 has 7132 (71.3%) zeros | Zeros |
Reproduction
Analysis started | 2024-05-18 06:48:16.069656 |
---|---|
Analysis finished | 2024-05-18 06:48:19.515168 |
Duration | 3.45 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
측정일자
Date
Distinct | 2791 |
---|---|
Distinct (%) | 27.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2016-01-01 00:00:00 |
---|---|
Maximum | 2023-10-30 00:00:00 |
물재생센터명칭
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
중랑물재생센터 | |
---|---|
난지물재생센터 | |
서남물재생센터 | |
탄천물재생센터 |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 난지물재생센터 |
---|---|
2nd row | 난지물재생센터 |
3rd row | 난지물재생센터 |
4th row | 서남물재생센터 |
5th row | 탄천물재생센터 |
Common Values
Value | Count | Frequency (%) |
중랑물재생센터 | 3364 | |
난지물재생센터 | 3323 | |
서남물재생센터 | 1786 | |
탄천물재생센터 | 1527 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
중랑물재생센터 | 3364 | |
난지물재생센터 | 3323 | |
서남물재생센터 | 1786 | |
탄천물재생센터 | 1527 |
처리장구분
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
제1처리장 | |
---|---|
제2처리장 | |
제4처리장 | |
제3처리장 | |
정화조오니처리장 | |
Other values (2) |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 5.5665 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 제2처리장 |
---|---|
2nd row | 제1처리장 |
3rd row | 중계펌프장(상암) |
4th row | 제2처리장 |
5th row | 제1처리장 |
Common Values
Value | Count | Frequency (%) |
제1처리장 | 3274 | |
제2처리장 | 3132 | |
제4처리장 | 858 | 8.6% |
제3처리장 | 857 | 8.6% |
정화조오니처리장 | 839 | 8.4% |
중계펌프장(상암) | 787 | 7.9% |
시설현대화 | 253 | 2.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
제1처리장 | 3274 | |
제2처리장 | 3132 | |
제4처리장 | 858 | 8.6% |
제3처리장 | 857 | 8.6% |
정화조오니처리장 | 839 | 8.4% |
중계펌프장(상암 | 787 | 7.9% |
시설현대화 | 253 | 2.5% |
1차하수처리량
Real number (ℝ)
MISSING
  ZEROS
 
Distinct | 1783 |
---|---|
Distinct (%) | 19.2% |
Missing | 733 |
Missing (%) | 7.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10419.56 |
Minimum | 0 |
---|---|
Maximum | 786736 |
Zeros | 7132 |
Zeros (%) | 71.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 52609.3 |
Maximum | 786736 |
Range | 786736 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 48834.742 |
---|---|
Coefficient of variation (CV) | 4.6868334 |
Kurtosis | 70.993992 |
Mean | 10419.56 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 7.4950727 |
Sum | 96558064 |
Variance | 2.3848321 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 7132 | |
40 | 15 | 0.1% |
60 | 10 | 0.1% |
30 | 8 | 0.1% |
200 | 7 | 0.1% |
80 | 7 | 0.1% |
320 | 6 | 0.1% |
20 | 6 | 0.1% |
500 | 6 | 0.1% |
70 | 5 | 0.1% |
Other values (1773) | 2065 | 20.6% |
(Missing) | 733 | 7.3% |
Value | Count | Frequency (%) |
0 | 7132 | |
1 | 1 | < 0.1% |
3 | 1 | < 0.1% |
8 | 1 | < 0.1% |
10 | 5 | 0.1% |
11 | 1 | < 0.1% |
12 | 1 | < 0.1% |
17 | 1 | < 0.1% |
20 | 6 | 0.1% |
22 | 1 | < 0.1% |
Value | Count | Frequency (%) |
786736 | 1 | |
783290 | 1 | |
768850 | 1 | |
677819 | 1 | |
649543 | 1 | |
649236 | 1 | |
618086 | 1 | |
609105 | 1 | |
598983 | 1 | |
577190 | 1 |
2차하수처리량
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 9623 |
---|---|
Distinct (%) | 96.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 326089.86 |
Minimum | 0 |
---|---|
Maximum | 1331833 |
Zeros | 26 |
Zeros (%) | 0.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 4224.95 |
Q1 | 163349.25 |
median | 272874.5 |
Q3 | 437381.75 |
95-th percentile | 877818.1 |
Maximum | 1331833 |
Range | 1331833 |
Interquartile range (IQR) | 274032.5 |
Descriptive statistics
Standard deviation | 254572.74 |
---|---|
Coefficient of variation (CV) | 0.78068279 |
Kurtosis | 0.29486581 |
Mean | 326089.86 |
Median Absolute Deviation (MAD) | 130649 |
Skewness | 0.89652487 |
Sum | 3.2608986 × 109 |
Variance | 6.4807281 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 26 | 0.3% |
1080000.0 | 5 | 0.1% |
845040.0 | 5 | 0.1% |
7841.0 | 5 | 0.1% |
660000.0 | 5 | 0.1% |
175000.0 | 4 | < 0.1% |
591120.0 | 4 | < 0.1% |
9247.0 | 4 | < 0.1% |
8935.0 | 4 | < 0.1% |
4700.0 | 4 | < 0.1% |
Other values (9613) | 9934 |
Value | Count | Frequency (%) |
0.0 | 26 | |
126.0 | 1 | < 0.1% |
141.0 | 1 | < 0.1% |
148.0 | 2 | < 0.1% |
174.0 | 1 | < 0.1% |
229.0 | 1 | < 0.1% |
410.0 | 1 | < 0.1% |
413.0 | 1 | < 0.1% |
424.0 | 1 | < 0.1% |
605.0 | 1 | < 0.1% |
Value | Count | Frequency (%) |
1331833.0 | 1 | |
1088705.0 | 1 | |
1084480.0 | 1 | |
1082879.0 | 1 | |
1082471.0 | 1 | |
1081254.0 | 1 | |
1080912.0 | 1 | |
1080864.0 | 1 | |
1080840.0 | 2 | |
1080816.0 | 1 |
물재생센터명칭 | 처리장구분 | 1차하수처리량 | 2차하수처리량 | |
---|---|---|---|---|
물재생센터명칭 | 1.000 | 0.668 | 0.211 | 0.782 |
처리장구분 | 0.668 | 1.000 | 0.109 | 0.767 |
1차하수처리량 | 0.211 | 0.109 | 1.000 | 0.518 |
2차하수처리량 | 0.782 | 0.767 | 0.518 | 1.000 |
처리장구분 | 물재생센터명칭 | |
---|---|---|
처리장구분 | 1.000 | 0.531 |
물재생센터명칭 | 0.531 | 1.000 |
1차하수처리량 | 2차하수처리량 | 물재생센터명칭 | 처리장구분 | |
---|---|---|---|---|
1차하수처리량 | 1.000 | 0.070 | 0.127 | 0.055 |
2차하수처리량 | 0.070 | 1.000 | 0.600 | 0.529 |
물재생센터명칭 | 0.127 | 0.600 | 1.000 | 0.531 |
처리장구분 | 0.055 | 0.529 | 0.531 | 1.000 |
측정일자 | 물재생센터명칭 | 처리장구분 | 1차하수처리량 | 2차하수처리량 | |
---|---|---|---|---|---|
23239 | 2018/05/08 | 난지물재생센터 | 제2처리장 | 0 | 323396.28 |
5448 | 2022/04/06 | 난지물재생센터 | 제1처리장 | 0 | 230405.0 |
7422 | 2021/11/05 | 난지물재생센터 | 중계펌프장(상암) | <NA> | 10902.0 |
12957 | 2020/09/05 | 서남물재생센터 | 제2처리장 | 246791 | 1080000.0 |
26627 | 2017/07/29 | 탄천물재생센터 | 제1처리장 | 0 | 442951.0 |
6559 | 2022/01/10 | 중랑물재생센터 | 제2처리장 | 0 | 238303.0 |
23161 | 2018/05/14 | 중랑물재생센터 | 제3처리장 | 1010 | 721431.0 |
30016 | 2016/10/20 | 서남물재생센터 | 제2처리장 | 0 | 973800.0 |
24143 | 2018/02/21 | 탄천물재생센터 | 제1처리장 | 0 | 387306.0 |
22261 | 2018/07/28 | 중랑물재생센터 | 제3처리장 | 6470 | 774386.0 |
측정일자 | 물재생센터명칭 | 처리장구분 | 1차하수처리량 | 2차하수처리량 | |
---|---|---|---|---|---|
21106 | 2018/11/01 | 탄천물재생센터 | 제2처리장 | 0 | 320522.0 |
13732 | 2020/07/07 | 탄천물재생센터 | 제1처리장 | 0 | 412980.0 |
9439 | 2021/06/03 | 난지물재생센터 | 제1처리장 | 6119 | 326230.0 |
33087 | 2016/01/17 | 탄천물재생센터 | 제1처리장 | 0 | 368495.0 |
19733 | 2019/02/24 | 서남물재생센터 | 제1처리장 | 0 | 498165.0 |
11135 | 2021/01/23 | 중랑물재생센터 | 제2처리장 | 0 | 258441.0 |
11570 | 2020/12/21 | 난지물재생센터 | 제2처리장 | 0 | 275655.0 |
7324 | 2021/11/12 | 중랑물재생센터 | 제4처리장 | 0 | 165990.0 |
7709 | 2021/10/14 | 난지물재생센터 | 제2처리장 | 0 | 312836.0 |
31583 | 2016/06/02 | 중랑물재생센터 | 제2처리장 | 0 | 242758.0 |