Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 2 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
Categorical | 1 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 대전광역시 2020년 횡단보도 통계 및 현황입니다. 2022년 공공데이터 기업매칭지원사업으로 수행되었습니다. |
---|---|
Author | 대전광역시 |
URL | https://www.data.go.kr/data/15111036/fileData.do |
Dataset has 2 (< 0.1%) duplicate rows | Duplicates |
경도 is highly overall correlated with 구명 | High correlation |
구명 is highly overall correlated with 경도 | High correlation |
Reproduction
Analysis started | 2023-12-12 20:15:39.839198 |
---|---|
Analysis finished | 2023-12-12 20:15:41.059947 |
Duration | 1.22 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구명
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
유성구 | |
---|---|
서구 | |
동구 | |
중구 | |
대덕구 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.4323 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 중구 |
---|---|
2nd row | 중구 |
3rd row | 유성구 |
4th row | 유성구 |
5th row | 서구 |
Common Values
Value | Count | Frequency (%) |
유성구 | 2888 | |
서구 | 2413 | |
동구 | 1761 | |
중구 | 1503 | |
대덕구 | 1435 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
유성구 | 2888 | |
서구 | 2413 | |
동구 | 1761 | |
중구 | 1503 | |
대덕구 | 1435 |
동명
Text
Distinct | 154 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
둔산동 | 393 | 3.9% |
관저동 | 347 | 3.5% |
봉명동 | 242 | 2.4% |
오정동 | 232 | 2.3% |
지족동 | 218 | 2.2% |
탄방동 | 188 | 1.9% |
학하동 | 187 | 1.9% |
월평동 | 187 | 1.9% |
가양동 | 187 | 1.9% |
도마동 | 185 | 1.8% |
Other values (144) | 7634 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 10000 | |
산 | 698 | 2.4% |
대 | 696 | 2.4% |
정 | 632 | 2.1% |
용 | 569 | 1.9% |
도 | 547 | 1.9% |
평 | 540 | 1.8% |
관 | 513 | 1.7% |
가 | 493 | 1.7% |
성 | 478 | 1.6% |
Other values (109) | 14278 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29444 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 10000 | |
산 | 698 | 2.4% |
대 | 696 | 2.4% |
정 | 632 | 2.1% |
용 | 569 | 1.9% |
도 | 547 | 1.9% |
평 | 540 | 1.8% |
관 | 513 | 1.7% |
가 | 493 | 1.7% |
성 | 478 | 1.6% |
Other values (109) | 14278 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29444 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 10000 | |
산 | 698 | 2.4% |
대 | 696 | 2.4% |
정 | 632 | 2.1% |
용 | 569 | 1.9% |
도 | 547 | 1.9% |
평 | 540 | 1.8% |
관 | 513 | 1.7% |
가 | 493 | 1.7% |
성 | 478 | 1.6% |
Other values (109) | 14278 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29444 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 10000 | |
산 | 698 | 2.4% |
대 | 696 | 2.4% |
정 | 632 | 2.1% |
용 | 569 | 1.9% |
도 | 547 | 1.9% |
평 | 540 | 1.8% |
관 | 513 | 1.7% |
가 | 493 | 1.7% |
성 | 478 | 1.6% |
Other values (109) | 14278 |
지번
Text
Distinct | 3106 |
---|---|
Distinct (%) | 31.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
번지 | 1416 | 12.4% |
630번지 | 128 | 1.1% |
260-1번지 | 72 | 0.6% |
255-1번지 | 61 | 0.5% |
458번지 | 57 | 0.5% |
531번지 | 52 | 0.5% |
385-1 | 49 | 0.4% |
465번지 | 49 | 0.4% |
457 | 44 | 0.4% |
292번지 | 44 | 0.4% |
Other values (3097) | 9446 |
Most occurring characters
Value | Count | Frequency (%) |
번 | 10000 | |
지 | 10000 | |
1 | 5585 | |
5 | 3944 | 6.6% |
2 | 3823 | 6.4% |
4 | 3652 | 6.1% |
3 | 3473 | 5.8% |
6 | 3422 | 5.7% |
- | 3328 | 5.6% |
7 | 3128 | 5.2% |
Other values (6) | 9464 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 34961 | |
Other Letter | 20112 | |
Dash Punctuation | 3328 | 5.6% |
Space Separator | 1418 | 2.4% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 5585 | |
5 | 3944 | |
2 | 3823 | |
4 | 3652 | |
3 | 3473 | |
6 | 3422 | |
7 | 3128 | |
0 | 2946 | |
9 | 2516 | |
8 | 2472 |
Other Letter
Value | Count | Frequency (%) |
번 | 10000 | |
지 | 10000 | |
산 | 98 | 0.5% |
도 | 14 | 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3328 |
Space Separator
Value | Count | Frequency (%) |
1418 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 39707 | |
Hangul | 20112 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 5585 | |
5 | 3944 | |
2 | 3823 | |
4 | 3652 | |
3 | 3473 | |
6 | 3422 | |
- | 3328 | |
7 | 3128 | |
0 | 2946 | |
9 | 2516 | |
Other values (2) | 3890 |
Hangul
Value | Count | Frequency (%) |
번 | 10000 | |
지 | 10000 | |
산 | 98 | 0.5% |
도 | 14 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 39707 | |
Hangul | 20112 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
번 | 10000 | |
지 | 10000 | |
산 | 98 | 0.5% |
도 | 14 | 0.1% |
ASCII
Value | Count | Frequency (%) |
1 | 5585 | |
5 | 3944 | |
2 | 3823 | |
4 | 3652 | |
3 | 3473 | |
6 | 3422 | |
- | 3328 | |
7 | 3128 | |
0 | 2946 | |
9 | 2516 | |
Other values (2) | 3890 |
경도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7701 |
---|---|
Distinct (%) | 77.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 127.38963 |
Minimum | 127.27019 |
---|---|
Maximum | 127.53756 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 127.27019 |
---|---|
5-th percentile | 127.30999 |
Q1 | 127.34888 |
median | 127.39244 |
Q3 | 127.42714 |
95-th percentile | 127.45756 |
Maximum | 127.53756 |
Range | 0.26737 |
Interquartile range (IQR) | 0.078255 |
Descriptive statistics
Standard deviation | 0.046221192 |
---|---|
Coefficient of variation (CV) | 0.00036283324 |
Kurtosis | -0.88044243 |
Mean | 127.38963 |
Median Absolute Deviation (MAD) | 0.037642 |
Skewness | -0.19975885 |
Sum | 1273896.3 |
Variance | 0.0021363985 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
127.389244 | 7 | 0.1% |
127.37665 | 6 | 0.1% |
127.340576 | 6 | 0.1% |
127.376656 | 6 | 0.1% |
127.38029 | 6 | 0.1% |
127.38374 | 5 | 0.1% |
127.37901 | 5 | 0.1% |
127.37417 | 5 | 0.1% |
127.4354 | 5 | 0.1% |
127.43011 | 5 | 0.1% |
Other values (7691) | 9944 |
Value | Count | Frequency (%) |
127.27019 | 1 | |
127.273476 | 1 | |
127.27948 | 1 | |
127.279884 | 1 | |
127.28087 | 1 | |
127.28109 | 1 | |
127.281586 | 1 | |
127.28401 | 1 | |
127.28446 | 1 | |
127.28618 | 1 |
Value | Count | Frequency (%) |
127.53756 | 1 | |
127.53566 | 1 | |
127.534424 | 1 | |
127.5336 | 1 | |
127.53199 | 1 | |
127.53137 | 1 | |
127.53055 | 1 | |
127.5191 | 1 | |
127.515686 | 1 | |
127.51479 | 1 |
위도
Real number (ℝ)
Distinct | 8440 |
---|---|
Distinct (%) | 84.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 36.347559 |
Minimum | 36.200626 |
---|---|
Maximum | 36.474888 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 36.200626 |
---|---|
5-th percentile | 36.29581 |
Q1 | 36.321462 |
median | 36.343235 |
Q3 | 36.364611 |
95-th percentile | 36.432522 |
Maximum | 36.474888 |
Range | 0.274262 |
Interquartile range (IQR) | 0.04314825 |
Descriptive statistics
Standard deviation | 0.040161238 |
---|---|
Coefficient of variation (CV) | 0.0011049226 |
Kurtosis | 0.71670706 |
Mean | 36.347559 |
Median Absolute Deviation (MAD) | 0.0216235 |
Skewness | 0.55776881 |
Sum | 363475.59 |
Variance | 0.001612925 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
36.348747 | 7 | 0.1% |
36.338062 | 5 | 0.1% |
36.359684 | 5 | 0.1% |
36.355495 | 5 | 0.1% |
36.303043 | 4 | < 0.1% |
36.305943 | 4 | < 0.1% |
36.356174 | 4 | < 0.1% |
36.32147 | 4 | < 0.1% |
36.35584 | 4 | < 0.1% |
36.353565 | 4 | < 0.1% |
Other values (8430) | 9954 |
Value | Count | Frequency (%) |
36.200626 | 1 | |
36.21362 | 1 | |
36.21651 | 1 | |
36.216564 | 1 | |
36.21792 | 1 | |
36.21805 | 1 | |
36.21817 | 1 | |
36.2182 | 1 | |
36.21828 | 1 | |
36.21832 | 1 |
Value | Count | Frequency (%) |
36.474888 | 1 | |
36.4727 | 1 | |
36.472233 | 1 | |
36.471462 | 1 | |
36.471428 | 1 | |
36.47035 | 1 | |
36.470116 | 1 | |
36.469463 | 1 | |
36.469036 | 1 | |
36.46709 | 1 |
구명 | 경도 | 위도 | |
---|---|---|---|
구명 | 1.000 | 0.906 | 0.792 |
경도 | 0.906 | 1.000 | 0.630 |
위도 | 0.792 | 0.630 | 1.000 |
경도 | 위도 | 구명 | |
---|---|---|---|
경도 | 1.000 | -0.078 | 0.600 |
위도 | -0.078 | 1.000 | 0.448 |
구명 | 0.600 | 0.448 | 1.000 |
구명 | 동명 | 지번 | 경도 | 위도 | |
---|---|---|---|---|---|
11666 | 중구 | 태평동 | 531번지 | 127.3968 | 36.33008 |
11864 | 중구 | 유천동 | 460번지 | 127.395874 | 36.32204 |
9762 | 유성구 | 어은동 | 59-12번지 | 127.35749 | 36.361904 |
10170 | 유성구 | 추목동 | 557-2번지 | 127.34424 | 36.41292 |
5881 | 서구 | 정림동 | 704번지 | 127.36648 | 36.30145 |
1042 | 대덕구 | 송촌동 | 568번지 | 127.44589 | 36.359684 |
10235 | 유성구 | 덕명동 | 563 번지 | 127.30167 | 36.35842 |
11449 | 중구 | 용두동 | 143-26번지 | 127.40589 | 36.33189 |
3850 | 동구 | 용운동 | 757번지 | 127.4553 | 36.33272 |
9595 | 유성구 | 관평동 | 673번지 | 127.387405 | 36.42176 |
구명 | 동명 | 지번 | 경도 | 위도 | |
---|---|---|---|---|---|
10252 | 유성구 | 도룡동 | 4-25번지 | 127.39623 | 36.376595 |
7794 | 유성구 | 관평동 | 1292번지 | 127.38823 | 36.426685 |
5336 | 서구 | 변동 | 254-416번지 | 127.36811 | 36.331303 |
8406 | 유성구 | 용계동 | 684 번지 | 127.335106 | 36.328815 |
9951 | 유성구 | 지족동 | 1112 번지 | 127.305214 | 36.38917 |
2120 | 동구 | 홍도동 | 842-1번지 | 127.42773 | 36.345535 |
9201 | 유성구 | 관평동 | 1286번지 | 127.38837 | 36.427555 |
8318 | 유성구 | 상대동 | 497번지 | 127.33905 | 36.345505 |
493 | 대덕구 | 덕암동 | 342번지 | 127.42699 | 36.439724 |
2543 | 동구 | 용운동 | 77번지 | 127.45947 | 36.34296 |
Most frequently occurring
구명 | 동명 | 지번 | 경도 | 위도 | # duplicates | |
---|---|---|---|---|---|---|
0 | 동구 | 신흥동 | 152-2번지 | 127.440865 | 36.32583 | 2 |
1 | 서구 | 관저동 | 1506번지 | 127.340576 | 36.299034 | 2 |