Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 8417 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 622 |
Duplicate rows (%) | 7.4% |
Total size in memory | 263.2 KiB |
Average record size in memory | 32.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 1 |
Dataset
Description | 2020년 대전광역시 안전사고 발생위치 자료입니다. 안전사고란 상해, 낙상, 추락, 열상 기타 등을 기본으로 추출하였습니다. |
---|---|
Author | 대전광역시 |
URL | https://www.data.go.kr/data/15091990/fileData.do |
시 has constant value "" | Constant |
Dataset has 622 (7.4%) duplicate rows | Duplicates |
사고유형 is highly imbalanced (52.6%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 23:47:32.548106 |
---|---|
Analysis finished | 2023-12-12 23:47:32.914167 |
Duration | 0.37 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.9 KiB |
대전광역시 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대전광역시 |
---|---|
2nd row | 대전광역시 |
3rd row | 대전광역시 |
4th row | 대전광역시 |
5th row | 대전광역시 |
Common Values
Value | Count | Frequency (%) |
대전광역시 | 8417 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대전광역시 | 8417 |
구
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.9 KiB |
서구 | |
---|---|
유성구 | |
동구 | |
중구 | |
대덕구 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.3546394 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서구 |
---|---|
2nd row | 서구 |
3rd row | 서구 |
4th row | 서구 |
5th row | 서구 |
Common Values
Value | Count | Frequency (%) |
서구 | 2233 | |
유성구 | 1735 | |
동구 | 1680 | |
중구 | 1519 | |
대덕구 | 1250 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서구 | 2233 | |
유성구 | 1735 | |
동구 | 1680 | |
중구 | 1519 | |
대덕구 | 1250 |
동
Text
Distinct | 162 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.9 KiB |
Value | Count | Frequency (%) |
둔산동 | 316 | 3.8% |
봉명동 | 267 | 3.2% |
월평동 | 242 | 2.9% |
도마동 | 227 | 2.7% |
갈마동 | 226 | 2.7% |
가양동 | 226 | 2.7% |
관저동 | 225 | 2.7% |
법동 | 192 | 2.3% |
판암동 | 183 | 2.2% |
문화동 | 174 | 2.1% |
Other values (152) | 6139 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 8417 | |
대 | 591 | 2.4% |
산 | 541 | 2.2% |
평 | 524 | 2.1% |
정 | 515 | 2.1% |
마 | 455 | 1.9% |
용 | 431 | 1.8% |
가 | 428 | 1.7% |
도 | 423 | 1.7% |
봉 | 412 | 1.7% |
Other values (109) | 11838 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 24575 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 8417 | |
대 | 591 | 2.4% |
산 | 541 | 2.2% |
평 | 524 | 2.1% |
정 | 515 | 2.1% |
마 | 455 | 1.9% |
용 | 431 | 1.8% |
가 | 428 | 1.7% |
도 | 423 | 1.7% |
봉 | 412 | 1.7% |
Other values (109) | 11838 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 24575 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 8417 | |
대 | 591 | 2.4% |
산 | 541 | 2.2% |
평 | 524 | 2.1% |
정 | 515 | 2.1% |
마 | 455 | 1.9% |
용 | 431 | 1.8% |
가 | 428 | 1.7% |
도 | 423 | 1.7% |
봉 | 412 | 1.7% |
Other values (109) | 11838 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 24575 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 8417 | |
대 | 591 | 2.4% |
산 | 541 | 2.2% |
평 | 524 | 2.1% |
정 | 515 | 2.1% |
마 | 455 | 1.9% |
용 | 431 | 1.8% |
가 | 428 | 1.7% |
도 | 423 | 1.7% |
봉 | 412 | 1.7% |
Other values (109) | 11838 |
사고유형
Categorical
IMBALANCE
 
Distinct | 20 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.9 KiB |
낙상 | |
---|---|
열상 | |
상해 | |
추락 | 400 |
기타 둔상 | 383 |
Other values (15) |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.1936557 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 상해 |
---|---|
2nd row | 상해 |
3rd row | 기타 둔상 |
4th row | 낙상 |
5th row | 상해 |
Common Values
Value | Count | Frequency (%) |
낙상 | 5013 | |
열상 | 1170 | 13.9% |
상해 | 882 | 10.5% |
추락 | 400 | 4.8% |
기타 둔상 | 383 | 4.6% |
동물/곤충 | 161 | 1.9% |
기계 | 141 | 1.7% |
물 | 79 | 0.9% |
자상 | 70 | 0.8% |
화염 | 43 | 0.5% |
Other values (10) | 75 | 0.9% |
Length
Value | Count | Frequency (%) |
낙상 | 5013 | |
열상 | 1170 | 13.3% |
상해 | 882 | 10.0% |
추락 | 400 | 4.5% |
기타 | 383 | 4.4% |
둔상 | 383 | 4.4% |
동물/곤충 | 161 | 1.8% |
기계 | 141 | 1.6% |
물 | 79 | 0.9% |
자상 | 70 | 0.8% |
Other values (11) | 118 | 1.3% |
구 | 사고유형 | |
---|---|---|
구 | 1.000 | 0.114 |
사고유형 | 0.114 | 1.000 |
구 | 사고유형 | |
---|---|---|
구 | 1.000 | 0.049 |
사고유형 | 0.049 | 1.000 |
구 | 사고유형 | |
---|---|---|
구 | 1.000 | 0.049 |
사고유형 | 0.049 | 1.000 |
시 | 구 | 동 | 사고유형 | |
---|---|---|---|---|
0 | 대전광역시 | 서구 | 갈마동 | 상해 |
1 | 대전광역시 | 서구 | 둔산동 | 상해 |
2 | 대전광역시 | 서구 | 변동 | 기타 둔상 |
3 | 대전광역시 | 서구 | 둔산동 | 낙상 |
4 | 대전광역시 | 서구 | 둔산동 | 상해 |
5 | 대전광역시 | 서구 | 갈마동 | 열상 |
6 | 대전광역시 | 서구 | 괴정동 | 기타 둔상 |
7 | 대전광역시 | 서구 | 월평동 | 낙상 |
8 | 대전광역시 | 서구 | 괴정동 | 낙상 |
9 | 대전광역시 | 서구 | 내동 | 추락 |
시 | 구 | 동 | 사고유형 | |
---|---|---|---|---|
8407 | 대전광역시 | 동구 | 용운동 | 열상 |
8408 | 대전광역시 | 동구 | 가양동 | 상해 |
8409 | 대전광역시 | 대덕구 | 덕암동 | 열상 |
8410 | 대전광역시 | 중구 | 대흥동 | 낙상 |
8411 | 대전광역시 | 유성구 | 봉명동 | 낙상 |
8412 | 대전광역시 | 동구 | 대동 | 낙상 |
8413 | 대전광역시 | 중구 | 용두동 | 낙상 |
8414 | 대전광역시 | 유성구 | 송강동 | 낙상 |
8415 | 대전광역시 | 대덕구 | 평촌동 | 화염 |
8416 | 대전광역시 | 중구 | 대사동 | 낙상 |
Most frequently occurring
시 | 구 | 동 | 사고유형 | # duplicates | |
---|---|---|---|---|---|
285 | 대전광역시 | 서구 | 둔산동 | 낙상 | 192 |
319 | 대전광역시 | 서구 | 월평동 | 낙상 | 158 |
410 | 대전광역시 | 유성구 | 봉명동 | 낙상 | 147 |
247 | 대전광역시 | 서구 | 관저동 | 낙상 | 141 |
269 | 대전광역시 | 서구 | 도마동 | 낙상 | 141 |
26 | 대전광역시 | 대덕구 | 법동 | 낙상 | 136 |
99 | 대전광역시 | 동구 | 가양동 | 낙상 | 132 |
212 | 대전광역시 | 동구 | 판암동 | 낙상 | 127 |
537 | 대전광역시 | 중구 | 문화동 | 낙상 | 121 |
239 | 대전광역시 | 서구 | 갈마동 | 낙상 | 115 |