Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 454 |
Missing cells | 1 |
Missing cells (%) | 0.1% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.2% |
Total size in memory | 14.8 KiB |
Average record size in memory | 33.3 B |
Variable types
Text | 3 |
---|---|
Categorical | 1 |
Dataset
Description | 함안군 폐수배수시설 설치현황 제공, 폐수배출시설의 사업장명, 폐수배출시설의 소재지 주소, 폐수배출시설 업장의 업종명, 폐수배출시설의 종별 구분 등의 정보를 포함합니다. |
---|---|
Author | 경상남도 함안군 |
URL | https://bigdata.gyeongnam.go.kr/index.gn?menuCd=DOM_000000114002001000&publicdatapk=3066728 |
Dataset has 1 (0.2%) duplicate rows | Duplicates |
종별 is highly imbalanced (84.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-11 00:28:11.565745 |
---|---|
Analysis finished | 2023-12-11 00:28:12.133068 |
Duration | 0.57 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
사업장명
Text
Distinct | 448 |
---|---|
Distinct (%) | 98.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
Value | Count | Frequency (%) |
주식회사 | 5 | 1.0% |
함안지점 | 4 | 0.8% |
㈜성일에스아이엠 | 3 | 0.6% |
신성주유소 | 2 | 0.4% |
㈜지티씨 | 2 | 0.4% |
제3공장 | 2 | 0.4% |
㈜쎄노텍 | 2 | 0.4% |
함안공장 | 2 | 0.4% |
㈜한국에이요 | 2 | 0.4% |
세차장 | 2 | 0.4% |
Other values (464) | 475 |
Most occurring characters
Value | Count | Frequency (%) |
㈜ | 240 | 8.3% |
이 | 79 | 2.7% |
공 | 73 | 2.5% |
업 | 62 | 2.2% |
주 | 59 | 2.0% |
성 | 58 | 2.0% |
스 | 57 | 2.0% |
장 | 55 | 1.9% |
에 | 54 | 1.9% |
) | 53 | 1.8% |
Other values (294) | 2090 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2397 | |
Other Symbol | 240 | 8.3% |
Close Punctuation | 54 | 1.9% |
Open Punctuation | 54 | 1.9% |
Space Separator | 50 | 1.7% |
Uppercase Letter | 41 | 1.4% |
Decimal Number | 33 | 1.1% |
Other Punctuation | 10 | 0.3% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 79 | 3.3% |
공 | 73 | 3.0% |
업 | 62 | 2.6% |
주 | 59 | 2.5% |
성 | 58 | 2.4% |
스 | 57 | 2.4% |
장 | 55 | 2.3% |
에 | 54 | 2.3% |
산 | 51 | 2.1% |
크 | 50 | 2.1% |
Other values (261) | 1799 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 6 | |
C | 5 | |
G | 4 | |
T | 4 | |
N | 4 | |
H | 4 | |
S | 4 | |
P | 2 | 4.9% |
M | 2 | 4.9% |
B | 2 | 4.9% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
2 | 14 | |
1 | 10 | |
3 | 3 | 9.1% |
8 | 2 | 6.1% |
4 | 1 | 3.0% |
5 | 1 | 3.0% |
0 | 1 | 3.0% |
6 | 1 | 3.0% |
Other Punctuation
Value | Count | Frequency (%) |
: | 4 | |
& | 4 | |
. | 1 | 10.0% |
* | 1 | 10.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 53 | |
] | 1 | 1.9% |
Open Punctuation
Value | Count | Frequency (%) |
( | 53 | |
[ | 1 | 1.9% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 240 |
Space Separator
Value | Count | Frequency (%) |
50 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2637 | |
Common | 202 | 7.0% |
Latin | 41 | 1.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
㈜ | 240 | 9.1% |
이 | 79 | 3.0% |
공 | 73 | 2.8% |
업 | 62 | 2.4% |
주 | 59 | 2.2% |
성 | 58 | 2.2% |
스 | 57 | 2.2% |
장 | 55 | 2.1% |
에 | 54 | 2.0% |
산 | 51 | 1.9% |
Other values (262) | 1849 |
Common
Value | Count | Frequency (%) |
) | 53 | |
( | 53 | |
50 | ||
2 | 14 | 6.9% |
1 | 10 | 5.0% |
: | 4 | 2.0% |
& | 4 | 2.0% |
3 | 3 | 1.5% |
8 | 2 | 1.0% |
4 | 1 | 0.5% |
Other values (8) | 8 | 4.0% |
Latin
Value | Count | Frequency (%) |
E | 6 | |
C | 5 | |
G | 4 | |
T | 4 | |
N | 4 | |
H | 4 | |
S | 4 | |
P | 2 | 4.9% |
M | 2 | 4.9% |
B | 2 | 4.9% |
Other values (4) | 4 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2397 | |
ASCII | 243 | 8.4% |
None | 240 | 8.3% |
Most frequent character per block
None
Value | Count | Frequency (%) |
㈜ | 240 |
Hangul
Value | Count | Frequency (%) |
이 | 79 | 3.3% |
공 | 73 | 3.0% |
업 | 62 | 2.6% |
주 | 59 | 2.5% |
성 | 58 | 2.4% |
스 | 57 | 2.4% |
장 | 55 | 2.3% |
에 | 54 | 2.3% |
산 | 51 | 2.1% |
크 | 50 | 2.1% |
Other values (261) | 1799 |
ASCII
Value | Count | Frequency (%) |
) | 53 | |
( | 53 | |
50 | ||
2 | 14 | 5.8% |
1 | 10 | 4.1% |
E | 6 | 2.5% |
C | 5 | 2.1% |
G | 4 | 1.6% |
T | 4 | 1.6% |
: | 4 | 1.6% |
Other values (22) | 40 |
소재지
Text
Distinct | 440 |
---|---|
Distinct (%) | 96.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
Length
Max length | 27 |
---|---|
Median length | 25 |
Mean length | 21.693833 |
Min length | 18 |
Characters and Unicode
Total characters | 9849 |
---|---|
Distinct characters | 129 |
Distinct categories | 6 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 426 ? |
---|---|
Unique (%) | 93.8% |
Sample
1st row | 경상남도 함안군 가야읍 서봉로 356 |
---|---|
2nd row | 경상남도 함안군 가야읍 가야11길 13 |
3rd row | 경상남도 함안군 가야읍 가야16길 11 |
4th row | 경상남도 함안군 가야읍 가야로 103-1 |
5th row | 경상남도 함안군 가야읍 가야로 132 |
Value | Count | Frequency (%) |
경상남도 | 454 | |
함안군 | 454 | |
칠원읍 | 122 | 5.4% |
군북면 | 90 | 4.0% |
칠서면 | 82 | 3.6% |
칠북면 | 37 | 1.6% |
법수면 | 34 | 1.5% |
산인면 | 29 | 1.3% |
가야읍 | 27 | 1.2% |
대산면 | 23 | 1.0% |
Other values (481) | 920 |
Most occurring characters
Value | Count | Frequency (%) |
2010 | ||
군 | 544 | 5.5% |
함 | 526 | 5.3% |
안 | 512 | 5.2% |
남 | 475 | 4.8% |
경 | 465 | 4.7% |
상 | 456 | 4.6% |
도 | 455 | 4.6% |
1 | 340 | 3.5% |
면 | 305 | 3.1% |
Other values (119) | 3761 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6138 | |
Space Separator | 2010 | 20.4% |
Decimal Number | 1546 | 15.7% |
Dash Punctuation | 152 | 1.5% |
Uppercase Letter | 2 | < 0.1% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 544 | 8.9% |
함 | 526 | 8.6% |
안 | 512 | 8.3% |
남 | 475 | 7.7% |
경 | 465 | 7.6% |
상 | 456 | 7.4% |
도 | 455 | 7.4% |
면 | 305 | 5.0% |
칠 | 260 | 4.2% |
로 | 235 | 3.8% |
Other values (104) | 1905 |
Decimal Number
Value | Count | Frequency (%) |
1 | 340 | |
2 | 216 | |
3 | 189 | |
9 | 131 | 8.5% |
4 | 128 | 8.3% |
5 | 124 | 8.0% |
6 | 122 | 7.9% |
7 | 119 | 7.7% |
0 | 97 | 6.3% |
8 | 80 | 5.2% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 1 | |
B | 1 |
Space Separator
Value | Count | Frequency (%) |
2010 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 152 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6138 | |
Common | 3709 | |
Latin | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 544 | 8.9% |
함 | 526 | 8.6% |
안 | 512 | 8.3% |
남 | 475 | 7.7% |
경 | 465 | 7.6% |
상 | 456 | 7.4% |
도 | 455 | 7.4% |
면 | 305 | 5.0% |
칠 | 260 | 4.2% |
로 | 235 | 3.8% |
Other values (104) | 1905 |
Common
Value | Count | Frequency (%) |
2010 | ||
1 | 340 | 9.2% |
2 | 216 | 5.8% |
3 | 189 | 5.1% |
- | 152 | 4.1% |
9 | 131 | 3.5% |
4 | 128 | 3.5% |
5 | 124 | 3.3% |
6 | 122 | 3.3% |
7 | 119 | 3.2% |
Other values (3) | 178 | 4.8% |
Latin
Value | Count | Frequency (%) |
L | 1 | |
B | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6138 | |
ASCII | 3711 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2010 | ||
1 | 340 | 9.2% |
2 | 216 | 5.8% |
3 | 189 | 5.1% |
- | 152 | 4.1% |
9 | 131 | 3.5% |
4 | 128 | 3.4% |
5 | 124 | 3.3% |
6 | 122 | 3.3% |
7 | 119 | 3.2% |
Other values (5) | 180 | 4.9% |
Hangul
Value | Count | Frequency (%) |
군 | 544 | 8.9% |
함 | 526 | 8.6% |
안 | 512 | 8.3% |
남 | 475 | 7.7% |
경 | 465 | 7.6% |
상 | 456 | 7.4% |
도 | 455 | 7.4% |
면 | 305 | 5.0% |
칠 | 260 | 4.2% |
로 | 235 | 3.8% |
Other values (104) | 1905 |
업종(배출시설의 분류)
Text
Distinct | 284 |
---|---|
Distinct (%) | 62.7% |
Missing | 1 |
Missing (%) | 0.2% |
Memory size | 3.7 KiB |
Value | Count | Frequency (%) |
및 | 93 | 10.0% |
제조업 | 66 | 7.1% |
외 | 30 | 3.2% |
절삭가공 | 25 | 2.7% |
유사처리업 | 25 | 2.7% |
기타 | 23 | 2.5% |
그 | 20 | 2.1% |
금속열처리업 | 12 | 1.3% |
세차업 | 11 | 1.2% |
선박구성부분품제조업 | 10 | 1.1% |
Other values (382) | 618 |
Most occurring characters
Value | Count | Frequency (%) |
481 | 9.8% | |
제 | 344 | 7.0% |
조 | 329 | 6.7% |
업 | 304 | 6.2% |
기 | 219 | 4.5% |
품 | 130 | 2.7% |
및 | 130 | 2.7% |
금 | 115 | 2.3% |
속 | 107 | 2.2% |
공 | 99 | 2.0% |
Other values (216) | 2641 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4360 | |
Space Separator | 481 | 9.8% |
Other Punctuation | 33 | 0.7% |
Decimal Number | 23 | 0.5% |
Close Punctuation | 1 | < 0.1% |
Open Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
제 | 344 | 7.9% |
조 | 329 | 7.5% |
업 | 304 | 7.0% |
기 | 219 | 5.0% |
품 | 130 | 3.0% |
및 | 130 | 3.0% |
금 | 115 | 2.6% |
속 | 107 | 2.5% |
공 | 99 | 2.3% |
리 | 97 | 2.2% |
Other values (206) | 2486 |
Decimal Number
Value | Count | Frequency (%) |
1 | 13 | |
2 | 5 | 21.7% |
3 | 3 | 13.0% |
9 | 1 | 4.3% |
5 | 1 | 4.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 32 | |
. | 1 | 3.0% |
Space Separator
Value | Count | Frequency (%) |
481 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4360 | |
Common | 539 | 11.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
제 | 344 | 7.9% |
조 | 329 | 7.5% |
업 | 304 | 7.0% |
기 | 219 | 5.0% |
품 | 130 | 3.0% |
및 | 130 | 3.0% |
금 | 115 | 2.6% |
속 | 107 | 2.5% |
공 | 99 | 2.3% |
리 | 97 | 2.2% |
Other values (206) | 2486 |
Common
Value | Count | Frequency (%) |
481 | ||
, | 32 | 5.9% |
1 | 13 | 2.4% |
2 | 5 | 0.9% |
3 | 3 | 0.6% |
) | 1 | 0.2% |
9 | 1 | 0.2% |
( | 1 | 0.2% |
. | 1 | 0.2% |
5 | 1 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4360 | |
ASCII | 539 | 11.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
481 | ||
, | 32 | 5.9% |
1 | 13 | 2.4% |
2 | 5 | 0.9% |
3 | 3 | 0.6% |
) | 1 | 0.2% |
9 | 1 | 0.2% |
( | 1 | 0.2% |
. | 1 | 0.2% |
5 | 1 | 0.2% |
Hangul
Value | Count | Frequency (%) |
제 | 344 | 7.9% |
조 | 329 | 7.5% |
업 | 304 | 7.0% |
기 | 219 | 5.0% |
품 | 130 | 3.0% |
및 | 130 | 3.0% |
금 | 115 | 2.6% |
속 | 107 | 2.5% |
공 | 99 | 2.3% |
리 | 97 | 2.2% |
Other values (206) | 2486 |
종별
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
5 | |
---|---|
4 | 21 |
2 | 1 |
3 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | 5 |
---|---|
2nd row | 5 |
3rd row | 5 |
4th row | 5 |
5th row | 5 |
Common Values
Value | Count | Frequency (%) |
5 | 431 | |
4 | 21 | 4.6% |
2 | 1 | 0.2% |
3 | 1 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
5 | 431 | |
4 | 21 | 4.6% |
2 | 1 | 0.2% |
3 | 1 | 0.2% |
사업장명 | 소재지 | 업종(배출시설의 분류) | 종별 | |
---|---|---|---|---|
0 | ㈜쎄노텍 4공장 | 경상남도 함안군 가야읍 서봉로 356 | 비금속광물 분쇄물 생산업 | 5 |
1 | 팀일레븐 | 경상남도 함안군 가야읍 가야11길 13 | 자동차세차업 | 5 |
2 | 쌍둥이세차장 | 경상남도 함안군 가야읍 가야16길 11 | 자동차 세차업 | 5 |
3 | 강남 손 세차장 | 경상남도 함안군 가야읍 가야로 103-1 | 자동차세차업 | 5 |
4 | 수영 손세차장 | 경상남도 함안군 가야읍 가야로 132 | 세차업 | 5 |
5 | 함안주유소 | 경상남도 함안군 가야읍 가야로 64 | 주유소 | 5 |
6 | 함안셀프세차장 | 경상남도 함안군 가야읍 검암천북길 19 | 자동차세차업 | 5 |
7 | ㈜동신모텍 함안지점 | 경상남도 함안군 가야읍 남문길 29-3 | 그 외 자동차용 신품 부품제조 | 5 |
8 | ㈜원일 | 경상남도 함안군 가야읍 남문길66 | 내연기관제조업(29111) | 5 |
9 | 농업회사법인㈜아라식품 | 경상남도 함안군 가야읍 도음길 335-52 | 과실, 채소가공 및 저장처리업 | 5 |
사업장명 | 소재지 | 업종(배출시설의 분류) | 종별 | |
---|---|---|---|---|
444 | ㈜케이씨피 제5공장 | 경상남도 함안군 함안면 광정로 312 | 토목공사 및 유사기계 장비 제조업 | 5 |
445 | 조아제약㈜ | 경상남도 함안군 함안면 광정로 318 | 의약품제조 | 4 |
446 | 금성열처리 | 경상남도 함안군 함안면 광정로 330-14 | 금속열처리 | 5 |
447 | ㈜신화모텍함안지점 | 경상남도 함안군 함안면 광정로 330-2 | 금속제품제조가공 | 5 |
448 | ㈜오양기업 함안공장 | 경상남도 함안군 함안면 광정로 344-17 | 도장 및 기타피막처리업 | 4 |
449 | ㈜이룸 | 경상남도 함안군 함안면 광정로 372 | 혼성 및 재생플라스틱 소재물질 제조업 | 5 |
450 | 신진물산㈜ | 경상남도 함안군 함안면 봉성1길 41 | 식료품제조 | 3 |
451 | 지리산농산 | 경상남도 함안군 함안면 봉수로 715 | 절임식품제조 | 5 |
452 | ㈜케이씨피 제3공장 | 경상남도 함안군 함안면 봉수로 721 | 토목공사및유사기계 장비제조 | 5 |
453 | 동원ENG | 경상남도 함안군 함안면 봉수로 733 | 금속조립구조제 제조업 | 5 |
Most frequently occurring
사업장명 | 소재지 | 업종(배출시설의 분류) | 종별 | # duplicates | |
---|---|---|---|---|---|
0 | ㈜삼보산업 | 경상남도 함안군 대산면 송산로 621 | 비금속광물제품제조 | 5 | 2 |