Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 6079 |
Missing cells | 3092 |
Missing cells (%) | 5.1% |
Duplicate rows | 21 |
Duplicate rows (%) | 0.3% |
Total size in memory | 492.9 KiB |
Average record size in memory | 83.0 B |
Variable types
Categorical | 1 |
---|---|
Text | 5 |
DateTime | 1 |
Numeric | 3 |
Dataset
Description | 공공건축물 현황 |
---|---|
Author | 경기도 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=MRMNCTEIARE3T4NPQRS132534089&infSeq=1 |
Dataset has 21 (0.3%) duplicate rows | Duplicates |
정제우편번호 is highly overall correlated with 정제WGS84위도 and 1 other fields | High correlation |
정제WGS84위도 is highly overall correlated with 정제우편번호 and 1 other fields | High correlation |
정제WGS84경도 is highly overall correlated with 시군명 | High correlation |
시군명 is highly overall correlated with 정제우편번호 and 2 other fields | High correlation |
취득일 has 1333 (21.9%) missing values | Missing |
정제도로명주소 has 1197 (19.7%) missing values | Missing |
정제우편번호 has 194 (3.2%) missing values | Missing |
정제WGS84위도 has 184 (3.0%) missing values | Missing |
정제WGS84경도 has 184 (3.0%) missing values | Missing |
Reproduction
Analysis started | 2024-05-17 20:28:06.884912 |
---|---|
Analysis finished | 2024-05-17 20:28:12.502227 |
Duration | 5.62 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군명
Categorical
HIGH CORRELATION
 
Distinct | 31 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 47.6 KiB |
수원시 | |
---|---|
안양시 | |
포천시 | |
이천시 | |
파주시 | |
Other values (26) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0435927 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 경기도 |
---|---|
2nd row | 경기도 |
3rd row | 경기도 |
4th row | 경기도 |
5th row | 경기도 |
Common Values
Value | Count | Frequency (%) |
수원시 | 640 | 10.5% |
안양시 | 537 | 8.8% |
포천시 | 505 | 8.3% |
이천시 | 463 | 7.6% |
파주시 | 453 | 7.5% |
양평군 | 445 | 7.3% |
안산시 | 413 | 6.8% |
부천시 | 365 | 6.0% |
가평군 | 336 | 5.5% |
성남시 | 276 | 4.5% |
Other values (21) | 1646 |
Length
Value | Count | Frequency (%) |
수원시 | 640 | 10.5% |
안양시 | 537 | 8.8% |
포천시 | 505 | 8.3% |
이천시 | 463 | 7.6% |
파주시 | 453 | 7.5% |
양평군 | 445 | 7.3% |
안산시 | 413 | 6.8% |
부천시 | 365 | 6.0% |
가평군 | 336 | 5.5% |
성남시 | 276 | 4.5% |
Other values (21) | 1646 |
건축물명
Text
Distinct | 5587 |
---|---|
Distinct (%) | 91.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 47.6 KiB |
Length
Max length | 41 |
---|---|
Median length | 30 |
Mean length | 9.4393815 |
Min length | 2 |
Characters and Unicode
Total characters | 57382 |
---|---|
Distinct characters | 664 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 5380 ? |
---|---|
Unique (%) | 88.5% |
Sample
1st row | 수리산 탐방안내소 |
---|---|
2nd row | 포천병원 본관동 환경개선 |
3rd row | 안성 원곡119안전센터 |
4th row | 안산 신길119안전센터 |
5th row | 화성 봉담 119안전센터 |
Value | Count | Frequency (%) |
경로당 | 122 | 1.4% |
마을회관 | 110 | 1.2% |
행정복지센터 | 103 | 1.2% |
공중화장실 | 83 | 0.9% |
및 | 75 | 0.8% |
화장실 | 69 | 0.8% |
수원환경사업소 | 41 | 0.5% |
하수종말처리장 | 31 | 0.3% |
경기도 | 30 | 0.3% |
주민센터 | 28 | 0.3% |
Other values (6120) | 8173 |
Most occurring characters
Value | Count | Frequency (%) |
2826 | 4.9% | |
동 | 1888 | 3.3% |
장 | 1745 | 3.0% |
관 | 1525 | 2.7% |
지 | 1162 | 2.0% |
리 | 1099 | 1.9% |
소 | 1069 | 1.9% |
수 | 986 | 1.7% |
터 | 955 | 1.7% |
원 | 936 | 1.6% |
Other values (654) | 43191 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 50565 | |
Space Separator | 2826 | 4.9% |
Decimal Number | 1705 | 3.0% |
Close Punctuation | 924 | 1.6% |
Open Punctuation | 905 | 1.6% |
Uppercase Letter | 281 | 0.5% |
Dash Punctuation | 114 | 0.2% |
Other Punctuation | 33 | 0.1% |
Lowercase Letter | 14 | < 0.1% |
Other Symbol | 8 | < 0.1% |
Other values (2) | 7 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 1888 | 3.7% |
장 | 1745 | 3.5% |
관 | 1525 | 3.0% |
지 | 1162 | 2.3% |
리 | 1099 | 2.2% |
소 | 1069 | 2.1% |
수 | 986 | 1.9% |
터 | 955 | 1.9% |
원 | 936 | 1.9% |
시 | 921 | 1.8% |
Other values (595) | 38279 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 45 | |
A | 44 | |
C | 39 | |
E | 21 | |
D | 21 | |
M | 19 | 6.8% |
T | 12 | 4.3% |
S | 11 | 3.9% |
G | 11 | 3.9% |
L | 7 | 2.5% |
Other values (15) | 51 |
Decimal Number
Value | Count | Frequency (%) |
1 | 624 | |
2 | 433 | |
3 | 197 | 11.6% |
9 | 106 | 6.2% |
4 | 89 | 5.2% |
5 | 64 | 3.8% |
6 | 54 | 3.2% |
0 | 48 | 2.8% |
8 | 46 | 2.7% |
7 | 44 | 2.6% |
Lowercase Letter
Value | Count | Frequency (%) |
i | 4 | |
c | 2 | |
t | 2 | |
v | 1 | 7.1% |
n | 1 | 7.1% |
y | 1 | 7.1% |
h | 1 | 7.1% |
b | 1 | 7.1% |
a | 1 | 7.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 12 | |
/ | 8 | |
, | 4 | 12.1% |
: | 3 | 9.1% |
· | 3 | 9.1% |
' | 2 | 6.1% |
? | 1 | 3.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 923 | |
] | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
2826 |
Open Punctuation
Value | Count | Frequency (%) |
( | 905 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 114 |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 8 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 5 |
Math Symbol
Value | Count | Frequency (%) |
~ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 50565 | |
Common | 6522 | 11.4% |
Latin | 295 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 1888 | 3.7% |
장 | 1745 | 3.5% |
관 | 1525 | 3.0% |
지 | 1162 | 2.3% |
리 | 1099 | 2.2% |
소 | 1069 | 2.1% |
수 | 986 | 1.9% |
터 | 955 | 1.9% |
원 | 936 | 1.9% |
시 | 921 | 1.8% |
Other values (595) | 38279 |
Latin
Value | Count | Frequency (%) |
B | 45 | |
A | 44 | |
C | 39 | |
E | 21 | 7.1% |
D | 21 | 7.1% |
M | 19 | 6.4% |
T | 12 | 4.1% |
S | 11 | 3.7% |
G | 11 | 3.7% |
L | 7 | 2.4% |
Other values (24) | 65 |
Common
Value | Count | Frequency (%) |
2826 | ||
) | 923 | 14.2% |
( | 905 | 13.9% |
1 | 624 | 9.6% |
2 | 433 | 6.6% |
3 | 197 | 3.0% |
- | 114 | 1.7% |
9 | 106 | 1.6% |
4 | 89 | 1.4% |
5 | 64 | 1.0% |
Other values (15) | 241 | 3.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 50565 | |
ASCII | 6806 | 11.9% |
CJK Compat | 8 | < 0.1% |
None | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2826 | ||
) | 923 | 13.6% |
( | 905 | 13.3% |
1 | 624 | 9.2% |
2 | 433 | 6.4% |
3 | 197 | 2.9% |
- | 114 | 1.7% |
9 | 106 | 1.6% |
4 | 89 | 1.3% |
5 | 64 | 0.9% |
Other values (47) | 525 | 7.7% |
Hangul
Value | Count | Frequency (%) |
동 | 1888 | 3.7% |
장 | 1745 | 3.5% |
관 | 1525 | 3.0% |
지 | 1162 | 2.3% |
리 | 1099 | 2.2% |
소 | 1069 | 2.1% |
수 | 986 | 1.9% |
터 | 955 | 1.9% |
원 | 936 | 1.9% |
시 | 921 | 1.8% |
Other values (595) | 38279 |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 8 |
None
Value | Count | Frequency (%) |
· | 3 |
면적
Text
Distinct | 5246 |
---|---|
Distinct (%) | 86.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 47.6 KiB |
Length
Max length | 31 |
---|---|
Median length | 15 |
Mean length | 6.5305149 |
Min length | 1 |
Characters and Unicode
Total characters | 39699 |
---|---|
Distinct characters | 70 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 4823 ? |
---|---|
Unique (%) | 79.3% |
Sample
1st row | 연면적 685.59㎡ |
---|---|
2nd row | 리모델링공사 |
3rd row | 연면적 942㎡ |
4th row | 연면적 990㎡ |
5th row | 연면적 893㎡ |
Value | Count | Frequency (%) |
연면적 | 1437 | 19.0% |
건축면적 | 34 | 0.4% |
12.96 | 21 | 0.3% |
100.98 | 16 | 0.2% |
60 | 13 | 0.2% |
232.81 | 13 | 0.2% |
198 | 12 | 0.2% |
40 | 12 | 0.2% |
36 | 10 | 0.1% |
12 | 10 | 0.1% |
Other values (5240) | 5996 |
Most occurring characters
Value | Count | Frequency (%) |
. | 4741 | |
1 | 4009 | |
2 | 3350 | 8.4% |
4 | 2878 | 7.2% |
3 | 2705 | 6.8% |
6 | 2658 | 6.7% |
9 | 2647 | 6.7% |
8 | 2522 | 6.4% |
5 | 2452 | 6.2% |
7 | 2328 | 5.9% |
Other values (60) | 9409 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 27475 | |
Other Punctuation | 4988 | 12.6% |
Other Letter | 4540 | 11.4% |
Space Separator | 1495 | 3.8% |
Other Symbol | 1191 | 3.0% |
Uppercase Letter | 4 | < 0.1% |
Lowercase Letter | 2 | < 0.1% |
Close Punctuation | 2 | < 0.1% |
Open Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
면 | 1478 | |
적 | 1477 | |
연 | 1438 | |
축 | 36 | 0.8% |
건 | 34 | 0.7% |
개 | 4 | 0.1% |
사 | 3 | 0.1% |
대 | 3 | 0.1% |
지 | 3 | 0.1% |
장 | 3 | 0.1% |
Other values (41) | 61 | 1.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 4009 | |
2 | 3350 | |
4 | 2878 | |
3 | 2705 | |
6 | 2658 | |
9 | 2647 | |
8 | 2522 | |
5 | 2452 | |
7 | 2328 | |
0 | 1926 |
Other Punctuation
Value | Count | Frequency (%) |
. | 4741 | |
, | 247 | 5.0% |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 1190 | |
㎥ | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
1495 |
Uppercase Letter
Value | Count | Frequency (%) |
F | 4 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 35153 | |
Hangul | 4540 | 11.4% |
Latin | 6 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
면 | 1478 | |
적 | 1477 | |
연 | 1438 | |
축 | 36 | 0.8% |
건 | 34 | 0.7% |
개 | 4 | 0.1% |
사 | 3 | 0.1% |
대 | 3 | 0.1% |
지 | 3 | 0.1% |
장 | 3 | 0.1% |
Other values (41) | 61 | 1.3% |
Common
Value | Count | Frequency (%) |
. | 4741 | |
1 | 4009 | |
2 | 3350 | |
4 | 2878 | |
3 | 2705 | |
6 | 2658 | |
9 | 2647 | |
8 | 2522 | |
5 | 2452 | |
7 | 2328 | |
Other values (7) | 4863 |
Latin
Value | Count | Frequency (%) |
F | 4 | |
m | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 33968 | |
Hangul | 4540 | 11.4% |
CJK Compat | 1191 | 3.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
. | 4741 | |
1 | 4009 | |
2 | 3350 | |
4 | 2878 | |
3 | 2705 | |
6 | 2658 | |
9 | 2647 | |
8 | 2522 | |
5 | 2452 | |
7 | 2328 | |
Other values (7) | 3678 |
Hangul
Value | Count | Frequency (%) |
면 | 1478 | |
적 | 1477 | |
연 | 1438 | |
축 | 36 | 0.8% |
건 | 34 | 0.7% |
개 | 4 | 0.1% |
사 | 3 | 0.1% |
대 | 3 | 0.1% |
지 | 3 | 0.1% |
장 | 3 | 0.1% |
Other values (41) | 61 | 1.3% |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 1190 | |
㎥ | 1 | 0.1% |
취득일
Text
MISSING
 
Distinct | 2951 |
---|---|
Distinct (%) | 62.2% |
Missing | 1333 |
Missing (%) | 21.9% |
Memory size | 47.6 KiB |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Characters and Unicode
Total characters | 47460 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 2133 ? |
---|---|
Unique (%) | 44.9% |
Sample
1st row | 2019-05-09 |
---|---|
2nd row | 2017-09-21 |
3rd row | 2014-03-26 |
4th row | 2011-02-28 |
5th row | 2022-02-15 |
Value | Count | Frequency (%) |
2018-01-31 | 27 | 0.6% |
1995-02-28 | 27 | 0.6% |
2007-12-28 | 23 | 0.5% |
2019-01-01 | 21 | 0.4% |
2003-10-30 | 19 | 0.4% |
2012-06-29 | 17 | 0.4% |
2005-02-28 | 17 | 0.4% |
2012-05-22 | 16 | 0.3% |
2018-01-01 | 16 | 0.3% |
1997-03-25 | 15 | 0.3% |
Other values (2941) | 4548 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 10738 | |
- | 9492 | |
1 | 7963 | |
2 | 7537 | |
9 | 3389 | 7.1% |
3 | 1773 | 3.7% |
8 | 1683 | 3.5% |
5 | 1379 | 2.9% |
6 | 1251 | 2.6% |
7 | 1223 | 2.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 37968 | |
Dash Punctuation | 9492 | 20.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 10738 | |
1 | 7963 | |
2 | 7537 | |
9 | 3389 | 8.9% |
3 | 1773 | 4.7% |
8 | 1683 | 4.4% |
5 | 1379 | 3.6% |
6 | 1251 | 3.3% |
7 | 1223 | 3.2% |
4 | 1032 | 2.7% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 9492 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 47460 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 10738 | |
- | 9492 | |
1 | 7963 | |
2 | 7537 | |
9 | 3389 | 7.1% |
3 | 1773 | 3.7% |
8 | 1683 | 3.5% |
5 | 1379 | 2.9% |
6 | 1251 | 2.6% |
7 | 1223 | 2.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 47460 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 10738 | |
- | 9492 | |
1 | 7963 | |
2 | 7537 | |
9 | 3389 | 7.1% |
3 | 1773 | 3.7% |
8 | 1683 | 3.5% |
5 | 1379 | 2.9% |
6 | 1251 | 2.6% |
7 | 1223 | 2.6% |
데이터기준일자
Date
Distinct | 22 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 47.6 KiB |
Minimum | 2022-12-31 00:00:00 |
---|---|
Maximum | 2024-04-30 00:00:00 |
정제도로명주소
Text
MISSING
 
Distinct | 3581 |
---|---|
Distinct (%) | 73.4% |
Missing | 1197 |
Missing (%) | 19.7% |
Memory size | 47.6 KiB |
Length
Max length | 29 |
---|---|
Median length | 26 |
Mean length | 19.725113 |
Min length | 13 |
Characters and Unicode
Total characters | 96298 |
---|---|
Distinct characters | 401 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 3011 ? |
---|---|
Unique (%) | 61.7% |
Sample
1st row | 경기도 군포시 속달로 347-4 |
---|---|
2nd row | 경기도 포천시 포천로 1648 |
3rd row | 경기도 안성시 원곡면 원곡물류단지로 162-20 |
4th row | 경기도 안산시 단원구 삼일로 50 |
5th row | 경기도 화성시 봉담읍 동화새터길 135 |
Value | Count | Frequency (%) |
경기도 | 4882 | 21.3% |
수원시 | 507 | 2.2% |
포천시 | 435 | 1.9% |
안양시 | 424 | 1.8% |
이천시 | 368 | 1.6% |
파주시 | 344 | 1.5% |
안산시 | 332 | 1.4% |
부천시 | 314 | 1.4% |
양평군 | 311 | 1.4% |
성남시 | 265 | 1.2% |
Other values (3805) | 14753 |
Most occurring characters
Value | Count | Frequency (%) |
18053 | ||
경 | 5077 | 5.3% |
도 | 4974 | 5.2% |
기 | 4965 | 5.2% |
시 | 4517 | 4.7% |
로 | 4192 | 4.4% |
1 | 3542 | 3.7% |
2 | 2249 | 2.3% |
길 | 2234 | 2.3% |
3 | 1969 | 2.0% |
Other values (391) | 44526 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 60006 | |
Space Separator | 18053 | 18.7% |
Decimal Number | 17274 | 17.9% |
Dash Punctuation | 965 | 1.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
경 | 5077 | 8.5% |
도 | 4974 | 8.3% |
기 | 4965 | 8.3% |
시 | 4517 | 7.5% |
로 | 4192 | 7.0% |
길 | 2234 | 3.7% |
구 | 1849 | 3.1% |
안 | 1611 | 2.7% |
천 | 1557 | 2.6% |
번 | 1480 | 2.5% |
Other values (379) | 27550 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3542 | |
2 | 2249 | |
3 | 1969 | |
4 | 1630 | |
5 | 1516 | |
6 | 1377 | 8.0% |
0 | 1363 | 7.9% |
7 | 1247 | 7.2% |
8 | 1221 | 7.1% |
9 | 1160 | 6.7% |
Space Separator
Value | Count | Frequency (%) |
18053 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 965 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 60006 | |
Common | 36292 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
경 | 5077 | 8.5% |
도 | 4974 | 8.3% |
기 | 4965 | 8.3% |
시 | 4517 | 7.5% |
로 | 4192 | 7.0% |
길 | 2234 | 3.7% |
구 | 1849 | 3.1% |
안 | 1611 | 2.7% |
천 | 1557 | 2.6% |
번 | 1480 | 2.5% |
Other values (379) | 27550 |
Common
Value | Count | Frequency (%) |
18053 | ||
1 | 3542 | 9.8% |
2 | 2249 | 6.2% |
3 | 1969 | 5.4% |
4 | 1630 | 4.5% |
5 | 1516 | 4.2% |
6 | 1377 | 3.8% |
0 | 1363 | 3.8% |
7 | 1247 | 3.4% |
8 | 1221 | 3.4% |
Other values (2) | 2125 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 60006 | |
ASCII | 36292 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
18053 | ||
1 | 3542 | 9.8% |
2 | 2249 | 6.2% |
3 | 1969 | 5.4% |
4 | 1630 | 4.5% |
5 | 1516 | 4.2% |
6 | 1377 | 3.8% |
0 | 1363 | 3.8% |
7 | 1247 | 3.4% |
8 | 1221 | 3.4% |
Other values (2) | 2125 | 5.9% |
Hangul
Value | Count | Frequency (%) |
경 | 5077 | 8.5% |
도 | 4974 | 8.3% |
기 | 4965 | 8.3% |
시 | 4517 | 7.5% |
로 | 4192 | 7.0% |
길 | 2234 | 3.7% |
구 | 1849 | 3.1% |
안 | 1611 | 2.7% |
천 | 1557 | 2.6% |
번 | 1480 | 2.5% |
Other values (379) | 27550 |
정제지번주소
Text
Distinct | 4474 |
---|---|
Distinct (%) | 73.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 47.6 KiB |
Length
Max length | 47 |
---|---|
Median length | 42 |
Mean length | 20.300872 |
Min length | 13 |
Characters and Unicode
Total characters | 123409 |
---|---|
Distinct characters | 377 |
Distinct categories | 9 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 3813 ? |
---|---|
Unique (%) | 62.7% |
Sample
1st row | 경기도 군포시 속달동 306번지 일원 |
---|---|
2nd row | 경기도 포천시 신읍동 243-1번지 |
3rd row | 경기도 안성시 원곡면 칠곡리 928-3 |
4th row | 경기도 안산시 단원구 신길동 1691번지 |
5th row | 경기도 화성시 봉담읍 동화리 621번지 |
Value | Count | Frequency (%) |
경기도 | 6077 | 20.5% |
수원시 | 624 | 2.1% |
포천시 | 509 | 1.7% |
안양시 | 506 | 1.7% |
이천시 | 465 | 1.6% |
파주시 | 455 | 1.5% |
양평군 | 446 | 1.5% |
안산시 | 428 | 1.4% |
부천시 | 368 | 1.2% |
가평군 | 338 | 1.1% |
Other values (5107) | 19460 |
Most occurring characters
Value | Count | Frequency (%) |
23598 | ||
도 | 6185 | 5.0% |
기 | 6158 | 5.0% |
경 | 6115 | 5.0% |
시 | 5420 | 4.4% |
1 | 4833 | 3.9% |
동 | 4750 | 3.8% |
- | 3883 | 3.1% |
2 | 2917 | 2.4% |
3 | 2562 | 2.1% |
Other values (367) | 56988 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 72191 | |
Decimal Number | 23606 | 19.1% |
Space Separator | 23598 | 19.1% |
Dash Punctuation | 3883 | 3.1% |
Close Punctuation | 48 | < 0.1% |
Open Punctuation | 48 | < 0.1% |
Uppercase Letter | 22 | < 0.1% |
Other Punctuation | 11 | < 0.1% |
Lowercase Letter | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 6185 | 8.6% |
기 | 6158 | 8.5% |
경 | 6115 | 8.5% |
시 | 5420 | 7.5% |
동 | 4750 | 6.6% |
구 | 2263 | 3.1% |
리 | 2187 | 3.0% |
양 | 1963 | 2.7% |
안 | 1937 | 2.7% |
천 | 1754 | 2.4% |
Other values (337) | 33459 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 8 | |
A | 4 | |
I | 2 | 9.1% |
L | 1 | 4.5% |
C | 1 | 4.5% |
D | 1 | 4.5% |
N | 1 | 4.5% |
T | 1 | 4.5% |
P | 1 | 4.5% |
J | 1 | 4.5% |
Decimal Number
Value | Count | Frequency (%) |
1 | 4833 | |
2 | 2917 | |
3 | 2562 | |
5 | 2301 | |
4 | 2279 | |
6 | 1980 | |
7 | 1897 | 8.0% |
0 | 1703 | 7.2% |
8 | 1592 | 6.7% |
9 | 1542 | 6.5% |
Other Punctuation
Value | Count | Frequency (%) |
, | 8 | |
. | 2 | 18.2% |
? | 1 | 9.1% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1 | |
c | 1 |
Space Separator
Value | Count | Frequency (%) |
23598 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3883 |
Close Punctuation
Value | Count | Frequency (%) |
) | 48 |
Open Punctuation
Value | Count | Frequency (%) |
( | 48 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 72190 | |
Common | 51194 | |
Latin | 24 | < 0.1% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 6185 | 8.6% |
기 | 6158 | 8.5% |
경 | 6115 | 8.5% |
시 | 5420 | 7.5% |
동 | 4750 | 6.6% |
구 | 2263 | 3.1% |
리 | 2187 | 3.0% |
양 | 1963 | 2.7% |
안 | 1937 | 2.7% |
천 | 1754 | 2.4% |
Other values (336) | 33458 |
Common
Value | Count | Frequency (%) |
23598 | ||
1 | 4833 | 9.4% |
- | 3883 | 7.6% |
2 | 2917 | 5.7% |
3 | 2562 | 5.0% |
5 | 2301 | 4.5% |
4 | 2279 | 4.5% |
6 | 1980 | 3.9% |
7 | 1897 | 3.7% |
0 | 1703 | 3.3% |
Other values (7) | 3241 | 6.3% |
Latin
Value | Count | Frequency (%) |
B | 8 | |
A | 4 | |
I | 2 | 8.3% |
L | 1 | 4.2% |
C | 1 | 4.2% |
D | 1 | 4.2% |
e | 1 | 4.2% |
c | 1 | 4.2% |
N | 1 | 4.2% |
T | 1 | 4.2% |
Other values (3) | 3 | 12.5% |
Han
Value | Count | Frequency (%) |
內 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 72190 | |
ASCII | 51218 | |
CJK | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
23598 | ||
1 | 4833 | 9.4% |
- | 3883 | 7.6% |
2 | 2917 | 5.7% |
3 | 2562 | 5.0% |
5 | 2301 | 4.5% |
4 | 2279 | 4.4% |
6 | 1980 | 3.9% |
7 | 1897 | 3.7% |
0 | 1703 | 3.3% |
Other values (20) | 3265 | 6.4% |
Hangul
Value | Count | Frequency (%) |
도 | 6185 | 8.6% |
기 | 6158 | 8.5% |
경 | 6115 | 8.5% |
시 | 5420 | 7.5% |
동 | 4750 | 6.6% |
구 | 2263 | 3.1% |
리 | 2187 | 3.0% |
양 | 1963 | 2.7% |
안 | 1937 | 2.7% |
천 | 1754 | 2.4% |
Other values (336) | 33458 |
CJK
Value | Count | Frequency (%) |
內 | 1 |
정제우편번호
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 2152 |
---|---|
Distinct (%) | 36.6% |
Missing | 194 |
Missing (%) | 3.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 13910.261 |
Minimum | 1377 |
---|---|
Maximum | 18626 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 53.6 KiB |
Quantile statistics
Minimum | 1377 |
---|---|
5-th percentile | 10801 |
Q1 | 12232 |
median | 13901 |
Q3 | 16069 |
95-th percentile | 17526.6 |
Maximum | 18626 |
Range | 17249 |
Interquartile range (IQR) | 3837 |
Descriptive statistics
Standard deviation | 2337.2812 |
---|---|
Coefficient of variation (CV) | 0.16802569 |
Kurtosis | -0.94128228 |
Mean | 13910.261 |
Median Absolute Deviation (MAD) | 2092 |
Skewness | 0.14749723 |
Sum | 81861887 |
Variance | 5462883.5 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
17379 | 38 | 0.6% |
18130 | 35 | 0.6% |
12422 | 30 | 0.5% |
11139 | 30 | 0.5% |
13912 | 29 | 0.5% |
14089 | 28 | 0.5% |
13922 | 27 | 0.4% |
18355 | 27 | 0.4% |
11101 | 25 | 0.4% |
17406 | 24 | 0.4% |
Other values (2142) | 5592 | |
(Missing) | 194 | 3.2% |
Value | Count | Frequency (%) |
1377 | 2 | < 0.1% |
10046 | 1 | < 0.1% |
10068 | 1 | < 0.1% |
10109 | 1 | < 0.1% |
10210 | 2 | < 0.1% |
10212 | 1 | < 0.1% |
10215 | 1 | < 0.1% |
10218 | 2 | < 0.1% |
10222 | 2 | < 0.1% |
10223 | 7 |
Value | Count | Frequency (%) |
18626 | 1 | < 0.1% |
18527 | 1 | < 0.1% |
18388 | 2 | < 0.1% |
18358 | 8 | 0.1% |
18355 | 27 | |
18298 | 1 | < 0.1% |
18151 | 3 | < 0.1% |
18150 | 1 | < 0.1% |
18148 | 1 | < 0.1% |
18147 | 1 | < 0.1% |
정제WGS84위도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 4187 |
---|---|
Distinct (%) | 71.0% |
Missing | 184 |
Missing (%) | 3.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 37.498918 |
Minimum | 36.916889 |
---|---|
Maximum | 38.18295 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 53.6 KiB |
Quantile statistics
Minimum | 36.916889 |
---|---|
5-th percentile | 37.149035 |
Q1 | 37.300591 |
median | 37.439277 |
Q3 | 37.70323 |
95-th percentile | 37.933689 |
Maximum | 38.18295 |
Range | 1.2660606 |
Interquartile range (IQR) | 0.40263861 |
Descriptive statistics
Standard deviation | 0.25001354 |
---|---|
Coefficient of variation (CV) | 0.00666722 |
Kurtosis | -0.5639163 |
Mean | 37.498918 |
Median Absolute Deviation (MAD) | 0.15665065 |
Skewness | 0.49857476 |
Sum | 221056.12 |
Variance | 0.062506769 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
37.3889976474 | 27 | 0.4% |
37.4183798984 | 27 | 0.4% |
37.8773715659 | 24 | 0.4% |
37.4018698265 | 21 | 0.3% |
37.1404782493 | 19 | 0.3% |
37.3831019563 | 18 | 0.3% |
37.8557615302 | 18 | 0.3% |
37.3810305854 | 17 | 0.3% |
37.5131520747 | 17 | 0.3% |
37.8161951551 | 16 | 0.3% |
Other values (4177) | 5691 | |
(Missing) | 184 | 3.0% |
Value | Count | Frequency (%) |
36.9168894764 | 1 | |
36.9350364703 | 1 | |
36.9433047732 | 2 | |
36.943676386 | 1 | |
36.9517666318 | 1 | |
36.9597572254 | 1 | |
36.9602913498 | 1 | |
36.9645754499 | 2 | |
36.9651786777 | 1 | |
36.9673433617 | 1 |
Value | Count | Frequency (%) |
38.182950099 | 1 | |
38.1666893514 | 1 | |
38.1664994489 | 1 | |
38.1661954165 | 1 | |
38.1659979498 | 1 | |
38.1623108065 | 1 | |
38.1604142789 | 1 | |
38.1603753855 | 1 | |
38.1588427797 | 2 | |
38.1581025812 | 1 |
정제WGS84경도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 4187 |
---|---|
Distinct (%) | 71.0% |
Missing | 184 |
Missing (%) | 3.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 127.09761 |
Minimum | 126.38913 |
---|---|
Maximum | 127.79132 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 53.6 KiB |
Quantile statistics
Minimum | 126.38913 |
---|---|
5-th percentile | 126.75424 |
Q1 | 126.86752 |
median | 127.05105 |
Q3 | 127.27898 |
95-th percentile | 127.54356 |
Maximum | 127.79132 |
Range | 1.4021954 |
Interquartile range (IQR) | 0.41145995 |
Descriptive statistics
Standard deviation | 0.26653403 |
---|---|
Coefficient of variation (CV) | 0.0020970814 |
Kurtosis | -0.77912947 |
Mean | 127.09761 |
Median Absolute Deviation (MAD) | 0.19966396 |
Skewness | 0.40681353 |
Sum | 749240.41 |
Variance | 0.071040391 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
126.9280462689 | 27 | 0.4% |
126.9183187069 | 27 | 0.4% |
126.8048065471 | 24 | 0.4% |
126.9667477669 | 21 | 0.3% |
127.0645822452 | 19 | 0.3% |
126.9704727553 | 18 | 0.3% |
127.1190825052 | 18 | 0.3% |
126.9778048454 | 17 | 0.3% |
126.7452297663 | 17 | 0.3% |
127.5209053191 | 16 | 0.3% |
Other values (4177) | 5691 | |
(Missing) | 184 | 3.0% |
Value | Count | Frequency (%) |
126.3891261111 | 1 | |
126.3915488852 | 1 | |
126.3923701162 | 1 | |
126.3929010601 | 1 | |
126.450515871 | 1 | |
126.4532254318 | 1 | |
126.547640313 | 2 | |
126.5526162746 | 1 | |
126.5540584899 | 1 | |
126.5669484651 | 1 |
Value | Count | Frequency (%) |
127.7913215403 | 2 | |
127.7910921485 | 1 | |
127.7766029235 | 1 | |
127.7727365668 | 1 | |
127.7711531862 | 1 | |
127.7706997381 | 1 | |
127.7705441813 | 1 | |
127.770290524 | 1 | |
127.7688750232 | 1 | |
127.7666402442 | 1 |
시군명 | 데이터기준일자 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | |
---|---|---|---|---|---|
시군명 | 1.000 | 1.000 | 0.991 | 0.936 | 0.911 |
데이터기준일자 | 1.000 | 1.000 | 0.953 | 0.888 | 0.839 |
정제우편번호 | 0.991 | 0.953 | 1.000 | 0.934 | 0.842 |
정제WGS84위도 | 0.936 | 0.888 | 0.934 | 1.000 | 0.732 |
정제WGS84경도 | 0.911 | 0.839 | 0.842 | 0.732 | 1.000 |
정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | 시군명 | |
---|---|---|---|---|
정제우편번호 | 1.000 | -0.922 | 0.059 | 0.852 |
정제WGS84위도 | -0.922 | 1.000 | -0.020 | 0.689 |
정제WGS84경도 | 0.059 | -0.020 | 1.000 | 0.620 |
시군명 | 0.852 | 0.689 | 0.620 | 1.000 |
시군명 | 건축물명 | 면적 | 취득일 | 데이터기준일자 | 정제도로명주소 | 정제지번주소 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 경기도 | 수리산 탐방안내소 | 연면적 685.59㎡ | <NA> | 2022-12-31 | 경기도 군포시 속달로 347-4 | 경기도 군포시 속달동 306번지 일원 | 15889 | 37.348002 | 126.900526 |
1 | 경기도 | 포천병원 본관동 환경개선 | 리모델링공사 | <NA> | 2022-12-31 | 경기도 포천시 포천로 1648 | 경기도 포천시 신읍동 243-1번지 | 11142 | 37.903093 | 127.198349 |
2 | 경기도 | 안성 원곡119안전센터 | 연면적 942㎡ | <NA> | 2022-12-31 | 경기도 안성시 원곡면 원곡물류단지로 162-20 | 경기도 안성시 원곡면 칠곡리 928-3 | 17555 | 37.042071 | 127.158226 |
3 | 경기도 | 안산 신길119안전센터 | 연면적 990㎡ | <NA> | 2022-12-31 | 경기도 안산시 단원구 삼일로 50 | 경기도 안산시 단원구 신길동 1691번지 | 15403 | 37.335039 | 126.783624 |
4 | 경기도 | 화성 봉담 119안전센터 | 연면적 893㎡ | <NA> | 2022-12-31 | 경기도 화성시 봉담읍 동화새터길 135 | 경기도 화성시 봉담읍 동화리 621번지 | 18298 | 37.215031 | 126.962915 |
5 | 경기도 | 의정부병원 본관동 환경개선 및 장례식장 증축 | 연면적 969㎡ | <NA> | 2022-12-31 | 경기도 의정부시 흥선로 142 | 경기도 의정부시 의정부동 433번지 | 11671 | 37.741076 | 127.042514 |
6 | 구리시 | 갈매동 제설작업 전진기지 | 4,893 | 2019-05-09 | 2023-03-15 | 경기도 구리시 금강로 164 | 경기도 구리시 갈매동 8-10 외1필지 | 11901 | 37.640195 | 127.128664 |
7 | 구리시 | 구리 남자청소년 쉼터 | 195.4 | 2017-09-21 | 2023-03-15 | 경기도 구리시 안골로 32-1 | 경기도 구리시 교문동 736 | 11934 | 37.597102 | 127.134452 |
8 | 구리시 | 구리시 멀티스포츠센터 | 10,692 | 2014-03-26 | 2023-03-15 | 경기도 구리시 체육관로 137-25 | 경기도 구리시 교문동 153-1 외12필지 | 11934 | 37.596158 | 127.13517 |
9 | 경기도 | 양주 옥정119안전센터 | 연면적 992㎡ | <NA> | 2022-12-31 | <NA> | 경기도 양주시 옥정동 119-6번지 | <NA> | 37.82745 | 127.094035 |
시군명 | 건축물명 | 면적 | 취득일 | 데이터기준일자 | 정제도로명주소 | 정제지번주소 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | |
---|---|---|---|---|---|---|---|---|---|---|
6069 | 포천시 | 폐수종말처리시설 가동 | 349.37 | 2007-12-31 | 2024-03-06 | 경기도 포천시 영중면 양문공단로 98 | 경기도 포천시 영중면 양문리 994 | 11128 | 38.007934 | 127.257803 |
6070 | 포천시 | 금주2리경로당 | 199.93 | 2003-03-04 | 2024-03-06 | 경기도 포천시 영중면 물안3길 14 | 경기도 포천시 영중면 금주리 275-6 | 11131 | 37.976763 | 127.273652 |
6071 | 포천시 | 거사2리경로당 | 179.88 | 2002-03-18 | 2024-03-06 | 경기도 포천시 영중면 금화봉길 569 | 경기도 포천시 영중면 거사리 295-1 | 11130 | 37.987725 | 127.235913 |
6072 | 포천시 | 성동4리 경로당 리모델링 대상 건물 | 110.07 | 2021-06-08 | 2024-03-06 | 경기도 포천시 영중면 성장로166번길 12-17 | 경기도 포천시 영중면 성동리 139-4 | 11128 | 38.027582 | 127.275593 |
6073 | 포천시 | 성동3리 경로당 화장실(옥외) | 144 | 2008-11-10 | 2024-03-06 | 경기도 포천시 영중면 나삼길 197 | 경기도 포천시 영중면 성동리 241-3 | 11128 | 38.019963 | 127.265089 |
6074 | 포천시 | 희망애찬 제작소 | 66 | 2021-07-31 | 2024-03-06 | 경기도 포천시 영중면 전영로 1382 | 경기도 포천시 영중면 영평리 209-4 | 11126 | 38.017187 | 127.212111 |
6075 | 포천시 | 영평2리 경로당 | 137.16 | 2013-06-05 | 2024-03-06 | 경기도 포천시 영중면 전영로 1355-41 | 경기도 포천시 영중면 영평리 453-2 | 11126 | 38.018566 | 127.208768 |
6076 | 포천시 | 영송리 분뇨처리장 나동 | 161 | 1986-12-30 | 2024-03-06 | <NA> | 경기도 포천시 영중면 영송리 616 | 11130 | 37.998872 | 127.20747 |
6077 | 포천시 | 영송리 분뇨처리장 다동 | 108 | 1992-10-31 | 2024-03-06 | <NA> | 경기도 포천시 영중면 영송리 616 | 11130 | 37.998872 | 127.20747 |
6078 | 포천시 | 영송리 분뇨처리장 라동 | 32.8 | 1992-10-31 | 2024-03-06 | <NA> | 경기도 포천시 영중면 영송리 616 | 11130 | 37.998872 | 127.20747 |
Most frequently occurring
시군명 | 건축물명 | 면적 | 취득일 | 데이터기준일자 | 정제도로명주소 | 정제지번주소 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|
13 | 안양시 | 관양두산벤처다임 | 232.81 | 2007-12-28 | 2024-03-18 | 경기도 안양시 동안구 학의로 250 | 경기도 안양시 동안구 관양동 1307-37번지 | 14056 | 37.40187 | 126.966748 | 13 |
1 | 가평군 | 산장관광지 숙박시설 | 16.74 | 2009-03-12 | 2024-02-14 | <NA> | 경기도 가평군 상면 덕현리 산 74-6 | 12446 | 37.753713 | 127.410839 | 5 |
14 | 안양시 | 관양두산벤처다임 | 244.19 | 2007-12-28 | 2024-03-18 | 경기도 안양시 동안구 학의로 250 | 경기도 안양시 동안구 관양동 1307-37번지 | 14056 | 37.40187 | 126.966748 | 4 |
2 | 가평군 | 산장국민관광지 | 9 | 2005-12-22 | 2024-02-14 | <NA> | 경기도 가평군 상면 덕현리 산 74-6 | 12446 | 37.753713 | 127.410839 | 3 |
6 | 동두천시 | 종합운동장 | 56.54 | 1997-09-10 | 2024-04-30 | 경기도 동두천시 어등로 45 | 경기도 동두천시 생연동 70 종합운동장(화장실) | 11320 | 37.899696 | 127.070811 | 3 |
0 | 가평군 | 가평정수장 | 9.22 | 2004-11-29 | 2024-02-14 | <NA> | 경기도 가평군 가평읍 달전리 510-3 | 12422 | 37.807265 | 127.514661 | 2 |
3 | 가평군 | 연인산캠핑장공동화장실 | 138.4 | 2008-06-26 | 2024-02-14 | <NA> | 경기도 가평군 북면 백둔리 360 | 12406 | 37.901667 | 127.459329 | 2 |
4 | 가평군 | 연하희망마을센터 | 202.65 | 2012-08-31 | 2024-02-14 | <NA> | 경기도 가평군 상면 연하리 218-12 | 12444 | 37.803148 | 127.348497 | 2 |
5 | 광명시 | 3급관사 | 364.28 | <NA> | 2023-03-20 | <NA> | 경기도 광명시 모세로 27 (철산동) | <NA> | <NA> | <NA> | 2 |
7 | 부천시 | 삼삼약수경로당 | 34.31 | <NA> | 2023-03-20 | 경기도 부천시 지양로158번길 66 | 경기도 부천시 고강동 422-19 | 14469 | 37.522973 | 126.821937 | 2 |