Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.0 KiB |
Average record size in memory | 41.3 B |
Variable types
Text | 2 |
---|---|
Categorical | 3 |
Dataset
Description | Sample |
---|---|
Author | 히어로웍스 |
URL | https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=39bf0cb0-7ab3-11ed-b3ef-49efc94461a7 |
Reproduction
Analysis started | 2023-12-10 10:19:17.907875 |
---|---|
Analysis finished | 2023-12-10 10:19:18.864807 |
Duration | 0.96 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
ldgs_nm
Text
UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
호텔 | 34 | 14.8% |
부산 | 9 | 3.9% |
서울 | 7 | 3.1% |
제주 | 6 | 2.6% |
여수 | 5 | 2.2% |
명동 | 5 | 2.2% |
해운대 | 4 | 1.7% |
울산 | 3 | 1.3% |
수안보 | 3 | 1.3% |
바이 | 3 | 1.3% |
Other values (136) | 150 |
Most occurring characters
Value | Count | Frequency (%) |
129 | 14.3% | |
호 | 80 | 8.8% |
텔 | 79 | 8.7% |
스 | 29 | 3.2% |
이 | 20 | 2.2% |
라 | 19 | 2.1% |
리 | 17 | 1.9% |
산 | 17 | 1.9% |
트 | 16 | 1.8% |
광 | 14 | 1.5% |
Other values (179) | 484 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 740 | |
Space Separator | 129 | 14.3% |
Uppercase Letter | 16 | 1.8% |
Lowercase Letter | 7 | 0.8% |
Decimal Number | 5 | 0.6% |
Open Punctuation | 2 | 0.2% |
Close Punctuation | 2 | 0.2% |
Other Punctuation | 2 | 0.2% |
Dash Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
호 | 80 | 10.8% |
텔 | 79 | 10.7% |
스 | 29 | 3.9% |
이 | 20 | 2.7% |
라 | 19 | 2.6% |
리 | 17 | 2.3% |
산 | 17 | 2.3% |
트 | 16 | 2.2% |
광 | 14 | 1.9% |
울 | 13 | 1.8% |
Other values (155) | 436 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 4 | |
H | 3 | |
T | 2 | |
U | 1 | 6.2% |
N | 1 | 6.2% |
V | 1 | 6.2% |
A | 1 | 6.2% |
X | 1 | 6.2% |
W | 1 | 6.2% |
S | 1 | 6.2% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 2 | |
c | 1 | |
j | 1 | |
z | 1 | |
a | 1 | |
t | 1 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
0 | 1 | 20.0% |
3 | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
129 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Other Punctuation
Value | Count | Frequency (%) |
& | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 740 | |
Common | 141 | 15.6% |
Latin | 23 | 2.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
호 | 80 | 10.8% |
텔 | 79 | 10.7% |
스 | 29 | 3.9% |
이 | 20 | 2.7% |
라 | 19 | 2.6% |
리 | 17 | 2.3% |
산 | 17 | 2.3% |
트 | 16 | 2.2% |
광 | 14 | 1.9% |
울 | 13 | 1.8% |
Other values (155) | 436 |
Latin
Value | Count | Frequency (%) |
E | 4 | |
H | 3 | |
s | 2 | 8.7% |
T | 2 | 8.7% |
U | 1 | 4.3% |
N | 1 | 4.3% |
V | 1 | 4.3% |
A | 1 | 4.3% |
c | 1 | 4.3% |
j | 1 | 4.3% |
Other values (6) | 6 |
Common
Value | Count | Frequency (%) |
129 | ||
1 | 3 | 2.1% |
( | 2 | 1.4% |
) | 2 | 1.4% |
& | 2 | 1.4% |
0 | 1 | 0.7% |
- | 1 | 0.7% |
3 | 1 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 740 | |
ASCII | 164 | 18.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
129 | ||
E | 4 | 2.4% |
H | 3 | 1.8% |
1 | 3 | 1.8% |
s | 2 | 1.2% |
( | 2 | 1.2% |
) | 2 | 1.2% |
& | 2 | 1.2% |
T | 2 | 1.2% |
U | 1 | 0.6% |
Other values (14) | 14 | 8.5% |
Hangul
Value | Count | Frequency (%) |
호 | 80 | 10.8% |
텔 | 79 | 10.7% |
스 | 29 | 3.9% |
이 | 20 | 2.7% |
라 | 19 | 2.6% |
리 | 17 | 2.3% |
산 | 17 | 2.3% |
트 | 16 | 2.2% |
광 | 14 | 1.9% |
울 | 13 | 1.8% |
Other values (155) | 436 |
ctprvn_nm
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 6.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
부산 | |
---|---|
충북 | |
서울 | |
울산 | |
제주 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산 |
---|---|
2nd row | 부산 |
3rd row | 부산 |
4th row | 부산 |
5th row | 부산 |
Common Values
Value | Count | Frequency (%) |
부산 | 45 | |
충북 | 15 | 15.0% |
서울 | 14 | 14.0% |
울산 | 12 | 12.0% |
제주 | 8 | 8.0% |
전남 | 6 | 6.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부산 | 45 | |
충북 | 15 | 15.0% |
서울 | 14 | 14.0% |
울산 | 12 | 12.0% |
제주 | 8 | 8.0% |
전남 | 6 | 6.0% |
gugun_nm
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 22.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
수영구 | |
---|---|
중구 | |
남구 | |
해운대구 | |
서귀포시 | |
Other values (17) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.93 |
Min length | 2 |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 10.0% |
Sample
1st row | 부산진구 |
---|---|
2nd row | 강서구 |
3rd row | 부산진구 |
4th row | 중구 |
5th row | 중구 |
Common Values
Value | Count | Frequency (%) |
수영구 | 20 | |
중구 | 15 | |
남구 | 9 | |
해운대구 | 9 | |
서귀포시 | 8 | 8.0% |
청주시 | 6 | 6.0% |
여수시 | 6 | 6.0% |
충주시 | 5 | 5.0% |
연제구 | 4 | 4.0% |
강서구 | 3 | 3.0% |
Other values (12) | 15 |
Length
Value | Count | Frequency (%) |
수영구 | 20 | |
중구 | 15 | |
남구 | 9 | |
해운대구 | 9 | |
서귀포시 | 8 | 8.0% |
청주시 | 6 | 6.0% |
여수시 | 6 | 6.0% |
충주시 | 5 | 5.0% |
연제구 | 4 | 4.0% |
강서구 | 3 | 3.0% |
Other values (12) | 15 |
ldgs_addr
Text
Distinct | 97 |
---|---|
Distinct (%) | 97.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Length
Max length | 25 |
---|---|
Median length | 22 |
Mean length | 16.84 |
Min length | 11 |
Characters and Unicode
Total characters | 1684 |
---|---|
Distinct characters | 111 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 96 ? |
---|---|
Unique (%) | 96.0% |
Sample
1st row | 부산 부산진구 부전동 517-60 |
---|---|
2nd row | 부산 강서구 명지동 3239-15 |
3rd row | 부산 부산진구 부전동 512-4 |
4th row | 부산 중구 남포동5가 56-1 |
5th row | 부산 중구 중앙동4가 83-1 |
Value | Count | Frequency (%) |
부산 | 45 | 10.8% |
수영구 | 20 | 4.8% |
중구 | 15 | 3.6% |
충북 | 15 | 3.6% |
서울 | 14 | 3.3% |
울산 | 12 | 2.9% |
민락동 | 10 | 2.4% |
해운대구 | 9 | 2.2% |
광안동 | 9 | 2.2% |
남구 | 9 | 2.2% |
Other values (180) | 260 |
Most occurring characters
Value | Count | Frequency (%) |
318 | ||
1 | 112 | 6.7% |
동 | 87 | 5.2% |
- | 82 | 4.9% |
구 | 77 | 4.6% |
산 | 74 | 4.4% |
2 | 60 | 3.6% |
부 | 51 | 3.0% |
3 | 39 | 2.3% |
4 | 39 | 2.3% |
Other values (101) | 745 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 848 | |
Decimal Number | 435 | |
Space Separator | 318 | 18.9% |
Dash Punctuation | 82 | 4.9% |
Math Symbol | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 87 | 10.3% |
구 | 77 | 9.1% |
산 | 74 | 8.7% |
부 | 51 | 6.0% |
수 | 35 | 4.1% |
서 | 28 | 3.3% |
울 | 27 | 3.2% |
시 | 26 | 3.1% |
충 | 22 | 2.6% |
영 | 22 | 2.6% |
Other values (88) | 399 |
Decimal Number
Value | Count | Frequency (%) |
1 | 112 | |
2 | 60 | |
3 | 39 | 9.0% |
4 | 39 | 9.0% |
0 | 38 | 8.7% |
5 | 37 | 8.5% |
7 | 31 | 7.1% |
9 | 31 | 7.1% |
6 | 25 | 5.7% |
8 | 23 | 5.3% |
Space Separator
Value | Count | Frequency (%) |
318 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 82 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 848 | |
Common | 836 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 87 | 10.3% |
구 | 77 | 9.1% |
산 | 74 | 8.7% |
부 | 51 | 6.0% |
수 | 35 | 4.1% |
서 | 28 | 3.3% |
울 | 27 | 3.2% |
시 | 26 | 3.1% |
충 | 22 | 2.6% |
영 | 22 | 2.6% |
Other values (88) | 399 |
Common
Value | Count | Frequency (%) |
318 | ||
1 | 112 | 13.4% |
- | 82 | 9.8% |
2 | 60 | 7.2% |
3 | 39 | 4.7% |
4 | 39 | 4.7% |
0 | 38 | 4.5% |
5 | 37 | 4.4% |
7 | 31 | 3.7% |
9 | 31 | 3.7% |
Other values (3) | 49 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 848 | |
ASCII | 836 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
318 | ||
1 | 112 | 13.4% |
- | 82 | 9.8% |
2 | 60 | 7.2% |
3 | 39 | 4.7% |
4 | 39 | 4.7% |
0 | 38 | 4.5% |
5 | 37 | 4.4% |
7 | 31 | 3.7% |
9 | 31 | 3.7% |
Other values (3) | 49 | 5.9% |
Hangul
Value | Count | Frequency (%) |
동 | 87 | 10.3% |
구 | 77 | 9.1% |
산 | 74 | 8.7% |
부 | 51 | 6.0% |
수 | 35 | 4.1% |
서 | 28 | 3.3% |
울 | 27 | 3.2% |
시 | 26 | 3.1% |
충 | 22 | 2.6% |
영 | 22 | 2.6% |
Other values (88) | 399 |
utiliiza_ota_nm
Categorical
Distinct | 15 |
---|---|
Distinct (%) | 15.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] | |
---|---|
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS'] | |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'YANOLJA'] | |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'INTERPARK', 'YANOLJA'] | |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'YANOLJA'] | |
Other values (10) |
Length
Max length | 96 |
---|---|
Median length | 88 |
Mean length | 70.78 |
Min length | 32 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 6.0% |
Sample
1st row | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'YANOLJA'] |
---|---|
2nd row | ['AGODA', 'GOODCHOICE', 'INTERPARK', 'YANOLJA'] |
3rd row | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
4th row | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
5th row | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
Common Values
Value | Count | Frequency (%) |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] | 27 | |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS'] | 25 | |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'YANOLJA'] | 10 | 10.0% |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'INTERPARK', 'YANOLJA'] | 8 | 8.0% |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'YANOLJA'] | 6 | 6.0% |
['AGODA', 'BOOKING', 'DAILY', 'GOODCHOICE'] | 6 | 6.0% |
['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE'] | 6 | 6.0% |
['AGODA', 'BOOKING', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] | 4 | 4.0% |
['AGODA', 'DAILY', 'GOODCHOICE'] | 2 | 2.0% |
['AGODA', 'GOODCHOICE', 'INTERPARK', 'YANOLJA'] | 1 | 1.0% |
Other values (5) | 5 | 5.0% |
Length
Value | Count | Frequency (%) |
agoda | 100 | |
goodchoice | 100 | |
booking | 95 | |
daily | 93 | |
expedia | 91 | |
hotels | 69 | |
yanolja | 58 | |
interpark | 43 | |
trip | 1 | 0.2% |
ldgs_nm | ctprvn_nm | gugun_nm | ldgs_addr | utiliiza_ota_nm | |
---|---|---|---|---|---|
ldgs_nm | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
ctprvn_nm | 1.000 | 1.000 | 0.987 | 1.000 | 0.638 |
gugun_nm | 1.000 | 0.987 | 1.000 | 1.000 | 0.415 |
ldgs_addr | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
utiliiza_ota_nm | 1.000 | 0.638 | 0.415 | 1.000 | 1.000 |
utiliiza_ota_nm | gugun_nm | ctprvn_nm | |
---|---|---|---|
utiliiza_ota_nm | 1.000 | 0.127 | 0.341 |
gugun_nm | 0.127 | 1.000 | 0.859 |
ctprvn_nm | 0.341 | 0.859 | 1.000 |
ctprvn_nm | gugun_nm | utiliiza_ota_nm | |
---|---|---|---|
ctprvn_nm | 1.000 | 0.859 | 0.341 |
gugun_nm | 0.859 | 1.000 | 0.127 |
utiliiza_ota_nm | 0.341 | 0.127 | 1.000 |
ldgs_nm | ctprvn_nm | gugun_nm | ldgs_addr | utiliiza_ota_nm | |
---|---|---|---|---|---|
0 | 아르반 호텔 | 부산 | 부산진구 | 부산 부산진구 부전동 517-60 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'YANOLJA'] |
1 | 명지 프렌치코드 | 부산 | 강서구 | 부산 강서구 명지동 3239-15 | ['AGODA', 'GOODCHOICE', 'INTERPARK', 'YANOLJA'] |
2 | 부산 비즈니스 호텔 | 부산 | 부산진구 | 부산 부산진구 부전동 512-4 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
3 | 스탠포드 인 부산 | 부산 | 중구 | 부산 중구 남포동5가 56-1 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
4 | 크라운 하버호텔 부산 | 부산 | 중구 | 부산 중구 중앙동4가 83-1 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
5 | 라마다 앙코르 바이 윈덤 부산역 | 부산 | 동구 | 부산 동구 초량동 1204-1 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'YANOLJA'] |
6 | 센텀 프리미어 호텔 | 부산 | 해운대구 | 부산 해운대구 우동 1521 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
7 | 명지 오션시티호텔 | 부산 | 강서구 | 부산 강서구 명지동 3237-4 | ['AGODA', 'BOOKING', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
8 | 마리안느호텔 | 부산 | 해운대구 | 부산 해운대구 중동 1400-24 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'YANOLJA'] |
9 | 베스트웨스턴 해운대 호텔 | 부산 | 해운대구 | 부산 해운대구 중동 1391-42 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS', 'INTERPARK', 'YANOLJA'] |
ldgs_nm | ctprvn_nm | gugun_nm | ldgs_addr | utiliiza_ota_nm | |
---|---|---|---|---|---|
90 | 더포인트호텔 광안리점 | 부산 | 수영구 | 부산 수영구 민락동 181-154 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS'] |
91 | 호텔 센트럴베이 | 부산 | 수영구 | 부산 수영구 광안동 197-2 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'INTERPARK', 'YANOLJA'] |
92 | 브라운도트호텔 수영점 | 부산 | 수영구 | 부산 수영구 수영동 450-5 | ['AGODA', 'BOOKING', 'DAILY', 'GOODCHOICE'] |
93 | 오션투헤븐 | 부산 | 수영구 | 부산 수영구 민락동 181-154 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS'] |
94 | 제이스테이 | 부산 | 수영구 | 부산 수영구 광안동 203-18 4~6층 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE'] |
95 | 벡스코호스텔 | 부산 | 수영구 | 부산 수영구 민락동 181-212 | ['AGODA', 'BOOKING', 'EXPEDIA', 'GOODCHOICE'] |
96 | 호텔미라주 | 부산 | 수영구 | 부산 수영구 광안동 203-4 | ['AGODA', 'DAILY', 'GOODCHOICE'] |
97 | 피코블루 | 부산 | 수영구 | 부산 수영구 민락동 178-15 | ['AGODA', 'DAILY', 'GOODCHOICE'] |
98 | 오션스테이호텔 | 부산 | 수영구 | 부산 수영구 민락동 181-154 | ['AGODA', 'BOOKING', 'DAILY', 'EXPEDIA', 'GOODCHOICE', 'HOTELS'] |
99 | 라움103 | 부산 | 수영구 | 부산 수영구 민락동 110-51 | ['AGODA', 'BOOKING', 'DAILY', 'GOODCHOICE'] |