Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.2 KiB |
Average record size in memory | 43.3 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Numeric | 2 |
Dataset
Description | Sample |
---|---|
Author | 부산정보산업진흥원 |
URL | https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=e0efdac0-f501-11eb-8e60-2bcdc8456bfb |
place_nm is highly overall correlated with base_quarter | High correlation |
base_quarter is highly overall correlated with place_nm | High correlation |
card_utiliiza_price is highly overall correlated with card_utiliiza_cas_co | High correlation |
card_utiliiza_cas_co is highly overall correlated with card_utiliiza_price | High correlation |
place_nm is highly imbalanced (80.6%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 09:43:17.222230 |
---|---|
Analysis finished | 2023-12-10 09:43:18.869251 |
Duration | 1.65 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
place_nm
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
BIFF광장&용두산공원&보수동책방골목 | |
---|---|
흰여울문화마을 | 3 |
Length
Max length | 20 |
---|---|
Median length | 20 |
Mean length | 19.61 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | BIFF광장&용두산공원&보수동책방골목 |
---|---|
2nd row | 흰여울문화마을 |
3rd row | BIFF광장&용두산공원&보수동책방골목 |
4th row | BIFF광장&용두산공원&보수동책방골목 |
5th row | BIFF광장&용두산공원&보수동책방골목 |
Common Values
Value | Count | Frequency (%) |
BIFF광장&용두산공원&보수동책방골목 | 97 | |
흰여울문화마을 | 3 | 3.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
biff광장&용두산공원&보수동책방골목 | 97 | |
흰여울문화마을 | 3 | 3.0% |
country_nm
Text
Distinct | 70 |
---|---|
Distinct (%) | 70.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
프랑스 | 3 | 3.0% |
핀란드 | 3 | 3.0% |
인도네시아 | 3 | 3.0% |
스페인 | 2 | 2.0% |
헝가리 | 2 | 2.0% |
스웨덴 | 2 | 2.0% |
오스트리아 | 2 | 2.0% |
아일랜드 | 2 | 2.0% |
브라질 | 2 | 2.0% |
체코 | 2 | 2.0% |
Other values (60) | 77 |
Most occurring characters
Value | Count | Frequency (%) |
아 | 28 | 7.7% |
스 | 23 | 6.3% |
리 | 15 | 4.1% |
이 | 12 | 3.3% |
국 | 9 | 2.5% |
드 | 9 | 2.5% |
레 | 8 | 2.2% |
라 | 8 | 2.2% |
트 | 8 | 2.2% |
일 | 8 | 2.2% |
Other values (104) | 238 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 366 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
아 | 28 | 7.7% |
스 | 23 | 6.3% |
리 | 15 | 4.1% |
이 | 12 | 3.3% |
국 | 9 | 2.5% |
드 | 9 | 2.5% |
레 | 8 | 2.2% |
라 | 8 | 2.2% |
트 | 8 | 2.2% |
일 | 8 | 2.2% |
Other values (104) | 238 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 366 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
아 | 28 | 7.7% |
스 | 23 | 6.3% |
리 | 15 | 4.1% |
이 | 12 | 3.3% |
국 | 9 | 2.5% |
드 | 9 | 2.5% |
레 | 8 | 2.2% |
라 | 8 | 2.2% |
트 | 8 | 2.2% |
일 | 8 | 2.2% |
Other values (104) | 238 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 366 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
아 | 28 | 7.7% |
스 | 23 | 6.3% |
리 | 15 | 4.1% |
이 | 12 | 3.3% |
국 | 9 | 2.5% |
드 | 9 | 2.5% |
레 | 8 | 2.2% |
라 | 8 | 2.2% |
트 | 8 | 2.2% |
일 | 8 | 2.2% |
Other values (104) | 238 |
card_utiliiza_price
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 99 |
---|---|
Distinct (%) | 99.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4744716.7 |
Minimum | 5000 |
---|---|
Maximum | 2.2649 × 108 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 5000 |
---|---|
5-th percentile | 12140 |
Q1 | 86300 |
median | 200650 |
Q3 | 930872.5 |
95-th percentile | 14228899 |
Maximum | 2.2649 × 108 |
Range | 2.26485 × 108 |
Interquartile range (IQR) | 844572.5 |
Descriptive statistics
Standard deviation | 23714479 |
---|---|
Coefficient of variation (CV) | 4.998081 |
Kurtosis | 79.282379 |
Mean | 4744716.7 |
Median Absolute Deviation (MAD) | 164100 |
Skewness | 8.5830026 |
Sum | 4.7447167 × 108 |
Variance | 5.623765 × 1014 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
8000 | 2 | 2.0% |
226489999 | 1 | 1.0% |
12800 | 1 | 1.0% |
2199950 | 1 | 1.0% |
2523362 | 1 | 1.0% |
3252310 | 1 | 1.0% |
7620500 | 1 | 1.0% |
9149345 | 1 | 1.0% |
10724112 | 1 | 1.0% |
7000 | 1 | 1.0% |
Other values (89) | 89 |
Value | Count | Frequency (%) |
5000 | 1 | |
7000 | 1 | |
8000 | 2 | |
11000 | 1 | |
12200 | 1 | |
12500 | 1 | |
12800 | 1 | |
14350 | 1 | |
14740 | 1 | |
20000 | 1 |
Value | Count | Frequency (%) |
226489999 | 1 | |
53957560 | 1 | |
48896670 | 1 | |
16107500 | 1 | |
15292413 | 1 | |
14172925 | 1 | |
12343320 | 1 | |
10724112 | 1 | |
9202976 | 1 | |
9149345 | 1 |
card_utiliiza_cas_co
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 45 |
---|---|
Distinct (%) | 45.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 115.24 |
Minimum | 1 |
---|---|
Maximum | 5228 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 4 |
median | 9 |
Q3 | 28 |
95-th percentile | 338.55 |
Maximum | 5228 |
Range | 5227 |
Interquartile range (IQR) | 24 |
Descriptive statistics
Standard deviation | 548.66967 |
---|---|
Coefficient of variation (CV) | 4.7611044 |
Kurtosis | 78.277077 |
Mean | 115.24 |
Median Absolute Deviation (MAD) | 7 |
Skewness | 8.5229771 |
Sum | 11524 |
Variance | 301038.41 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 10 | 10.0% |
2 | 9 | 9.0% |
5 | 7 | 7.0% |
4 | 5 | 5.0% |
6 | 5 | 5.0% |
3 | 5 | 5.0% |
8 | 5 | 5.0% |
14 | 4 | 4.0% |
10 | 4 | 4.0% |
9 | 3 | 3.0% |
Other values (35) | 43 |
Value | Count | Frequency (%) |
1 | 10 | |
2 | 9 | |
3 | 5 | |
4 | 5 | |
5 | 7 | |
6 | 5 | |
7 | 2 | 2.0% |
8 | 5 | |
9 | 3 | 3.0% |
10 | 4 | 4.0% |
Value | Count | Frequency (%) |
5228 | 1 | |
1477 | 1 | |
864 | 1 | |
419 | 1 | |
406 | 1 | |
335 | 1 | |
330 | 1 | |
293 | 1 | |
251 | 1 | |
224 | 1 |
base_quarter
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
2020년 1분기 | |
---|---|
2020년 2분기 | |
2021년 2분기 | 3 |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2020년 1분기 |
---|---|
2nd row | 2021년 2분기 |
3rd row | 2020년 1분기 |
4th row | 2020년 1분기 |
5th row | 2020년 1분기 |
Common Values
Value | Count | Frequency (%) |
2020년 1분기 | 66 | |
2020년 2분기 | 31 | |
2021년 2분기 | 3 | 3.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2020년 | 97 | |
1분기 | 66 | |
2분기 | 34 | 17.0% |
2021년 | 3 | 1.5% |
place_nm | country_nm | card_utiliiza_price | card_utiliiza_cas_co | base_quarter | |
---|---|---|---|---|---|
place_nm | 1.000 | 0.000 | 0.000 | 0.000 | 1.000 |
country_nm | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
card_utiliiza_price | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
card_utiliiza_cas_co | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
base_quarter | 1.000 | 0.000 | 0.000 | 0.000 | 1.000 |
place_nm | base_quarter | |
---|---|---|
place_nm | 1.000 | 0.995 |
base_quarter | 0.995 | 1.000 |
card_utiliiza_price | card_utiliiza_cas_co | place_nm | base_quarter | |
---|---|---|---|---|
card_utiliiza_price | 1.000 | 0.896 | 0.000 | 0.000 |
card_utiliiza_cas_co | 0.896 | 1.000 | 0.000 | 0.000 |
place_nm | 0.000 | 0.000 | 1.000 | 0.995 |
base_quarter | 0.000 | 0.000 | 0.995 | 1.000 |
place_nm | country_nm | card_utiliiza_price | card_utiliiza_cas_co | base_quarter | |
---|---|---|---|---|---|
0 | BIFF광장&용두산공원&보수동책방골목 | 일본 | 226489999 | 5228 | 2020년 1분기 |
1 | 흰여울문화마을 | 프랑스 | 119700 | 11 | 2021년 2분기 |
2 | BIFF광장&용두산공원&보수동책방골목 | 중국 | 53957560 | 864 | 2020년 1분기 |
3 | BIFF광장&용두산공원&보수동책방골목 | 미국 | 48896670 | 1477 | 2020년 1분기 |
4 | BIFF광장&용두산공원&보수동책방골목 | 태국 | 16107500 | 335 | 2020년 1분기 |
5 | BIFF광장&용두산공원&보수동책방골목 | 홍콩 | 15292413 | 251 | 2020년 1분기 |
6 | BIFF광장&용두산공원&보수동책방골목 | 말레이지아 | 14172925 | 293 | 2020년 1분기 |
7 | 흰여울문화마을 | 핀란드 | 12500 | 1 | 2021년 2분기 |
8 | BIFF광장&용두산공원&보수동책방골목 | 싱가폴 | 12343320 | 224 | 2020년 1분기 |
9 | BIFF광장&용두산공원&보수동책방골목 | 으스트레일리아 | 9202976 | 330 | 2020년 1분기 |
place_nm | country_nm | card_utiliiza_price | card_utiliiza_cas_co | base_quarter | |
---|---|---|---|---|---|
90 | BIFF광장&용두산공원&보수동책방골목 | 홍콩 | 141000 | 6 | 2020년 2분기 |
91 | BIFF광장&용두산공원&보수동책방골목 | 핀란드 | 133200 | 14 | 2020년 2분기 |
92 | BIFF광장&용두산공원&보수동책방골목 | 카자흐스탄 | 108100 | 4 | 2020년 2분기 |
93 | BIFF광장&용두산공원&보수동책방골목 | 칠레 | 105400 | 5 | 2020년 2분기 |
94 | BIFF광장&용두산공원&보수동책방골목 | 브라질 | 97900 | 4 | 2020년 2분기 |
95 | BIFF광장&용두산공원&보수동책방골목 | 싸이프러스 | 87150 | 3 | 2020년 2분기 |
96 | BIFF광장&용두산공원&보수동책방골목 | 우크라이나 | 87100 | 10 | 2020년 2분기 |
97 | BIFF광장&용두산공원&보수동책방골목 | 오스트리아 | 86800 | 3 | 2020년 2분기 |
98 | BIFF광장&용두산공원&보수동책방골목 | 체코 | 75500 | 8 | 2020년 2분기 |
99 | BIFF광장&용두산공원&보수동책방골목 | 필리핀 | 74720 | 5 | 2020년 2분기 |