Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1082 |
Duplicate rows (%) | 10.8% |
Total size in memory | 712.9 KiB |
Average record size in memory | 73.0 B |
Variable types
DateTime | 1 |
---|---|
Text | 4 |
Categorical | 2 |
Numeric | 1 |
Dataset
Description | 거래일,품목,품종,단위,등급,가격,출하지,친환경구분(일반) |
---|---|
Author | 서울시농수산식품공사 |
URL | https://data.seoul.go.kr/dataList/OA-20950/S/1/datasetView.do |
친환경구분(일반) has constant value "" | Constant |
Dataset has 1082 (10.8%) duplicate rows | Duplicates |
등급 is highly imbalanced (86.5%) | Imbalance |
Reproduction
Analysis started | 2024-05-18 02:23:16.875586 |
---|---|
Analysis finished | 2024-05-18 02:23:18.870864 |
Duration | 2 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
거래일
Date
Distinct | 48 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2024-03-11 00:00:00 |
---|---|
Maximum | 2024-05-17 00:00:00 |
품목
Text
Distinct | 132 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
기타 | 1053 | 9.4% |
채소류 | 981 | 8.8% |
콩나물 | 920 | 8.2% |
마늘 | 794 | 7.1% |
숙주나물 | 693 | 6.2% |
두부 | 675 | 6.0% |
베이비 | 662 | 5.9% |
고사리 | 522 | 4.7% |
취나물 | 357 | 3.2% |
무순 | 356 | 3.2% |
Other values (128) | 4183 |
Most occurring characters
Value | Count | Frequency (%) |
물 | 2157 | 7.0% |
나 | 2152 | 7.0% |
류 | 1510 | 4.9% |
1196 | 3.9% | |
고 | 1118 | 3.6% |
타 | 1060 | 3.4% |
기 | 1056 | 3.4% |
마 | 1036 | 3.4% |
채 | 986 | 3.2% |
소 | 981 | 3.2% |
Other values (170) | 17492 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29460 | |
Space Separator | 1196 | 3.9% |
Open Punctuation | 44 | 0.1% |
Close Punctuation | 44 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
물 | 2157 | 7.3% |
나 | 2152 | 7.3% |
류 | 1510 | 5.1% |
고 | 1118 | 3.8% |
타 | 1060 | 3.6% |
기 | 1056 | 3.6% |
마 | 1036 | 3.5% |
채 | 986 | 3.3% |
소 | 981 | 3.3% |
콩 | 937 | 3.2% |
Other values (167) | 16467 |
Space Separator
Value | Count | Frequency (%) |
1196 |
Open Punctuation
Value | Count | Frequency (%) |
( | 44 |
Close Punctuation
Value | Count | Frequency (%) |
) | 44 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29460 | |
Common | 1284 | 4.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
물 | 2157 | 7.3% |
나 | 2152 | 7.3% |
류 | 1510 | 5.1% |
고 | 1118 | 3.8% |
타 | 1060 | 3.6% |
기 | 1056 | 3.6% |
마 | 1036 | 3.5% |
채 | 986 | 3.3% |
소 | 981 | 3.3% |
콩 | 937 | 3.2% |
Other values (167) | 16467 |
Common
Value | Count | Frequency (%) |
1196 | ||
( | 44 | 3.4% |
) | 44 | 3.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29460 | |
ASCII | 1284 | 4.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
물 | 2157 | 7.3% |
나 | 2152 | 7.3% |
류 | 1510 | 5.1% |
고 | 1118 | 3.8% |
타 | 1060 | 3.6% |
기 | 1056 | 3.6% |
마 | 1036 | 3.5% |
채 | 986 | 3.3% |
소 | 981 | 3.3% |
콩 | 937 | 3.2% |
Other values (167) | 16467 |
ASCII
Value | Count | Frequency (%) |
1196 | ||
( | 44 | 3.4% |
) | 44 | 3.4% |
품종
Text
Distinct | 224 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
수입 | 3561 | |
기타(상장예외 | 988 | 6.1% |
채소류 | 981 | 6.0% |
콩나물 | 920 | 5.7% |
숙주나물 | 693 | 4.3% |
베이비 | 662 | 4.1% |
깐마늘 | 501 | 3.1% |
고사리 | 500 | 3.1% |
대서 | 452 | 2.8% |
무순 | 356 | 2.2% |
Other values (203) | 6614 |
Most occurring characters
Value | Count | Frequency (%) |
6228 | 11.0% | |
수 | 3603 | 6.4% |
입 | 3567 | 6.3% |
물 | 2297 | 4.1% |
나 | 2152 | 3.8% |
류 | 1350 | 2.4% |
( | 1307 | 2.3% |
) | 1307 | 2.3% |
장 | 1302 | 2.3% |
채 | 1226 | 2.2% |
Other values (209) | 32272 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 47769 | |
Space Separator | 6228 | 11.0% |
Open Punctuation | 1307 | 2.3% |
Close Punctuation | 1307 | 2.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
수 | 3603 | 7.5% |
입 | 3567 | 7.5% |
물 | 2297 | 4.8% |
나 | 2152 | 4.5% |
류 | 1350 | 2.8% |
장 | 1302 | 2.7% |
채 | 1226 | 2.6% |
고 | 1120 | 2.3% |
타 | 1071 | 2.2% |
기 | 1067 | 2.2% |
Other values (206) | 29014 |
Space Separator
Value | Count | Frequency (%) |
6228 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1307 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1307 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 47769 | |
Common | 8842 | 15.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
수 | 3603 | 7.5% |
입 | 3567 | 7.5% |
물 | 2297 | 4.8% |
나 | 2152 | 4.5% |
류 | 1350 | 2.8% |
장 | 1302 | 2.7% |
채 | 1226 | 2.6% |
고 | 1120 | 2.3% |
타 | 1071 | 2.2% |
기 | 1067 | 2.2% |
Other values (206) | 29014 |
Common
Value | Count | Frequency (%) |
6228 | ||
( | 1307 | 14.8% |
) | 1307 | 14.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 47769 | |
ASCII | 8842 | 15.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6228 | ||
( | 1307 | 14.8% |
) | 1307 | 14.8% |
Hangul
Value | Count | Frequency (%) |
수 | 3603 | 7.5% |
입 | 3567 | 7.5% |
물 | 2297 | 4.8% |
나 | 2152 | 4.5% |
류 | 1350 | 2.8% |
장 | 1302 | 2.7% |
채 | 1226 | 2.6% |
고 | 1120 | 2.3% |
타 | 1071 | 2.2% |
기 | 1067 | 2.2% |
Other values (206) | 29014 |
단위
Text
Distinct | 128 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
10키로 | 1640 | |
3.5키로 | 1269 | |
4키로 | 1144 | |
1키로 | 1037 | |
20키로 | 694 | 6.9% |
500그람 | 664 | 6.6% |
2키로 | 482 | 4.8% |
50그람 | 455 | 4.5% |
5키로 | 434 | 4.3% |
12키로 | 349 | 3.5% |
Other values (112) | 1832 |
Most occurring characters
Value | Count | Frequency (%) |
키 | 8364 | |
로 | 8364 | |
0 | 4749 | |
1 | 3748 | |
5 | 3300 | 8.5% |
2 | 1711 | 4.4% |
그 | 1636 | 4.2% |
람 | 1636 | 4.2% |
. | 1632 | 4.2% |
3 | 1512 | 3.9% |
Other values (5) | 2360 | 6.0% |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 20000 | |
Decimal Number | 17380 | |
Other Punctuation | 1632 | 4.2% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 4749 | |
1 | 3748 | |
5 | 3300 | |
2 | 1711 | 9.8% |
3 | 1512 | 8.7% |
4 | 1333 | 7.7% |
6 | 497 | 2.9% |
8 | 187 | 1.1% |
7 | 176 | 1.0% |
9 | 167 | 1.0% |
Other Letter
Value | Count | Frequency (%) |
키 | 8364 | |
로 | 8364 | |
그 | 1636 | 8.2% |
람 | 1636 | 8.2% |
Other Punctuation
Value | Count | Frequency (%) |
. | 1632 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 20000 | |
Common | 19012 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 4749 | |
1 | 3748 | |
5 | 3300 | |
2 | 1711 | 9.0% |
. | 1632 | 8.6% |
3 | 1512 | 8.0% |
4 | 1333 | 7.0% |
6 | 497 | 2.6% |
8 | 187 | 1.0% |
7 | 176 | 0.9% |
Hangul
Value | Count | Frequency (%) |
키 | 8364 | |
로 | 8364 | |
그 | 1636 | 8.2% |
람 | 1636 | 8.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 20000 | |
ASCII | 19012 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
키 | 8364 | |
로 | 8364 | |
그 | 1636 | 8.2% |
람 | 1636 | 8.2% |
ASCII
Value | Count | Frequency (%) |
0 | 4749 | |
1 | 3748 | |
5 | 3300 | |
2 | 1711 | 9.0% |
. | 1632 | 8.6% |
3 | 1512 | 8.0% |
4 | 1333 | 7.0% |
6 | 497 | 2.6% |
8 | 187 | 1.0% |
7 | 176 | 0.9% |
등급
Categorical
IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
기타 | |
---|---|
중 | 137 |
대 | 128 |
소 | 110 |
등외 | 105 |
Other values (3) | 28 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 1.9597 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기타 |
---|---|
2nd row | 기타 |
3rd row | 기타 |
4th row | 기타 |
5th row | 기타 |
Common Values
Value | Count | Frequency (%) |
기타 | 9492 | |
중 | 137 | 1.4% |
대 | 128 | 1.3% |
소 | 110 | 1.1% |
등외 | 105 | 1.1% |
상 | 19 | 0.2% |
특 | 5 | 0.1% |
하 | 4 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
기타 | 9492 | |
중 | 137 | 1.4% |
대 | 128 | 1.3% |
소 | 110 | 1.1% |
등외 | 105 | 1.1% |
상 | 19 | 0.2% |
특 | 5 | < 0.1% |
하 | 4 | < 0.1% |
가격
Real number (ℝ)
Distinct | 529 |
---|---|
Distinct (%) | 5.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 29684.876 |
Minimum | 320 |
---|---|
Maximum | 2300000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 320 |
---|---|
5-th percentile | 750 |
Q1 | 4300 |
median | 12000 |
Q3 | 31000 |
95-th percentile | 125000 |
Maximum | 2300000 |
Range | 2299680 |
Interquartile range (IQR) | 26700 |
Descriptive statistics
Standard deviation | 54430.539 |
---|---|
Coefficient of variation (CV) | 1.8336118 |
Kurtosis | 323.44948 |
Mean | 29684.876 |
Median Absolute Deviation (MAD) | 9300 |
Skewness | 10.509322 |
Sum | 2.9684876 × 108 |
Variance | 2.9626835 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2700 | 491 | 4.9% |
4600 | 266 | 2.7% |
18000 | 244 | 2.4% |
10700 | 242 | 2.4% |
4300 | 218 | 2.2% |
17000 | 194 | 1.9% |
7500 | 183 | 1.8% |
20000 | 165 | 1.7% |
4500 | 162 | 1.6% |
19000 | 156 | 1.6% |
Other values (519) | 7679 |
Value | Count | Frequency (%) |
320 | 18 | 0.2% |
350 | 4 | < 0.1% |
360 | 26 | 0.3% |
370 | 129 | |
380 | 1 | < 0.1% |
390 | 5 | 0.1% |
400 | 15 | 0.1% |
450 | 1 | < 0.1% |
480 | 9 | 0.1% |
490 | 2 | < 0.1% |
Value | Count | Frequency (%) |
2300000 | 1 | < 0.1% |
781000 | 1 | < 0.1% |
780000 | 1 | < 0.1% |
650000 | 1 | < 0.1% |
570000 | 1 | < 0.1% |
550000 | 4 | |
516000 | 1 | < 0.1% |
512000 | 1 | < 0.1% |
470000 | 1 | < 0.1% |
450000 | 1 | < 0.1% |
출하지
Text
Distinct | 153 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
중국 | 3655 | |
경기도 | 1811 | 12.4% |
전라남도 | 984 | 6.7% |
광주시 | 688 | 4.7% |
경상남도 | 421 | 2.9% |
페루 | 413 | 2.8% |
충청남도 | 345 | 2.4% |
경상북도 | 331 | 2.3% |
제주자치도 | 315 | 2.2% |
태국 | 306 | 2.1% |
Other values (157) | 5357 |
Most occurring characters
Value | Count | Frequency (%) |
도 | 4837 | 10.3% |
4626 | 9.8% | |
국 | 4059 | 8.6% |
중 | 3655 | 7.8% |
시 | 3477 | 7.4% |
경 | 2574 | 5.5% |
남 | 2194 | 4.7% |
기 | 1845 | 3.9% |
주 | 1550 | 3.3% |
군 | 1385 | 2.9% |
Other values (149) | 16780 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 42352 | |
Space Separator | 4626 | 9.8% |
Close Punctuation | 2 | < 0.1% |
Open Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 4837 | 11.4% |
국 | 4059 | 9.6% |
중 | 3655 | 8.6% |
시 | 3477 | 8.2% |
경 | 2574 | 6.1% |
남 | 2194 | 5.2% |
기 | 1845 | 4.4% |
주 | 1550 | 3.7% |
군 | 1385 | 3.3% |
라 | 1034 | 2.4% |
Other values (146) | 15742 |
Space Separator
Value | Count | Frequency (%) |
4626 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 42352 | |
Common | 4630 | 9.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 4837 | 11.4% |
국 | 4059 | 9.6% |
중 | 3655 | 8.6% |
시 | 3477 | 8.2% |
경 | 2574 | 6.1% |
남 | 2194 | 5.2% |
기 | 1845 | 4.4% |
주 | 1550 | 3.7% |
군 | 1385 | 3.3% |
라 | 1034 | 2.4% |
Other values (146) | 15742 |
Common
Value | Count | Frequency (%) |
4626 | ||
) | 2 | < 0.1% |
( | 2 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 42352 | |
ASCII | 4630 | 9.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
도 | 4837 | 11.4% |
국 | 4059 | 9.6% |
중 | 3655 | 8.6% |
시 | 3477 | 8.2% |
경 | 2574 | 6.1% |
남 | 2194 | 5.2% |
기 | 1845 | 4.4% |
주 | 1550 | 3.7% |
군 | 1385 | 3.3% |
라 | 1034 | 2.4% |
Other values (146) | 15742 |
ASCII
Value | Count | Frequency (%) |
4626 | ||
) | 2 | < 0.1% |
( | 2 | < 0.1% |
친환경구분(일반)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
일반 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반 |
---|---|
2nd row | 일반 |
3rd row | 일반 |
4th row | 일반 |
5th row | 일반 |
Common Values
Value | Count | Frequency (%) |
일반 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반 | 10000 |
거래일 | 등급 | 가격 | |
---|---|---|---|
거래일 | 1.000 | 0.000 | 0.000 |
등급 | 0.000 | 1.000 | 0.000 |
가격 | 0.000 | 0.000 | 1.000 |
가격 | 등급 | |
---|---|---|
가격 | 1.000 | 0.000 |
등급 | 0.000 | 1.000 |
거래일 | 품목 | 품종 | 단위 | 등급 | 가격 | 출하지 | 친환경구분(일반) | |
---|---|---|---|---|---|---|---|---|
18600 | 2024-05-03 | 방풍나물 | 방풍나물 | 2키로 | 기타 | 7000 | 충청남도 보령시 | 일반 |
71927 | 2024-03-28 | 세발나물 | 세발나물 | 4키로 | 기타 | 12000 | 전라남도 해남군 | 일반 |
99708 | 2024-03-11 | 방풍나물 | 방풍나물 | 10키로 | 기타 | 50000 | 전라남도 여수시 | 일반 |
97680 | 2024-03-12 | 세발나물 | 세발나물 | 4키로 | 기타 | 14000 | 전라남도 해남군 | 일반 |
52604 | 2024-04-11 | 우엉 | 우엉채 | 2키로 | 기타 | 28000 | 경상북도 안동시 | 일반 |
58451 | 2024-04-05 | 두부 | 포장두부 | 12키로 | 기타 | 17000 | 인도 | 일반 |
41896 | 2024-04-17 | 채소류 기타 | 채소류 기타(상장예외) | 10키로 | 기타 | 21000 | 제주자치도 서귀포시 | 일반 |
21505 | 2024-05-02 | 마늘 | 깐마늘 대서 | 20키로 | 기타 | 127000 | 경상북도 의성군 | 일반 |
97646 | 2024-03-12 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 |
23545 | 2024-04-30 | 토란대 | 토란대 수입 | 1키로 | 기타 | 1100 | 미얀마 | 일반 |
거래일 | 품목 | 품종 | 단위 | 등급 | 가격 | 출하지 | 친환경구분(일반) | |
---|---|---|---|---|---|---|---|---|
37351 | 2024-04-19 | 꽃게 | 꽃게 냉동수 | 5.4키로 | 기타 | 27000 | 중국 | 일반 |
30552 | 2024-04-24 | 고사리 | 고사리 수입 | 10키로 | 기타 | 21000 | 중국 | 일반 |
63613 | 2024-04-03 | 생강 | 생강 원강 | 20키로 | 기타 | 115000 | 충청남도 서산시 | 일반 |
3057 | 2024-05-16 | 콩나물 | 콩나물 수입 | 4키로 | 기타 | 2700 | 중국 | 일반 |
54166 | 2024-04-09 | 숙주나물 | 숙주나물 수입 | 3.5키로 | 기타 | 4500 | 페루 | 일반 |
69067 | 2024-03-29 | 채소류 기타 | 채소류 기타(상장예외) | 20그람 | 기타 | 2140 | 경기도 광주시 | 일반 |
43679 | 2024-04-17 | 기타 건어류 | 기타 건어류 | 10키로 | 기타 | 163800 | 중국 | 일반 |
79069 | 2024-03-25 | 숙주나물 | 숙주나물 수입 | 3.5키로 | 기타 | 4500 | 중국 | 일반 |
34759 | 2024-04-23 | 마늘 | 잎마늘 | 20키로 | 기타 | 44000 | 전라남도 목포시 | 일반 |
36981 | 2024-04-22 | 마늘 | 깐마늘 대서 | 20키로 | 대 | 135000 | 경상남도 창녕군 | 일반 |
Most frequently occurring
거래일 | 품목 | 품종 | 단위 | 등급 | 가격 | 출하지 | 친환경구분(일반) | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
237 | 2024-03-22 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 17 |
339 | 2024-03-28 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 17 |
216 | 2024-03-21 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 14 |
61 | 2024-03-13 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 13 |
81 | 2024-03-14 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 13 |
139 | 2024-03-18 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 11 |
170 | 2024-03-19 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 11 |
315 | 2024-03-27 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 11 |
357 | 2024-03-29 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 11 |
624 | 2024-04-16 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2600 | 중국 | 일반 | 10 |