Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 144 |
Missing cells | 118 |
Missing cells (%) | 13.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.3 KiB |
Average record size in memory | 51.9 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 1 |
Text | 2 |
Dataset
Description | 중국 26개 지역 기준 신소재, 수질관리 등 친환경 분야 기업 수 및 투자자금(지역명, 항목 수, 주요 항목명, 투자액 등) |
---|---|
Author | 한국환경산업기술원 |
URL | https://www.data.go.kr/data/15068052/fileData.do |
연번 is highly overall correlated with 지역 | High correlation |
항목 수(친환경) is highly overall correlated with 항목 수(전체) and 1 other fields | High correlation |
항목 수(전체) is highly overall correlated with 항목 수(친환경) and 1 other fields | High correlation |
지역 is highly overall correlated with 연번 and 2 other fields | High correlation |
비고 has 118 (81.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 16:02:00.493860 |
---|---|
Analysis finished | 2023-12-12 16:02:01.949722 |
Duration | 1.46 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 26 |
---|---|
Distinct (%) | 18.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.451389 |
Minimum | 1 |
---|---|
Maximum | 26 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 3 |
Q1 | 7 |
median | 15 |
Q3 | 21 |
95-th percentile | 25 |
Maximum | 26 |
Range | 25 |
Interquartile range (IQR) | 14 |
Descriptive statistics
Standard deviation | 7.5704891 |
---|---|
Coefficient of variation (CV) | 0.52385893 |
Kurtosis | -1.3008878 |
Mean | 14.451389 |
Median Absolute Deviation (MAD) | 7 |
Skewness | -0.11778573 |
Sum | 2081 |
Variance | 57.312306 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
7 | 9 | 6.2% |
24 | 9 | 6.2% |
25 | 8 | 5.6% |
20 | 7 | 4.9% |
19 | 7 | 4.9% |
16 | 7 | 4.9% |
23 | 7 | 4.9% |
17 | 6 | 4.2% |
22 | 6 | 4.2% |
10 | 6 | 4.2% |
Other values (16) | 72 |
Value | Count | Frequency (%) |
1 | 4 | |
2 | 3 | 2.1% |
3 | 4 | |
4 | 5 | |
5 | 6 | |
6 | 6 | |
7 | 9 | |
8 | 6 | |
9 | 4 | |
10 | 6 |
Value | Count | Frequency (%) |
26 | 5 | |
25 | 8 | |
24 | 9 | |
23 | 7 | |
22 | 6 | |
21 | 5 | |
20 | 7 | |
19 | 7 | |
18 | 4 | |
17 | 6 |
지역
Categorical
HIGH CORRELATION
 
Distinct | 26 |
---|---|
Distinct (%) | 18.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
광동성 | 9 |
---|---|
췐저우시 | 9 |
간쑤성 | 8 |
쟝먼시 | 7 |
샨시성 | 7 |
Other values (21) |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.4027778 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 허베이성 |
---|---|
2nd row | 허베이성 |
3rd row | 허베이성 |
4th row | 허베이성 |
5th row | 즈보시 |
Common Values
Value | Count | Frequency (%) |
광동성 | 9 | 6.2% |
췐저우시 | 9 | 6.2% |
간쑤성 | 8 | 5.6% |
쟝먼시 | 7 | 4.9% |
샨시성 | 7 | 4.9% |
구이저우성 | 7 | 4.9% |
후난성 | 7 | 4.9% |
스자좡시 | 6 | 4.2% |
장쑤성 | 6 | 4.2% |
상하이시 | 6 | 4.2% |
Other values (16) | 72 |
Length
Value | Count | Frequency (%) |
광동성 | 9 | 6.2% |
췐저우시 | 9 | 6.2% |
간쑤성 | 8 | 5.6% |
쟝먼시 | 7 | 4.9% |
샨시성 | 7 | 4.9% |
구이저우성 | 7 | 4.9% |
후난성 | 7 | 4.9% |
스자좡시 | 6 | 4.2% |
장쑤성 | 6 | 4.2% |
상하이시 | 6 | 4.2% |
Other values (16) | 72 |
항목 수(친환경)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 20 |
---|---|
Distinct (%) | 13.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 28.125 |
Minimum | 3 |
---|---|
Maximum | 98 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 5 |
Q1 | 13 |
median | 20.5 |
Q3 | 32 |
95-th percentile | 98 |
Maximum | 98 |
Range | 95 |
Interquartile range (IQR) | 19 |
Descriptive statistics
Standard deviation | 25.198478 |
---|---|
Coefficient of variation (CV) | 0.89594588 |
Kurtosis | 2.596846 |
Mean | 28.125 |
Median Absolute Deviation (MAD) | 7.5 |
Skewness | 1.8549935 |
Sum | 4050 |
Variance | 634.96329 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
13 | 17 | 11.8% |
5 | 14 | 9.7% |
25 | 12 | 8.3% |
20 | 11 | 7.6% |
27 | 9 | 6.2% |
98 | 9 | 6.2% |
38 | 8 | 5.6% |
32 | 7 | 4.9% |
88 | 7 | 4.9% |
26 | 6 | 4.2% |
Other values (10) | 44 |
Value | Count | Frequency (%) |
3 | 2 | 1.4% |
4 | 5 | 3.5% |
5 | 14 | |
9 | 4 | 2.8% |
12 | 3 | 2.1% |
13 | 17 | |
17 | 4 | 2.8% |
18 | 6 | 4.2% |
19 | 6 | 4.2% |
20 | 11 |
Value | Count | Frequency (%) |
98 | 9 | |
88 | 7 | |
38 | 8 | |
36 | 4 | 2.8% |
33 | 6 | |
32 | 7 | |
27 | 9 | |
26 | 6 | |
25 | 12 | |
21 | 4 | 2.8% |
항목 수(전체)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 17.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 596.05556 |
Minimum | 80 |
---|---|
Maximum | 3357 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 80 |
---|---|
5-th percentile | 89 |
Q1 | 240 |
median | 346 |
Q3 | 656 |
95-th percentile | 1230 |
Maximum | 3357 |
Range | 3277 |
Interquartile range (IQR) | 416 |
Descriptive statistics
Standard deviation | 705.68311 |
---|---|
Coefficient of variation (CV) | 1.1839217 |
Kurtosis | 9.017434 |
Mean | 596.05556 |
Median Absolute Deviation (MAD) | 194 |
Skewness | 2.9433771 |
Sum | 85832 |
Variance | 497988.65 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
656 | 9 | 6.2% |
300 | 9 | 6.2% |
1230 | 9 | 6.2% |
89 | 8 | 5.6% |
3357 | 7 | 4.9% |
105 | 7 | 4.9% |
469 | 7 | 4.9% |
600 | 7 | 4.9% |
310 | 6 | 4.2% |
924 | 6 | 4.2% |
Other values (15) | 69 |
Value | Count | Frequency (%) |
80 | 5 | |
89 | 8 | |
105 | 7 | |
144 | 4 | |
152 | 6 | |
157 | 2 | 1.4% |
240 | 6 | |
265 | 3 | 2.1% |
300 | 9 | |
310 | 6 |
Value | Count | Frequency (%) |
3357 | 7 | |
1230 | 9 | |
1132 | 4 | |
1000 | 4 | |
924 | 6 | |
656 | 9 | |
600 | 7 | |
536 | 4 | |
487 | 5 | |
469 | 7 |
주요 항목
Text
Distinct | 127 |
---|---|
Distinct (%) | 88.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
Length
Max length | 25 |
---|---|
Median length | 20 |
Mean length | 12.493056 |
Min length | 6 |
Characters and Unicode
Total characters | 1799 |
---|---|
Distinct characters | 172 |
Distinct categories | 6 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 119 ? |
---|---|
Unique (%) | 82.6% |
Sample
1st row | 신에너지·신소재석유화학 개발 |
---|---|
2nd row | 오수처리시설 건설 |
3rd row | 징진지 친환경 물류단지 건설 |
4th row | 스마트 친환경 제조단지 건설 등 |
5th row | 산업단지 및 경제개발구 녹화 |
Value | Count | Frequency (%) |
건설 | 79 | 17.9% |
등 | 26 | 5.9% |
및 | 22 | 5.0% |
생활쓰레기 | 12 | 2.7% |
개발 | 9 | 2.0% |
정비 | 8 | 1.8% |
소각발전소 | 8 | 1.8% |
처리시설 | 6 | 1.4% |
친환경 | 6 | 1.4% |
고체폐기물 | 6 | 1.4% |
Other values (182) | 259 |
Most occurring characters
Value | Count | Frequency (%) |
297 | 16.5% | |
설 | 131 | 7.3% |
건 | 82 | 4.6% |
시 | 52 | 2.9% |
수 | 50 | 2.8% |
리 | 47 | 2.6% |
생 | 45 | 2.5% |
기 | 32 | 1.8% |
소 | 32 | 1.8% |
업 | 31 | 1.7% |
Other values (162) | 1000 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1477 | |
Space Separator | 297 | 16.5% |
Other Punctuation | 12 | 0.7% |
Uppercase Letter | 9 | 0.5% |
Open Punctuation | 2 | 0.1% |
Close Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
설 | 131 | 8.9% |
건 | 82 | 5.6% |
시 | 52 | 3.5% |
수 | 50 | 3.4% |
리 | 47 | 3.2% |
생 | 45 | 3.0% |
기 | 32 | 2.2% |
소 | 32 | 2.2% |
업 | 31 | 2.1% |
처 | 29 | 2.0% |
Other values (151) | 946 |
Uppercase Letter
Value | Count | Frequency (%) |
G | 2 | |
N | 2 | |
L | 2 | |
P | 1 | |
M | 1 | |
A | 1 |
Other Punctuation
Value | Count | Frequency (%) |
· | 10 | |
, | 2 | 16.7% |
Space Separator
Value | Count | Frequency (%) |
297 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1473 | |
Common | 313 | 17.4% |
Latin | 9 | 0.5% |
Han | 4 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
설 | 131 | 8.9% |
건 | 82 | 5.6% |
시 | 52 | 3.5% |
수 | 50 | 3.4% |
리 | 47 | 3.2% |
생 | 45 | 3.1% |
기 | 32 | 2.2% |
소 | 32 | 2.2% |
업 | 31 | 2.1% |
처 | 29 | 2.0% |
Other values (149) | 942 |
Latin
Value | Count | Frequency (%) |
G | 2 | |
N | 2 | |
L | 2 | |
P | 1 | |
M | 1 | |
A | 1 |
Common
Value | Count | Frequency (%) |
297 | ||
· | 10 | 3.2% |
( | 2 | 0.6% |
) | 2 | 0.6% |
, | 2 | 0.6% |
Han
Value | Count | Frequency (%) |
湖 | 2 | |
太 | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1473 | |
ASCII | 312 | 17.3% |
None | 10 | 0.6% |
CJK | 4 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
297 | ||
( | 2 | 0.6% |
) | 2 | 0.6% |
G | 2 | 0.6% |
, | 2 | 0.6% |
N | 2 | 0.6% |
L | 2 | 0.6% |
P | 1 | 0.3% |
M | 1 | 0.3% |
A | 1 | 0.3% |
Hangul
Value | Count | Frequency (%) |
설 | 131 | 8.9% |
건 | 82 | 5.6% |
시 | 52 | 3.5% |
수 | 50 | 3.4% |
리 | 47 | 3.2% |
생 | 45 | 3.1% |
기 | 32 | 2.2% |
소 | 32 | 2.2% |
업 | 31 | 2.1% |
처 | 29 | 2.0% |
Other values (149) | 942 |
None
Value | Count | Frequency (%) |
· | 10 |
CJK
Value | Count | Frequency (%) |
湖 | 2 | |
太 | 2 |
비고
Text
MISSING
 
Distinct | 23 |
---|---|
Distinct (%) | 88.5% |
Missing | 118 |
Missing (%) | 81.9% |
Memory size | 1.3 KiB |
Length
Max length | 81 |
---|---|
Median length | 31 |
Mean length | 28.461538 |
Min length | 18 |
Characters and Unicode
Total characters | 740 |
---|---|
Distinct characters | 101 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 22 ? |
---|---|
Unique (%) | 84.6% |
Sample
1st row | 총투자액 1조 8833.1억 위안 (한화 약 322.4조 원) |
---|---|
2nd row | 265개 항목 중 건설항목 245개 |
3rd row | 총투자액 1,165.3억 위안 (한화 약 20조 원) |
4th row | 지난시 신구동력전환구를 통한 빠른신인프라 건설 진행(프로젝트 승인,입지계획,친환경계획,입항,환경 영향평가 등 심사 비준을 마치고 융자채널을 넓힘) |
5th row | 총투자액 6,416.3억 위안 (한화 약 110조 원) |
Value | Count | Frequency (%) |
총투자액 | 18 | 9.9% |
원 | 18 | 9.9% |
약 | 18 | 9.9% |
한화 | 18 | 9.9% |
위안 | 18 | 9.9% |
1조 | 5 | 2.8% |
관련 | 4 | 2.2% |
환경보호 | 4 | 2.2% |
적음 | 4 | 2.2% |
프로젝트가 | 4 | 2.2% |
Other values (67) | 70 |
Most occurring characters
Value | Count | Frequency (%) |
155 | 20.9% | |
1 | 26 | 3.5% |
조 | 26 | 3.5% |
2 | 20 | 2.7% |
한 | 19 | 2.6% |
자 | 19 | 2.6% |
, | 19 | 2.6% |
) | 19 | 2.6% |
3 | 19 | 2.6% |
( | 19 | 2.6% |
Other values (91) | 399 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 388 | |
Space Separator | 155 | 20.9% |
Decimal Number | 131 | 17.7% |
Other Punctuation | 28 | 3.8% |
Close Punctuation | 19 | 2.6% |
Open Punctuation | 19 | 2.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
조 | 26 | 6.7% |
한 | 19 | 4.9% |
자 | 19 | 4.9% |
총 | 18 | 4.6% |
액 | 18 | 4.6% |
위 | 18 | 4.6% |
투 | 18 | 4.6% |
안 | 18 | 4.6% |
화 | 18 | 4.6% |
약 | 18 | 4.6% |
Other values (76) | 198 |
Decimal Number
Value | Count | Frequency (%) |
1 | 26 | |
2 | 20 | |
3 | 19 | |
5 | 14 | |
4 | 13 | |
6 | 9 | 6.9% |
8 | 9 | 6.9% |
9 | 8 | 6.1% |
7 | 7 | 5.3% |
0 | 6 | 4.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 19 | |
. | 9 |
Space Separator
Value | Count | Frequency (%) |
155 |
Close Punctuation
Value | Count | Frequency (%) |
) | 19 |
Open Punctuation
Value | Count | Frequency (%) |
( | 19 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 388 | |
Common | 352 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
조 | 26 | 6.7% |
한 | 19 | 4.9% |
자 | 19 | 4.9% |
총 | 18 | 4.6% |
액 | 18 | 4.6% |
위 | 18 | 4.6% |
투 | 18 | 4.6% |
안 | 18 | 4.6% |
화 | 18 | 4.6% |
약 | 18 | 4.6% |
Other values (76) | 198 |
Common
Value | Count | Frequency (%) |
155 | ||
1 | 26 | 7.4% |
2 | 20 | 5.7% |
, | 19 | 5.4% |
) | 19 | 5.4% |
3 | 19 | 5.4% |
( | 19 | 5.4% |
5 | 14 | 4.0% |
4 | 13 | 3.7% |
6 | 9 | 2.6% |
Other values (5) | 39 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 388 | |
ASCII | 352 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
155 | ||
1 | 26 | 7.4% |
2 | 20 | 5.7% |
, | 19 | 5.4% |
) | 19 | 5.4% |
3 | 19 | 5.4% |
( | 19 | 5.4% |
5 | 14 | 4.0% |
4 | 13 | 3.7% |
6 | 9 | 2.6% |
Other values (5) | 39 | 11.1% |
Hangul
Value | Count | Frequency (%) |
조 | 26 | 6.7% |
한 | 19 | 4.9% |
자 | 19 | 4.9% |
총 | 18 | 4.6% |
액 | 18 | 4.6% |
위 | 18 | 4.6% |
투 | 18 | 4.6% |
안 | 18 | 4.6% |
화 | 18 | 4.6% |
약 | 18 | 4.6% |
Other values (76) | 198 |
연번 | 지역 | 항목 수(친환경) | 항목 수(전체) | 비고 | |
---|---|---|---|---|---|
연번 | 1.000 | 1.000 | 0.809 | 0.866 | 0.659 |
지역 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
항목 수(친환경) | 0.809 | 1.000 | 1.000 | 0.833 | 0.901 |
항목 수(전체) | 0.866 | 1.000 | 0.833 | 1.000 | 0.947 |
비고 | 0.659 | 1.000 | 0.901 | 0.947 | 1.000 |
연번 | 항목 수(친환경) | 항목 수(전체) | 지역 | |
---|---|---|---|---|
연번 | 1.000 | 0.398 | 0.062 | 0.938 |
항목 수(친환경) | 0.398 | 1.000 | 0.544 | 0.925 |
항목 수(전체) | 0.062 | 0.544 | 1.000 | 0.921 |
지역 | 0.938 | 0.925 | 0.921 | 1.000 |
연번 | 지역 | 항목 수(친환경) | 항목 수(전체) | 주요 항목 | 비고 | |
---|---|---|---|---|---|---|
0 | 1 | 허베이성 | 5 | 536 | 신에너지·신소재석유화학 개발 | 총투자액 1조 8833.1억 위안 (한화 약 322.4조 원) |
1 | 1 | 허베이성 | 5 | 536 | 오수처리시설 건설 | <NA> |
2 | 1 | 허베이성 | 5 | 536 | 징진지 친환경 물류단지 건설 | <NA> |
3 | 1 | 허베이성 | 5 | 536 | 스마트 친환경 제조단지 건설 등 | <NA> |
4 | 2 | 즈보시 | 12 | 265 | 산업단지 및 경제개발구 녹화 | 265개 항목 중 건설항목 245개 |
5 | 2 | 즈보시 | 12 | 265 | 홍수 방지시설·스마트 생태단지 건설 | <NA> |
6 | 2 | 즈보시 | 12 | 265 | 친환경소재·복합신소재 개발 및 스마트 제조 등 | <NA> |
7 | 3 | 난징시 | 36 | 334 | 친환경 과학기술인프라 및 기초인프라 건설 | 총투자액 1,165.3억 위안 (한화 약 20조 원) |
8 | 3 | 난징시 | 36 | 334 | 공공안전 및 관리 | <NA> |
9 | 3 | 난징시 | 36 | 334 | 농촌 도로 업그레이드 | <NA> |
연번 | 지역 | 항목 수(친환경) | 항목 수(전체) | 주요 항목 | 비고 | |
---|---|---|---|---|---|---|
134 | 25 | 간쑤성 | 38 | 89 | 물환경 정비사업 | <NA> |
135 | 25 | 간쑤성 | 38 | 89 | 홍수방지시설 건설 | <NA> |
136 | 25 | 간쑤성 | 38 | 89 | 고체폐기물 매립장 건설 | <NA> |
137 | 25 | 간쑤성 | 38 | 89 | 생활오수처리시설 건설 | <NA> |
138 | 25 | 간쑤성 | 38 | 89 | 재생에너지 급열시설 건설 등 | <NA> |
139 | 26 | 톈진시 | 20 | 346 | 산업단지 리튬배터리 재이용 사업 | 총투자액 1조 25억 위안 (한화 약 172조 원) |
140 | 26 | 톈진시 | 20 | 346 | 신소재 및 복합소재 개발 | <NA> |
141 | 26 | 톈진시 | 20 | 346 | LNG저장시설 건설 | <NA> |
142 | 26 | 톈진시 | 20 | 346 | 하천·호수 물환경 종합정비 | <NA> |
143 | 26 | 톈진시 | 20 | 346 | 생태복원사업 등 | <NA> |