Overview

Dataset statistics

Number of variables10
Number of observations33
Missing cells18
Missing cells (%)5.5%
Duplicate rows1
Duplicate rows (%)3.0%
Total size in memory2.7 KiB
Average record size in memory85.0 B

Variable types

Categorical4
DateTime5
Numeric1

Dataset

Description광주광역시 서구의 정보화교육에 관한 데이터입니다.각 월, 교육과정명, 시작일, 종료일, 요일, 시작시간, 종료시간, 인원, 교육내용, 접수일을 알 수 있습니다.
Author광주광역시 서구
URLhttps://www.data.go.kr/data/3033273/fileData.do

Alerts

Dataset has 1 (3.0%) duplicate rowsDuplicates
과정명 is highly overall correlated with 요일 and 1 other fieldsHigh correlation
교육내용 is highly overall correlated with 과정명 and 1 other fieldsHigh correlation
요일 is highly overall correlated with 과정명 and 1 other fieldsHigh correlation
시작일 has 3 (9.1%) missing valuesMissing
종료일 has 3 (9.1%) missing valuesMissing
시작시간 has 3 (9.1%) missing valuesMissing
종료시간 has 3 (9.1%) missing valuesMissing
인원 has 3 (9.1%) missing valuesMissing
접수일 has 3 (9.1%) missing valuesMissing

Reproduction

Analysis started2023-12-23 07:24:00.778672
Analysis finished2023-12-23 07:24:03.235768
Duration2.46 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

월별
Categorical

Distinct12
Distinct (%)36.4%
Missing0
Missing (%)0.0%
Memory size396.0 B
3월
4월
5월
6월
7월
Other values (7)
18 

Length

Max length4
Median length2
Mean length2.3939394
Min length2

Unique

Unique1 ?
Unique (%)3.0%

Sample

1st row2월
2nd row2월
3rd row3월
4th row3월
5th row3월

Common Values

ValueCountFrequency (%)
3월 3
9.1%
4월 3
9.1%
5월 3
9.1%
6월 3
9.1%
7월 3
9.1%
8월 3
9.1%
9월 3
9.1%
10월 3
9.1%
11월 3
9.1%
<NA> 3
9.1%
Other values (2) 3
9.1%

Length

2023-12-23T07:24:03.471938image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
3월 3
9.1%
4월 3
9.1%
5월 3
9.1%
6월 3
9.1%
7월 3
9.1%
8월 3
9.1%
9월 3
9.1%
10월 3
9.1%
11월 3
9.1%
na 3
9.1%
Other values (2) 3
9.1%

과정명
Categorical

HIGH CORRELATION 

Distinct7
Distinct (%)21.2%
Missing0
Missing (%)0.0%
Memory size396.0 B
컴퓨터 이해와 기초
한글2018
파워포인트2016
스마트폰 기초
스마트폰 활용
Other values (2)

Length

Max length10
Median length9
Mean length7.4848485
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row컴퓨터 이해와 기초
2nd row한글2018
3rd row컴퓨터 이해와 기초
4th row한글2018
5th row컴퓨터 이해와 기초

Common Values

ValueCountFrequency (%)
컴퓨터 이해와 기초 9
27.3%
한글2018 8
24.2%
파워포인트2016 4
12.1%
스마트폰 기초 4
12.1%
스마트폰 활용 3
 
9.1%
<NA> 3
 
9.1%
엑셀2016 2
 
6.1%

Length

2023-12-23T07:24:03.960739image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-23T07:24:04.573141image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
기초 13
22.4%
컴퓨터 9
15.5%
이해와 9
15.5%
한글2018 8
13.8%
스마트폰 7
12.1%
파워포인트2016 4
 
6.9%
활용 3
 
5.2%
na 3
 
5.2%
엑셀2016 2
 
3.4%

시작일
Date

MISSING 

Distinct24
Distinct (%)80.0%
Missing3
Missing (%)9.1%
Memory size396.0 B
Minimum2023-02-01 00:00:00
Maximum2023-12-04 00:00:00
2023-12-23T07:24:05.221110image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-23T07:24:05.894973image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=24)

종료일
Date

MISSING 

Distinct22
Distinct (%)73.3%
Missing3
Missing (%)9.1%
Memory size396.0 B
Minimum2023-02-28 00:00:00
Maximum2023-12-14 00:00:00
2023-12-23T07:24:06.316916image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-23T07:24:06.792511image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=22)

요일
Categorical

HIGH CORRELATION 

Distinct5
Distinct (%)15.2%
Missing0
Missing (%)0.0%
Memory size396.0 B
월+수
11 
화+목
11 
월+화+수+목+금
<NA>
월+화+수+목
 
1

Length

Max length9
Median length3
Mean length4.4848485
Min length3

Unique

Unique1 ?
Unique (%)3.0%

Sample

1st row월+수
2nd row화+목
3rd row월+수
4th row월+수
5th row화+목

Common Values

ValueCountFrequency (%)
월+수 11
33.3%
화+목 11
33.3%
월+화+수+목+금 7
21.2%
<NA> 3
 
9.1%
월+화+수+목 1
 
3.0%

Length

2023-12-23T07:24:07.343056image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-23T07:24:08.005210image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
월+수 11
33.3%
화+목 11
33.3%
월+화+수+목+금 7
21.2%
na 3
 
9.1%
월+화+수+목 1
 
3.0%

시작시간
Date

MISSING 

Distinct3
Distinct (%)10.0%
Missing3
Missing (%)9.1%
Memory size396.0 B
Minimum2023-12-23 09:00:00
Maximum2023-12-23 13:30:00
2023-12-23T07:24:08.413321image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-23T07:24:08.855561image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=3)

종료시간
Date

MISSING 

Distinct3
Distinct (%)10.0%
Missing3
Missing (%)9.1%
Memory size396.0 B
Minimum2023-12-23 11:30:00
Maximum2023-12-23 15:30:00
2023-12-23T07:24:09.323766image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-23T07:24:09.927025image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=3)

인원
Real number (ℝ)

MISSING 

Distinct13
Distinct (%)43.3%
Missing3
Missing (%)9.1%
Infinite0
Infinite (%)0.0%
Mean13.633333
Minimum6
Maximum20
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size429.0 B
2023-12-23T07:24:10.433085image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum6
5-th percentile8.45
Q110
median13.5
Q316.75
95-th percentile19
Maximum20
Range14
Interquartile range (IQR)6.75

Descriptive statistics

Standard deviation3.7736229
Coefficient of variation (CV)0.27679386
Kurtosis-1.0189493
Mean13.633333
Median Absolute Deviation (MAD)3.5
Skewness-0.069617451
Sum409
Variance14.24023
MonotonicityNot monotonic
2023-12-23T07:24:11.293235image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=13)
ValueCountFrequency (%)
10 7
21.2%
15 3
9.1%
19 3
9.1%
16 3
9.1%
13 3
9.1%
17 3
9.1%
12 2
 
6.1%
14 1
 
3.0%
20 1
 
3.0%
8 1
 
3.0%
Other values (3) 3
9.1%
(Missing) 3
9.1%
ValueCountFrequency (%)
6 1
 
3.0%
8 1
 
3.0%
9 1
 
3.0%
10 7
21.2%
12 2
 
6.1%
13 3
9.1%
14 1
 
3.0%
15 3
9.1%
16 3
9.1%
17 3
9.1%
ValueCountFrequency (%)
20 1
 
3.0%
19 3
9.1%
18 1
 
3.0%
17 3
9.1%
16 3
9.1%
15 3
9.1%
14 1
 
3.0%
13 3
9.1%
12 2
 
6.1%
10 7
21.2%

교육내용
Categorical

HIGH CORRELATION 

Distinct7
Distinct (%)21.2%
Missing0
Missing (%)0.0%
Memory size396.0 B
컴퓨터 기본 활용과 인터넷 활용
한글 프로그램을 활용한 문서 작성
PPT 작성 및 프리젠테이션
스마트폰의 기본 사용방법 및 활용법
스마트폰을 이용한 영상 및 사진 작업
Other values (2)

Length

Max length20
Median length19
Mean length16.333333
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row컴퓨터 기본 활용과 인터넷 활용
2nd row한글 프로그램을 활용한 문서 작성
3rd row컴퓨터 기본 활용과 인터넷 활용
4th row한글 프로그램을 활용한 문서 작성
5th row컴퓨터 기본 활용과 인터넷 활용

Common Values

ValueCountFrequency (%)
컴퓨터 기본 활용과 인터넷 활용 9
27.3%
한글 프로그램을 활용한 문서 작성 8
24.2%
PPT 작성 및 프리젠테이션 4
12.1%
스마트폰의 기본 사용방법 및 활용법 4
12.1%
스마트폰을 이용한 영상 및 사진 작업 3
 
9.1%
<NA> 3
 
9.1%
스프레드시트 사용 및 함수 활용 2
 
6.1%

Length

2023-12-23T07:24:12.110791image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-23T07:24:12.859964image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
13
 
8.6%
기본 13
 
8.6%
작성 12
 
7.9%
활용 11
 
7.2%
컴퓨터 9
 
5.9%
활용과 9
 
5.9%
인터넷 9
 
5.9%
한글 8
 
5.3%
프로그램을 8
 
5.3%
활용한 8
 
5.3%
Other values (15) 52
34.2%

접수일
Date

MISSING 

Distinct18
Distinct (%)60.0%
Missing3
Missing (%)9.1%
Memory size396.0 B
Minimum2023-01-19 00:00:00
Maximum2023-11-20 00:00:00
2023-12-23T07:24:13.458561image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-23T07:24:14.021393image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=18)

Interactions

2023-12-23T07:24:01.606951image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-23T07:24:14.307832image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
월별과정명시작일종료일요일시작시간종료시간인원교육내용접수일
월별1.0000.0001.0001.0000.4330.0000.0000.0000.0001.000
과정명0.0001.0000.8860.7040.8090.9140.9140.7701.0000.749
시작일1.0000.8861.0000.9920.8710.0000.0000.0000.8860.979
종료일1.0000.7040.9921.0000.7380.0000.0000.1730.7040.942
요일0.4330.8090.8710.7381.0000.6450.6450.6060.8090.737
시작시간0.0000.9140.0000.0000.6451.0001.0000.8740.9140.664
종료시간0.0000.9140.0000.0000.6451.0001.0000.8740.9140.664
인원0.0000.7700.0000.1730.6060.8740.8741.0000.7700.000
교육내용0.0001.0000.8860.7040.8090.9140.9140.7701.0000.749
접수일1.0000.7490.9790.9420.7370.6640.6640.0000.7491.000
2023-12-23T07:24:14.725571image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
과정명교육내용요일월별
과정명1.0001.0000.6320.000
교육내용1.0001.0000.6320.000
요일0.6320.6321.0000.209
월별0.0000.0000.2091.000
2023-12-23T07:24:15.074438image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
인원월별과정명요일교육내용
인원1.0000.0000.4720.3860.472
월별0.0001.0000.0000.2090.000
과정명0.4720.0001.0000.6321.000
요일0.3860.2090.6321.0000.632
교육내용0.4720.0001.0000.6321.000

Missing values

2023-12-23T07:24:01.978854image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-23T07:24:02.571903image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-23T07:24:02.968128image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

월별과정명시작일종료일요일시작시간종료시간인원교육내용접수일
02월컴퓨터 이해와 기초2023-02-012023-02-28월+수13:3015:3014컴퓨터 기본 활용과 인터넷 활용2023-01-19
12월한글20182023-02-012023-02-28화+목13:3015:3020한글 프로그램을 활용한 문서 작성2023-01-19
23월컴퓨터 이해와 기초2023-03-022023-03-31월+수09:3011:3015컴퓨터 기본 활용과 인터넷 활용2023-02-16
33월한글20182023-03-022023-03-31월+수13:3015:3019한글 프로그램을 활용한 문서 작성2023-02-16
43월컴퓨터 이해와 기초2023-03-022023-03-31화+목13:3015:308컴퓨터 기본 활용과 인터넷 활용2023-02-16
54월컴퓨터 이해와 기초2023-04-112023-05-04화+목13:3015:3012컴퓨터 기본 활용과 인터넷 활용2023-03-16
64월한글20182023-04-112023-05-04화+목09:3011:3019한글 프로그램을 활용한 문서 작성2023-03-16
74월파워포인트20162023-04-102023-05-03월+수13:3015:309PPT 작성 및 프리젠테이션2023-03-16
85월스마트폰 기초2023-05-082023-05-31월+화+수+목+금09:0012:0010스마트폰의 기본 사용방법 및 활용법2023-05-01
95월한글20182023-05-082023-05-31월+수13:3015:3016한글 프로그램을 활용한 문서 작성2023-04-21
월별과정명시작일종료일요일시작시간종료시간인원교육내용접수일
2310월스마트폰 활용2023-10-022023-10-31월+화+수+목+금09:0012:0010스마트폰을 이용한 영상 및 사진 작업2023-10-02
2410월컴퓨터 이해와 기초2023-10-112023-11-01월+수13:3015:3012컴퓨터 기본 활용과 인터넷 활용2023-09-15
2510월한글20182023-10-102023-11-02화+목13:3015:3018한글 프로그램을 활용한 문서 작성2023-09-15
2611월스마트폰 기초2023-11-012023-11-30월+화+수+목+금09:0012:0010스마트폰의 기본 사용방법 및 활용법2023-11-01
2711월한글20182023-11-062023-11-29월+수13:3015:3016한글 프로그램을 활용한 문서 작성2023-10-20
2811월파워포인트20162023-11-072023-11-30화+목13:3015:3015PPT 작성 및 프리젠테이션2023-10-20
2912월엑셀20162023-12-042023-12-14월+화+수+목13:3015:3017스프레드시트 사용 및 함수 활용2023-11-20
30<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>
31<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>
32<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>

Duplicate rows

Most frequently occurring

월별과정명시작일종료일요일시작시간종료시간인원교육내용접수일# duplicates
0<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>3