검색 상세

교육 분야 빅데이터를 활용한 학습자 유형 탐구 : 초등학교 5학년 수학 단원을 중심으로

Using Big Data in Education to Explore Learner Types : Focusing on a 5th grade math unit

초록 (요약문)

본 연구는 교육 분야의 빅데이터를 활용하여 에듀테크 서비스를 이용한 초등학교 5학년 학생들의 학습 유형을 군집분석을 통해 살펴보는 것을 목적으로 수행되었다. 앞으로 인공지능(AI) 디지털교과서가 민간 에듀테크 기업과 협업하여 개발될 것임을 고려할 때, 학습자 유형 탐구는 필수적이다. 따라서 본 연구는 AI 허브에 개방된 (주)아이스크림에듀의 에듀테크 서비스인 아이스크림 홈런을 이용한 학습자 데이터를 활용하였다. 이는 2015 개정 수학 교육과정을 적용한 수학 지식체계 데이터 세트와 수학 문항 정오답 결과를 문항반응이론(IRT)을 활용하여 구축한 데이터 세트이다. 이 연구의 목적을 달성하기 위하여 설정한 연구 문제는 다음과 같다. 첫째, 5학년 학생들의 수학 단원의 이해력은 어떠한 유형을 보이는가? 둘째, 수학 단원은 성별에 따라 어떠한 이해력 유형을 보이는가? 이러한 연구 문제를 해결하기 위하여 기술통계 분석 후 K-means 군집분석을 사용하여 학습자 유형을 확인하였다. 그 결과 전체 학생수는 2,356명이었고 성별의 비율(남: 1,246명, 여: 1,110명)은 거의 절반에 가까웠다. 평가(시험)은 총 193개였고, 각 수학 단원의 응시 학생수는 전체 학생수의 약 28 ~ 40% 였다. 적정 군집 수는 수학 단원의 이해력과 성별에 따라 모두 2개로 동일했다. 분석 결과는 첫째, 수학 단원별로 이해력이 높은 집단과 낮은 집단 간의 차이를 살펴보면, 분수와 소수의 사칙연산 관련 단원은 격차가 작았지만, 도형 관련 단원에서는 격차가 컸다. 특히 여학생 집단의 차이가 남학생보다 크게 나타났다. 또한 이해력이 높은 집단은 남학생과 여학생의 비율이 거의 절반에 가까웠지만, 이해력이 낮은 집단에서는 모든 단원에서 남학생의 비율이 여학생보다 일관되게 높았다. 둘째, 모든 단원에서 이해력이 높은 집단의 학생 비율은 낮은 집단보다 약 1.4 ~ 3.2배 높았다. 셋째, 모든 단원을 성별로 나눈 뒤 이해력을 기준으로 군집화한 결과, 이해력이 높은 집단의 학생 비율은 낮은 집단보다 남학생은 약 1.2 ~ 2.3배, 여학생은 약 1.4 ~ 4.6배 높았다. 그러나 성별의 집단 간 이해력과 표준편차의 차이는 매우 작았으므로, 학생 분포의 다양성에는 큰 차이가 없을 것으로 예측되었다. 본 연구는 에듀테크 서비스 이용자가 증가한 코로나19 시기, 전국의 학습자 유형을 살펴볼 수 있었다는 점에서 중요한 의의를 지닌다. 특히, 교육 분야에서 구축되기 시작한 공공 빅데이터를 이번 연구를 통해 검증할 수 있었다는 점은 의미가 있다. 또한, 수학 교육에서 중요한 요인으로 연구되어 온 성별 차이를 문항이나 영역이 아닌 세부 영역의 능력까지 분석할 수 있었다는 점 역시 큰 의미가 있다. 이는 앞으로 2022 개정 교육과정을 근간으로 하는 인공지능(AI) 디지털교과서의 AI 기반 맞춤형 학습 서비스 설계 및 효과적인 교육 방법을 재고찰하는데 참고가 될 수 있다는 점에서 가치가 있다. 그러나 본 연구는 수학 단원별 평가(시험)의 수도 동일하지 않았고, 각 단원에 동일한 학생이 응시한 결과도 아니었기 때문에 단원 간 흐름이 아닌 단원별로만 분석이 이루어질 수밖에 없었다. 또한, 오픈 데이터의 성별과 각 지역의 비율도 미리 선정되어 있었으며, 이해력 속성값의 범위도 세부적으로 문서화되어 있지 않았다. 따라서 후속 연구에서는 교육 측정평가 전문가들의 검증을 받은 빅데이터를 수집하여 학습자 유형을 심도 있게 연구할 필요가 있음을 제안하였다.

more

초록 (요약문)

The purpose of this study was to examine the learning styles of 5th grade elementary school students using edtech services among big data in the education field through cluster analysis. Considering that artificial intelligence (AI) digital textbooks will be developed in collaboration with private edtech companies in the future, it is essential to explore learner types. Therefore, this study utilized learner data from i-Scream Home-Learn, an edtech service of i-Scream Edu, which is open to the AI Hub. This is a data set of math knowledge system applied to the 2015 revised math curriculum and the results of correct answers to math questions using item response theory (IRT). To accomplish the purpose of this study, we set the following research questions. First, what types of comprehension skills do 5th grade students exhibit in math units? Second, what types of comprehension skills do students exhibit in math units by gender? To address these research questions, we used descriptive statistics followed by K-means cluster analysis to identify learner types. The results showed that the total number of students was 2,356, and the gender ratio was almost half (male: 1,246, female: 1,110). There were a total of 193 assessments (tests), and the number of students taking each math unit was about 28-40% of the total number of students. The optimal number of clusters was the same for both comprehension and gender for each math unit. The results of the analysis showed that, first, the gap between the high and low comprehension clusters by math unit was small for fractions and decimal operations, but large for geometry. The gap was particularly large for girls, with nearly half of the high-comprehension group consisting of boys and half of girls, while the low-comprehension group consistently had more boys than girls across all units. Second, across all units, the proportion of students in the high-comprehension group was about 1.4 to 3.2 times higher than the low-comprehension group. Third, when all units were divided by gender and then clustered by comprehension, the proportion of students in the high comprehension group was about 1.2 to 2.3 times higher for males and 1.4 to 4.6 times higher for females than the low comprehension group. However, the differences in comprehension and standard deviation between the groups were very small, so no significant difference in the diversity of the student distribution was predicted. This study is important because it provides a look at the types of learners across the country during the COVID-19 pandemic, when the number of people using edtech services has increased. In particular, it is significant that this study validates the public big data that is beginning to be built in the education sector. It is also significant that we were able to analyze gender differences, which have been studied as an important factor in math education, not by item or domain, but by sub-domain proficiency. This is valuable in that it can serve as a reference for rethinking the design of AI-based personalized learning services and effective teaching methods for AI-based digital textbooks based on the 2022 revised curriculum. However, since the number of assessments (tests) for each math unit was not the same, nor were the same students taking each unit, the study could only analyze each unit, not the flow between units. In addition, the gender and region of the open data were pre-selected, and the range of comprehension attribute values was not documented in detail. Therefore, it was suggested that follow-up studies should collect big data verified by experts in educational measurement and evaluation to study learner types in depth.

more

목차

Ⅰ. 서론 1
1. 연구의 필요성 및 목적 1
2. 연구 문제 3
Ⅱ. 이론적 배경 4
1. 2015 개정 수학 교과 역량 및 측정 4
가. 2015 개정 수학 교과 역량 4
나. 2015 개정 수학 교과 역량 측정 8
2. 문항반응이론의 개념과 적용 10
가. 문항반응이론의 개념 10
나. 문항반응이론의 적용 12
3. 군집분석(Clustering)의 개념과 적용 14
가. 군집분석의 개념 14
나. 군집분석의 적용 15
Ⅲ. 연구방법 18
1. 분석 자료 18
2. 분석 방법 21
Ⅳ. 연구결과 24
1. 기술통계 24
가. 분석 자료의 학생 분포 24
나. 분석 자료의 이해력 분포 24
2. 군집분석 28
가. 연구문제 1: 수학 단원의 학습자 이해력 유형 28
나. 연구문제 2: 수학 단원의 성별에 따른 학습자 이해력 유형 32
Ⅴ. 결론 및 제언 36
1. 요약 및 결론 36
2. 논의 및 제언 37
참고문헌 39

more