검색 상세

역동적 구조방정식 모형의 모의 수행 차이 평가 : 측정 모형을 중심으로

A simulation study examining the performance of dynamic structural equation modeling: focusing on measurement model

초록

최근 모바일 기기 및 웨어러블 디바이스 사용 증가에 따라 점점 더 많은 연구자들이 많은 개인을 상당한 수의 시점에서 측정한 집중 종단 자료(intensive longitudinal data)를 수집하고 있다. 이러한 집중 종단 자료를 분석하기 위해 제안된 모형 중 최근 역동적 구조방정식 모형(dynamic structural equation modeling; DSEM)이 연구자들의 관심을 받고 있다. DSEM은 시계열 분석, 다층 모형, 구조방정식을 하나의 틀로 결합한 모형으로, DSEM을 사용하면 여러 개인으로부터 얻어진 자료에 기반하여, 변인들의 자기 지연 효과, 교차 지연 효과를 포함한 다양한 형태의 역동적 관련성을 분석할 수 있다. DSEM의 사용이 증가하고 유용성이 알려지면서, 여러 조건에서 DSEM의 수행을 평가하고, 충분한 검증력 확보를 위해 필요한 표본 크기를 결정하기 위한 방법론 연구들도 점차 증가하고 있다. 그러나 이러한 연구들의 대부분은 여러 문항으로 하나의 구성 개념을 측정함에도 단순 합점수나 평균 점수만을 분석에 사용하는 상황을 가정하고 있다. 일반적으로 심리학 연구에서 하나의 구성 개념은 잠재 변수로 가정되며, 잠재 변수 측정에는 항상 측정 오차가 개입된다. 이러한 측정 오차를 분석에 고려하는가의 여부는 DSEM의 수행에 영향을 미칠 수 있으며, 분석을 위해 필요한 표본 크기에도 영향을 미칠 수 있다. 따라서, 본 연구에서는 (1) 측정 모형을 고려한 DSEM과 (2) 측정 변수들의 평균 점수를 사용한 DSEM, 이 두 모형에 따라 분석 결과의 정확성에 어떤 차이가 있는지를 시뮬레이션 연구를 통해 확인해보고자 하였다. 보다 구체적으로, 측정 변수들의 요인 부하가 서로 상이한 조건과 유사한 조건, 오차 분산 조건 및 다양한 수준의 응답자 수와 시점 수 조건, 자기회귀효과 조건에서 파라미터 추정의 정확성과 검증력을 평가하고, 이에 기반하여 다양한 조건에서 정확한 분석 결과와 충분한 검증력 확보를 위해 필요한 대략적인 표본 크기를 제안하고자 하였다. 분석 결과, 평균 자기회귀계수가 0이 아닐 때, 측정 모형을 고려한 모형의 추정 정확도와 검증력이 평균 점수를 사용한 모형보다 높았다. 그러나 평균 자기회귀계수가 0일 때는 두 모형의 수행이 차이가 없거나 평균 점수를 사용한 모형의 수행이 더 좋은 결과가 나타나기도 하였다. 또한, 요인 부하간 차이가 작고 오차 분산이 작을수록, 응답자와 시점 수가 많을수록 좋은 추정 정확도와 검증력을 보였다. 대략적으로 응답자 수 30명 이상, 시점 수 30 이상일 때 추정의 정확도와 검증력을 확보할 수 있었으나, 이는 요인 부하와 오차 분산 조건의 영향을 받았다. 특히 측정 모형을 고려한 모형은 시점 수가 적을 때 좋지 않은 수행 결과를 보여 충분한 크기의 시점 수로 자료를 수집할 필요성이 있었다. 이와 함께 본 연구의 한계점과 의의를 논의하고, 후속 연구를 제안하였다.

more

초록

Due to the widespread use of mobile and wearable devices, an increasing number of researchers collect intensive longitudinal data (ILD), which are collected by measuring individuals across a handful of time points. Dynamic structural equation modeling (DSEM) is one of the recently proposed statistical methods that can be used for analyzing ILD. DSEM incorporates time-series analysis, multilevel modeling, and structural equation modeling into a unified framework and is useful for analyzing complex dynamic relations including autocorrelation and cross-lagged effects based on the data from multiple individuals. With the increasing popularity of DSEM, methodological studies have been performed aiming to examine the performance of DSEM under various conditions and to determine sample size required to achieve sufficient statistical power. However, most of these studies used sum or mean scores of multiple indicators in the model ignoring measurement errors. Considering that indicators are not free of measurement errors, simply using sum or mean scores may deteriorate the performance of DSEM. Thus, the goal of this study was to examine if there are differences in the estimation accuracy and statistical power between (1) DSEM with considering measurement errors by incorporating a measurement model, and (2) DSEM without considering measurement errors by using the mean score of the indicators. For this purpose, a simulation study was performed in which the following five factors - homogeneity of factor loadings (similar vs. different), measurement error variance, the number of participants, the number of time points, and the size of autoregression – were manipulated to create various conditions. The accuracy of parameter estimation and statistical power were examined for the two models (DSEM with and without considering measurement errors) under these conditions. The results showed that when the mean autoregression coefficient was not 0, DSEM with considering measurement errors performed better than DSEM without considering measurement errors. However, when the mean autoregression coefficient was 0, the performance between the two models was not substantially different. In general, the estimation accuracy and statistical power were higher when the factor loadings were more homogeneous, the measurement error variance was smaller, the number of participants were larger, and the number of time points were larger. In addition, when both the number of participants and the number of time points were greater than 30, the estimation accuracy and statistical power for fixed effects seemed to be acceptible. However, the required sample size and number of time points would differ under various conditions including the homogeneity of factor loadings and error variances. Moreover, DSEM with considering measurement errors showed a poor performance when the number of time points was small, which showed the importance of having a sufficient number of time points. The implications and limitations of this study were discussed.

more