그래프 어텐션 네트워크를 활용한 이더리움 컨트랙트 계좌 분류 및 트랜잭션 예측
Ethereum Account Classification and Transaction Prediction Using Graph Attention Network
- 주제어 (키워드) blockchain , Ethereum , DApp , WEB3 , Graph Neural Network(GNN) , Graph Attention Network(GAT) , machine learning
- 발행기관 서강대학교 정보통신대학원
- 지도교수 박수용
- 발행년도 2024
- 학위수여년월 2024. 2
- 학위명 석사
- 학과 및 전공 정보통신대학원 데이터사이언스 · 인공지능
- 실제URI http://www.dcollection.net/handler/sogang/000000076817
- UCI I804:11029-000000076817
- 본문언어 한국어
- 저작권 서강대학교 논문은 저작권 보호를 받습니다.
초록
기계학습 알고리즘을 활용한 블록체인 트랜잭션 데이터 분석은 여러 연구에서 논의되고 있으나, 주로 이상치 및 사기계좌 탐지에 목적을 두고 있어 DApp 을 기반으로 한 WEB3 측면에서의 분석 연구는 상대적으로 찾아보기 어렵다. 따라서 본 논문에서는 비즈니스 활용을 위한 두 모델을 제시한다. 먼저 이더리움 트랜잭션 데이터를 기반으로 익명의 컨트랙트 계정이 어떤 성격의 DApp 에 속하는지 분류한다. 그리고 이 정보를 추가 활용해, 최종적으로 특정 개인지갑이 DApp 을 사용할 것인지 예측하는 트랜잭션 예측 모델을 소개한다. 이더리움 네트워크는 계정과 계정 간 트랜잭션으로 구성되기 때문에 이에 적합한 구조인 그래프 형태로 표현했고, 그래프 어텐션 네트워크 알고리즘을 기반으로 모델을 생성했다. 그래프 신경망을 활용해 계정 분류 모델을 제안한 기존 연구들은 대부분 각 노드와 엣지의 타입을 구분하지 않은 동종 그래프로 다뤘다. 본 연구에서는 이더리움 블록체인의 기술적인 구조에 기반해 노드와 엣지의 타입을 구분한 이종 그래프로 분류 모델 학습을 수행했고, 그 결과 동종 그래프로 학습한 모델보다 컨트랙트 계정 유형 분류 성능을 향상시킬 수 있었다. 또한 이렇게 구한 컨트랙트 유형 정보를 트랜잭션 예측 모델의 피쳐로 추가했을 때, 기존 트랜잭션 데이터만 사용할 때보다 계정 간 트랜잭션 예측 성능이 개선되는 결과를 확인했다. 본 논문이 기여한 바는 다음과 같다. 이더리움 구조를 반영한 이종 그래프가 동종 그래프보다 이더리움 네트워크의 표현 및 예측력을 크게 높일 수 있음을 보였다. 그리고 연구에서 제안한 컨트랙트 계정 분류 모델을 활용하면 트랜잭션 데이터만으로 수작업 없이 자동으로 이더리움 DApp 의 성격을 식별해낼 수 있기 때문에, 이를 활용한다면 개인지갑 별로 어떤 카테고리의 DApp 서비스를 많이 활용하는지 신속하게 파악할 수 있을 것으로 기대한다. 또한 트랜잭션 예측 모델을 활용하면 향후 어떤 개인지갑, 즉 사용자가 특정 DApp 을 사용할 가능성이 높은지 예측할 수 있다. 이는 DApp 서비스 제공자 또는 배포자의 입장에서 중요한 EOA 를 파악하고 비즈니스 전략을 세우는 데 도움이 될 것으로 보인다. 한편, EVM 을 사용하는 블록체인의 경우 동일한 개인지갑 사용이 가능하고 트랜잭션 구조가 유사하기 때문에, 추후 이더리움 뿐만 아니라 EVM 을 기반의 다른 블록체인 네트워크를 함께 수집해 학습한다면 더욱 확장된 분석이 가능한 모델로 개선할 수 있을 것으로 기대한다.
more초록
Blockchain transaction analysis with machine learning algorithms has been discussed through many studies. However, as many researchers are focused on detecting anomaly or fraud accounts, there are relatively few studies for WEB3 analysis. This paper, therefore, proposes two deep learning models for business. At first, with Ethereum transaction data, a model that classifies which business category anonymous contract accounts (CAs) belong to is created. Using this information, I introduce a transaction prediction model that predicts whether a personal wallet will use a certain DApp. Since the Ethereum network consists of account-to-account transactions, the models are learned using Graph Attention Network (GAT) by representing a graph. Most existing studies that proposed account classification models using graph neural networks have treated them as homogeneous graphs that consider all nodes and edges of the same type. In this study, learning the classification model was performed with a type of heterogeneous graph that distinguished node and edge types based on the technical structure of Ethereum. As a result, the accuracy of the CA classification model was greatly increased compared to the model learned with a homogeneous graph. The contract type information obtained in this way was used with transaction data for learning a transaction prediction model so that the performance could be improved. The contribution of this paper is as follows. It has been shown that heterogeneous graphs based on the Ethereum structure can significantly increase the expression and predictive power of the networks compared to homogeneous graphs. Since the CA classification model can automatically identify CAs only using transaction history without manual work, it can identify which category of DApp services is used a lot by a particular personal wallet. The transaction prediction model can be used to predict which personal wallets, i.e., users, are more likely to use specific DApps in the future. This is expected to help DApp service providers or distributors identify important EOAs and establish WEB3 business strategies. In addition, in the case of blockchains using EVM, the same personal wallet can be used, and the transaction structure is similar, so if other blockchain networks based on EVM as well as Ethereum are collected and learned together, it is expected to be improved into a model that can be further expanded.
more목차
제1장 서론 1
1.1. 연구 배경 및 목적 1
1.2. 논문 구성 2
제2장 관련 연구 4
2.1. 이더리움 네트워크 구조 · 4
2.1.1. 계정 4
2.1.2. 메시지와 트랜잭션 4
2.2. 기계학습을 활용한 이더리움 네트워크 연구 동향 4
2.3. 그래프 신경망 알고리즘 · 5
2.3.1. 그래프 어텐션 네트워크 · 6
2.3.2. 대규모 그래프에서의 신경망 학습 방법 7
2.3.3. 이종 그래프 기반 그래프 신경망 연구 · 7
2.3.4. 메시지 패싱을 활용한 이종 그래프 학습 방법 8
2.3.5. 행렬분해를 사용한 그래프 신경망 기반 링크 예측 9
2.3.6. 노드 분류 결과를 활용한 링크 예측 성능 개선 · 10
제3장 연구 모델 11
3.1. 노드 임베딩 모델 11
3.2. 컨트랙트 계정 유형 분류 모델 13
3.3. 트랜잭션 발생 예측 모델 13
제4장 실험 설계 및 결과 · 15
4.1. 실험 데이터 · 15
4.1.1. 데이터 수집 및 전처리 15
4.1.2 그래프 생성 및 이웃 샘플링 19
4.2. 비교 및 평가 방법 20
4.3. 실험 결과 · 23
4.3.1. 컨트랙트 유형 분류 모델 평가 · 23
4.3.2 링크 예측 모델 평가 24
제5장 결론 · 26
참고 문헌 28