LSTM 기반 감성분석을 이용한 비트코인 가격 등락 예측

LSTM 기반 감성분석을 이용한 비트코인 가격 등락 예측

2 붐범범붐 1 188 03.04 13:36

1. 서론

 2009년 사토시 나카모토를 통해 처음 소개된 비트코인은 최초의 탈중앙화 암호 화폐이며 다른 알트코인, 가상화폐의 근본이 되는 암호화 화폐이다. 그 후 2010년 약 1달러였던 가 격이 2020년 8월 11000달러에 이를 만큼 놀라운 성장을 이뤘 으나 가격 변동성 또한 커지면서 비트코인의 가격을 예측하 기 위한 연구들이 진행되었다.  비트코인 가격예측에 있어 가격지표와 트위터를 이용한 연구 들은 많지만 뉴스를 활용한 연구들은 수가 적었다. 따라서 본 논문은 가장 큰 웹사이트 중 하나인 Google의 기사들을 활용 해 연구를 진행했다. 본 논문의 목표는 전날의 비트코인 관련 기사들을 이용해 비트코인의 가격등락을 예측하는 것이다. 먼저 전날의 비트 코인 관련 기사들을 수집해 감성 분석 처리한다. 처리된 값들 은 부정/긍정적인 기사를 분류하고 1일 평균 감성 수치를 제 공한다. 이 값들을 이용해 딥 러닝 모델 중 LSTM 모델을 이용해 비트코인 가격등락을 예측한다.


2. 본론

 본 장은 비트코인 가격 등락을 예측하기 위한 방법론을 설 명한다. 방법론에는 데이터 수집, 감성분석을 이용한 데이터 전처리, 딥 러닝 과정으로 이루어져있다. 구조도는 다음과 같다.


2-1. 예측

 LSTM은 신경망의 일종으로 시계열 데이터를 다루는데 특화된 딥 러닝 모델이다. 1일 단위의 감성 분석 평균값은 그림2와 같이 시계열의 데이터 형태로 나타나기 때문에 LSTM 모델의 input 값으로 적합하다. LSTM 모델의 feature들로는 총 기사의 수, 긍정적인 기사의 수,1일 단위 감성분석 평균값 을 넣었으며 label로는 종가를 설정했다.


3. 결과

 딥 러닝 단계에 있어, 예측 모델의 하이퍼 파라미터에 따라 예측 모델의 성능이 크게 달라지므로 최적의 하이퍼 파라미 터를 조정하는 과정은 필수적이다. 하이퍼 파라미터 조정에 관한 실험으로 훈련 셋과 테스트 셋의 비율, 은닉 층의 유닛 의 개수에 관한 실험을 진행했다. 훈련 셋과 테스트 셋 수를 훈련 셋 :1208, 테스트 셋:100 개로 두고 두 개의 은닉 층과 마지막 하나의 sigmoid 출력 층을 두고 은닉 층의 유닛의 수 를 조절해가며 실험했다. 그 결과 두 개의 은닉 층과 유닛이 각각 4개일 때 가장 좋은 정확도인 58.75%의 정확도를 보여 주었다.


4. 결론 및 향후 연구

실험 결과, 전날의 비트코인에 관한 기사가 다음날의 비트코인에 대해 어느 정도 영향을 끼침을 알 수 있다. 적은 수의 feature에도 불구하고 58.75% 정확도를 보여주는 것은 긍정 적인 성과이다. 하지만 여전히 비트코인 시세와 관련 기사 간 의 강한 상관관계를 보여주기에는 여전히 부족한 결과이다. 향후 연구계획으로는 Google news의 4개의 상위 언론사 외에 다른 언론사와 Yahoo의 기사를 수집한 연구를 진행할 것이 다. 


출처: 고려대학교 강민규, 김보선, 신무곤, 백의준, 김명섭 - LSTM 기반 감성분석을 이용한 비트코인 가격 등락 예측

Comments

오 이런 게 있었네요. 비트코인은 감정분석이 잘 먹힐 것 같기도 하네요. 가치 평가하기가 어려우니까요!
Category
Facebook Twitter GooglePlus KakaoStory NaverBand