경제 분석을 위한 텍스트 마이닝 (Text Mining for Economic Analysis)

66 Pages Posted: 18 Jun 2019

See all articles by Soohyon Kim

Soohyon Kim

The Bank of Korea

Young Joon Lee

Stanford University - Precourt Institute for Energy; Yonsei University - Yonsei Business Research Institute

Jinyoung Shin

Yonsei University

Ki Young Park

Yonsei University

Date Written: June 18, 2019

Abstract

Korean Abstract: 본고에서는 텍스트 분석이 이루어지는 과정, 주요 방법론, 경제 분석에의 적용 사례 등을 상세히 기술하였다. 텍스트 마이닝이란 빅데이터 분석 또는 데이터 과학의 대표적인 분야이며, 머신러닝 등 전산기술을 활용하여 언어에 담긴 정보를 정형적 데이터로 추출해내는 과정이다. 언어는 다의성과 비정형성 등 고유한 특성이 있어 이로부터 원하는 정보만 추출해내기는 쉽지 않다. 텍스트 마이닝을 활용할 경우 기존 경제학적 방법으로 예측이 어려운 실시간 예측 및 불확실성 측정 등이 가능하며, 중앙은행 커뮤니케이션 분석 등 기존 모형의 적용이 어려웠던 주제들에 대한 분석도 가능하다. 전산기술의 발달과 동시에 텍스트 마이닝 기법은 빠른 속도로 발전해가고 있으며, 최근 학계와 중앙은행의 관심도 지속적으로 증가함에 따라 경제학 분야에서도 텍스트 마이닝을 활용한 연구가 주요 학술지에 게재되고 있다. 경제학적 분석에 주로 사용되는 구조화된 수치자료의 한계를 보완함과 동시에 새로운 정보의 원천으로써 텍스트 데이터의 수요는 더욱 증대될 것으로 기대된다.

English Abstract: We provide detailed description of how text data analysis is done and review series of studies done through text mining. Natural language can be characterized with ambiguity and obscurity compared to structured data. It is hard to retrieve useful information from text data as it carries natural language itself. Text mining or natural language processing is a multi-discipline area of modern technic in which we can distill and obtain just what we need from text. With the development of AI and machine learning, text mining is becoming one of the high-end technology in various fields of research even in economics. We expect there will be more demand for text data analysis as it will be complementary to traditional structured data and also as a new source of information.

Keywords: Text Mining, Machine Learning, Economic Analysis

JEL Classification: A12, B41, C80

Suggested Citation

Kim, Soohyon and Lee, Young Joon and Shin, Jinyoung and Park, Ki Young, 경제 분석을 위한 텍스트 마이닝 (Text Mining for Economic Analysis) (June 18, 2019). Bank of Korea WP 2019-18. Available at SSRN: https://ssrn.com/abstract=3405781 or http://dx.doi.org/10.2139/ssrn.3405781

Soohyon Kim (Contact Author)

The Bank of Korea ( email )

39, Namdaemun-ro, Jung-gu
Seoul, 04531
Korea, Republic of (South Korea)

Young Joon Lee

Stanford University - Precourt Institute for Energy ( email )

473 Via Ortega, Suite 324
Stanford University
Stanford, CA 94305
United States

HOME PAGE: http://energy.stanford.edu

Yonsei University - Yonsei Business Research Institute ( email )

50 Yonsei-ro, Seodaemun-gu
Yonsei University
Seoul, 03722
Korea, Republic of (South Korea)

Jinyoung Shin

Yonsei University ( email )

Seoul
Korea, Republic of (South Korea)

Ki Young Park

Yonsei University ( email )

Yonsei University
Seoul
Korea, Republic of (South Korea)

Register to save articles to
your library

Register

Paper statistics

Downloads
29
Abstract Views
150
PlumX Metrics