블룸버그가 금융 데이터 플랫폼에 NLP를 활용하는 방법

블룸버그를 생각하면, 케이블 TV와 라디오 채널을 포함한 뉴스서비스, 혹은 웹사이트와 같은 서비스들을 떠올리곤 합니다. 하지만, 블룸버그는 대부분의 매출을 금융 데이터 플랫폼인 블룸버그 터미널을 통해 거두어들이고 있습니다. 한화로 1조 원이 넘는 블룸버그의 매출 중 80% 가까이가 터미널 제공을 통해 발생하는 것으로 알려지고 있기도 합니다. 국내에서도 블룸버그 터미널을 사용하는 기업들 사이에서는 '블대리'라는 별명으로 불리며, 대리급 연봉에 맞먹는 사용 요금을 부과하는 것으로 알려져 왔습니다.


물론 과거에는 금융 기관들을 대상으로 실시간 금융 데이터들을 확인할 수 있는 하드웨어 기기를 판매하는 형태에 집중했다면, 최근에는 쉽게 방대한 데이터에 접근할 수 있는 소프트웨어 패키지를 판매하고 있습니다. 


최초의 블룸버그 터미널

출처: 블룸버그 유튜브 채널


블룸버그 터미널을 구독하면, 유저들은 주식, 채권, 상품, 통화와 관련한 방대한 데이터에 접근할 수 있으며, 해당 데이터를 단순히 검색하는 것을 넘어서, 분석하고 도표화하는 것 등 또한 가능합니다. 터미널에 각종 뉴스와 데이터가 너무 많아서, 대부분의 고객이 블룸버그가 지원하는 기능 중 아주 극소수만 활용한다는 것은 블룸버그의 고질적인 문제로 여겨지기까지 합니다. 특히나 비교적 최근까지도 터미널을 사용하기 위해 유저들은 세자리 혹은 네자리의 코드를 암기해야했는데요. 관련 기사를 작성한 포츈지의 기자의 경우, 블룸버그에서 2011년 일하던 당시, 터미널의 기본 사용법을 배우기 위해 일주일 내내 훈련을 받았다고 합니다. 


이러한 고가의 전용 단말을 제공하며 공고한 자리를 구축해 온 블룸버그를 디스럽트하기 위해 금융 데이터 시장을 공략하는 테크 스타트업의 등장을 보고서로 전해드린 바 있기도 합니다. 


'블룸버그 킬러'를 노리는 테크 스타트업 분석 보고서 목차

출처: 로아인텔리전스



어려운 블룸버그 터미널, NLP로 더욱 쉽게


40년 전인 1981년 설립 당시 종이로 제공되어 불편함을 초래하던 금융 데이터를 기술로 혁신하고자 했던 블룸버그의 노력은 현재도 진행되고 있습니다. 복잡한 사용법으로 인해 일부 기능만 겨우 활용되는 등 앞서 언급한 문제점을 해결하기 위해 블룸버그는 지난 몇 년간 NLP(자연어처리) 기술을 적극적으로 활용해 나가고 있습니다,  결과적으로 고객들이 블룸버그 터미널 내 정보를 찾는 방식을 크게 변화시킨 것으로 평가되고 있는데요. 블룸버그의 성공적인 NLP 도입 사례는, NLP를 활용하여 고객들과 소통하는 방식을 바꾸고자 하는 다른 기업들이 눈여겨 볼 만 합니다. (자연어처리 기법을 도입 중인 로아에서도 가장 주목해봐야 할 내용이기도 합니다.)


블룸버그 터미널의 자동완성 기능

출처: 블룸버그


먼저, 블룸버그는 NLP를 터미널 검색창에 적극적으로 도입함으로써, 자사 유저들이 더 이상 어려운 코드를 암기하지 않고도 원하는 금융 데이터에 쉽게 접근할 수 있도록 했습니다. 가령 문장 형식으로 검색창에 입력함으로써, 유저들은 원하는 정보에 쉽게 접근할 수 있는데요. 예를들어 "수익률은 4% 이상이고, BBB 이상의 등급에, 2025년 전에 만기되는 모든 미국 회사채"라든지, "애플(Apple)의 5대 주주" 등으로 검색을 하는 것이 가능해 졌습니다. 과거에는 이와 같은 정보를 찾기 위해 여러 단계를 거쳐 시간이 소요되었다면, 이제는 마치 구글의 검색창에서 검색하는 것과 유사해진 것인데요. 자동완성 기능을 제공하기 시작하면서 부터는, 유저들이 스스로 인식하지 못했던 분석 혹은 그래프 옵션 등을 발견할 수 있도록 합니다. 



고객 서비스팀의 업무 강도를 줄여주는 NLP


NLP 기술은 단순히 유저들이 정보를 찾는 방식만 바꾼 것이 아닙니다. 블룸버그의 경우 보유하고 있는 데이터의 양이 방대할뿐만 아니라, 전세계 각지의 금융기관들이 시간을 가리지 않고 보내오는 질문 데이터의 양도 엄청난데요. NLP를 통해 블룸버그는 고객 서비스 팀의 업무 강도는 줄이면서, 더욱 긴급한 요구사항에 재빠르게 응답할 수 있게 되었습니다.


블룸버그 터미널의 AI기반 질문-답변 챗봇 관련 리서치 사례

출처: 블룸버그


먼저 인공지능은 고객 질문의 우선순위를 구분해, CS팀 담당자에게 분배할 것인지 인공지능이 해결할 것인지를 분류합니다. 이후, 간단한 질문사항은 인공지능 챗봇에게 전달되는데요. 인공지능 기반의 "질문-답변" 서비스는 현재 고객들의 질문 50%를 해결하고 있으며, 인공지능이 고객에게 제안하는 답안은 실제 고객 서비스팀의 응답과 3분의 1의 경우에 일치한다고 합니다. 



필요에 맞게 조합한 모듈식의 언어 모델


대부분의 업체와 마찬가지로, 블룸버그 또한 GPT-3와 같은 초대형 언어 모델(Ultra-large language model)을 사용할 것이라 추측하기 쉽습니다. 하지만, 블룸버그의 퀀트 테크 전략 책임자인 카잔체프는 블룸버그의 질문-답변 언어모델은 초대형 언어 모델 하나를 기반으로 한 것이 아니라고 설명합니다. 


대신 서로 다른 여러 개의 구성요소를 결험한 모듈식 시스템이라고 하는데요. 가령 유저들이 사용하고자 하는 기능을 예측하는 데에 있어서는 '쿼리 의도 모델(query intent model)'을, '문장 내 언어간의 관계를 파악하는 데에는 의미론 구문 해석 알고리즘(semantic parser)'을 활용하는 방식이라고 합니다. 또한 의미론 구문 해석 알고리즘을 역방향으로 구동하는 모듈을 통해서, 자동완성 추천 기능을 구현한다고 합니다. 


듀오링고(Duolingo)의 GPT-3 사용 예시

출처: 오픈 AI


오픈 AI(OpenAI)가 개발한 GPT-3와 같은 초대형 언어모델을 사용하지 않는 이유에 대해서는 블룸버그 측은 '시간'을 꼽습니다. 1,000억 개가 넘는 변수를 활용하는 초대형 언어 모델의 경우, 각각의 쿼리를 실행하는 데에 너무 많은 시간이 소요되기 때문인데요. 밀리초 단위로 답을 빠르게 생성해야하는 블룸버그에게 초대형 언어모델에 따른 '몇 초'는 너무 긴 시간인 것입니다. 카잔체프는 연구적 관점에서 자신 또한 초대형 언어모델이 매우 흥미롭지만, 자사의 비즈니스 측면에 있어서는 실용적이지 않다고 설명합니다. 



빠른 데이터 처리와 언어모델을 감당할 수 있는 스토리지 확보


한편, 인공지능 모델을 도입하고, 더욱 많은 데이터를 처리하게 될 수록, 블룸버그는 점점 더 방대한 데이터를 처리할 수 있는 시스템을 필요로 했습니다. 블룸버그 CTO 숀 에드워드는 "엄격성과 극도의 정확성을 유지하면서, 매우 짧은 순간에 엄청난 양의 데이터를 처리해야하는 기업은 극소수"라고 설명하기도 하고 있습니다. 


티커 플랜트(Ticker Plant)는 모든 금융 데이터를 수집 및 처리하여, 블룸버그의 채널로 내보내는 블룸버그의 소프트웨어 및 하드웨어를 의미하는데요. 블룸버그는 80년대에는 채권 가격을 저장하기 위해서 토트란으로 쓰여진 티커 플랜트를 활용했으나, 2010년에 들어서는 대규모 시계열 데이터셋을 지원하기 위해 구축된 고성능의 자체 데이터 저장소를 도입했다고 합니다. 현재 스토리지 엔진은 수 페타바이트의 데이터를 보유할 수 있으며, 쿼리 엔진은 매일 약 800억 개에 달하는 쿼리를 처리할 수 있게되었습니다. 



나가며,

 

블룸버그의 사례는 NLP의 혁명이 비즈니스에 있어서도 실질적이고, 변화무쌍하게 활용될 수 있다는 것을 재차 증명합니다. 고객들 또한 복잡한 코드나, 드롭다운 메뉴와 같은 방식 보다는 자연어를 활용해서 기술을 활용하는 것을 선호하는데요. 포츈은 블룸버그와 같은 모듈형 방식의 언어모델이 대부분의 기업에게 더욱 보편적인 방법일 것이라고 전했습니다. 


한편, 블룸버그 애플리케이션 프레임워크의 대표를 맡고 있는 폴 윌리엄은 터미널의 미래가 단순히 스크린에 한정되지 않는다고 설명합니다. 음성 인식을 통해서 터미널이 작동할 수도 있고, AR을 통해 고객들이 정보를 확인하게 될 수도 있다고 설명하는데요. 지금도 블룸버그 홈페이지에는 AI, NLP와 관련된 수많은 연구 논문이 발행되는 것을 확인할 수 있습니다. 금융 데이터 플랫폼 선두주자로서 최신기술을 빠르게 도입하는 블룸버그가 앞으로는 어떠한 방식으로 고객들에게 정보를 전달할지 기대가 됩니다. 

블룸버그가 금융 데이터 플랫폼에 NLP를 활용하는 방법

블룸버그를 생각하면, 케이블 TV와 라디오 채널을 포함한 뉴스서비스, 혹은 웹사이트와 같은 서비스들을 떠올리곤 합니다. 하지만, 블룸버그는 대부분의 매출을 금융 데이터 플랫폼인 블룸버그 터미널을 통해 거두어들이고 있습니다. 한화로 1조 원이 넘는 블룸버그의 매출 중 80% 가까이가 터미널 제공을 통해 발생하는 것으로 알려지고 있기도 합니다. 국내에서도 블룸버그 터미널을 사용하는 기업들 사이에서는 '블대리'라는 별명으로 불리며, 대리급 연봉에 맞먹는 사용 요금을 부과하는 것으로 알려져 왔습니다.


물론 과거에는 금융 기관들을 대상으로 실시간 금융 데이터들을 확인할 수 있는 하드웨어 기기를 판매하는 형태에 집중했다면, 최근에는 쉽게 방대한 데이터에 접근할 수 있는 소프트웨어 패키지를 판매하고 있습니다. 


최초의 블룸버그 터미널

출처: 블룸버그 유튜브 채널


블룸버그 터미널을 구독하면, 유저들은 주식, 채권, 상품, 통화와 관련한 방대한 데이터에 접근할 수 있으며, 해당 데이터를 단순히 검색하는 것을 넘어서, 분석하고 도표화하는 것 등 또한 가능합니다. 터미널에 각종 뉴스와 데이터가 너무 많아서, 대부분의 고객이 블룸버그가 지원하는 기능 중 아주 극소수만 활용한다는 것은 블룸버그의 고질적인 문제로 여겨지기까지 합니다. 특히나 비교적 최근까지도 터미널을 사용하기 위해 유저들은 세자리 혹은 네자리의 코드를 암기해야했는데요. 관련 기사를 작성한 포츈지의 기자의 경우, 블룸버그에서 2011년 일하던 당시, 터미널의 기본 사용법을 배우기 위해 일주일 내내 훈련을 받았다고 합니다. 


이러한 고가의 전용 단말을 제공하며 공고한 자리를 구축해 온 블룸버그를 디스럽트하기 위해 금융 데이터 시장을 공략하는 테크 스타트업의 등장을 보고서로 전해드린 바 있기도 합니다. 


'블룸버그 킬러'를 노리는 테크 스타트업 분석 보고서 목차

출처: 로아인텔리전스



어려운 블룸버그 터미널, NLP로 더욱 쉽게


40년 전인 1981년 설립 당시 종이로 제공되어 불편함을 초래하던 금융 데이터를 기술로 혁신하고자 했던 블룸버그의 노력은 현재도 진행되고 있습니다. 복잡한 사용법으로 인해 일부 기능만 겨우 활용되는 등 앞서 언급한 문제점을 해결하기 위해 블룸버그는 지난 몇 년간 NLP(자연어처리) 기술을 적극적으로 활용해 나가고 있습니다,  결과적으로 고객들이 블룸버그 터미널 내 정보를 찾는 방식을 크게 변화시킨 것으로 평가되고 있는데요. 블룸버그의 성공적인 NLP 도입 사례는, NLP를 활용하여 고객들과 소통하는 방식을 바꾸고자 하는 다른 기업들이 눈여겨 볼 만 합니다. (자연어처리 기법을 도입 중인 로아에서도 가장 주목해봐야 할 내용이기도 합니다.)


블룸버그 터미널의 자동완성 기능

출처: 블룸버그


먼저, 블룸버그는 NLP를 터미널 검색창에 적극적으로 도입함으로써, 자사 유저들이 더 이상 어려운 코드를 암기하지 않고도 원하는 금융 데이터에 쉽게 접근할 수 있도록 했습니다. 가령 문장 형식으로 검색창에 입력함으로써, 유저들은 원하는 정보에 쉽게 접근할 수 있는데요. 예를들어 "수익률은 4% 이상이고, BBB 이상의 등급에, 2025년 전에 만기되는 모든 미국 회사채"라든지, "애플(Apple)의 5대 주주" 등으로 검색을 하는 것이 가능해 졌습니다. 과거에는 이와 같은 정보를 찾기 위해 여러 단계를 거쳐 시간이 소요되었다면, 이제는 마치 구글의 검색창에서 검색하는 것과 유사해진 것인데요. 자동완성 기능을 제공하기 시작하면서 부터는, 유저들이 스스로 인식하지 못했던 분석 혹은 그래프 옵션 등을 발견할 수 있도록 합니다. 



고객 서비스팀의 업무 강도를 줄여주는 NLP


NLP 기술은 단순히 유저들이 정보를 찾는 방식만 바꾼 것이 아닙니다. 블룸버그의 경우 보유하고 있는 데이터의 양이 방대할뿐만 아니라, 전세계 각지의 금융기관들이 시간을 가리지 않고 보내오는 질문 데이터의 양도 엄청난데요. NLP를 통해 블룸버그는 고객 서비스 팀의 업무 강도는 줄이면서, 더욱 긴급한 요구사항에 재빠르게 응답할 수 있게 되었습니다.


블룸버그 터미널의 AI기반 질문-답변 챗봇 관련 리서치 사례

출처: 블룸버그


먼저 인공지능은 고객 질문의 우선순위를 구분해, CS팀 담당자에게 분배할 것인지 인공지능이 해결할 것인지를 분류합니다. 이후, 간단한 질문사항은 인공지능 챗봇에게 전달되는데요. 인공지능 기반의 "질문-답변" 서비스는 현재 고객들의 질문 50%를 해결하고 있으며, 인공지능이 고객에게 제안하는 답안은 실제 고객 서비스팀의 응답과 3분의 1의 경우에 일치한다고 합니다. 



필요에 맞게 조합한 모듈식의 언어 모델


대부분의 업체와 마찬가지로, 블룸버그 또한 GPT-3와 같은 초대형 언어 모델(Ultra-large language model)을 사용할 것이라 추측하기 쉽습니다. 하지만, 블룸버그의 퀀트 테크 전략 책임자인 카잔체프는 블룸버그의 질문-답변 언어모델은 초대형 언어 모델 하나를 기반으로 한 것이 아니라고 설명합니다. 


대신 서로 다른 여러 개의 구성요소를 결험한 모듈식 시스템이라고 하는데요. 가령 유저들이 사용하고자 하는 기능을 예측하는 데에 있어서는 '쿼리 의도 모델(query intent model)'을, '문장 내 언어간의 관계를 파악하는 데에는 의미론 구문 해석 알고리즘(semantic parser)'을 활용하는 방식이라고 합니다. 또한 의미론 구문 해석 알고리즘을 역방향으로 구동하는 모듈을 통해서, 자동완성 추천 기능을 구현한다고 합니다. 


듀오링고(Duolingo)의 GPT-3 사용 예시

출처: 오픈 AI


오픈 AI(OpenAI)가 개발한 GPT-3와 같은 초대형 언어모델을 사용하지 않는 이유에 대해서는 블룸버그 측은 '시간'을 꼽습니다. 1,000억 개가 넘는 변수를 활용하는 초대형 언어 모델의 경우, 각각의 쿼리를 실행하는 데에 너무 많은 시간이 소요되기 때문인데요. 밀리초 단위로 답을 빠르게 생성해야하는 블룸버그에게 초대형 언어모델에 따른 '몇 초'는 너무 긴 시간인 것입니다. 카잔체프는 연구적 관점에서 자신 또한 초대형 언어모델이 매우 흥미롭지만, 자사의 비즈니스 측면에 있어서는 실용적이지 않다고 설명합니다. 



빠른 데이터 처리와 언어모델을 감당할 수 있는 스토리지 확보


한편, 인공지능 모델을 도입하고, 더욱 많은 데이터를 처리하게 될 수록, 블룸버그는 점점 더 방대한 데이터를 처리할 수 있는 시스템을 필요로 했습니다. 블룸버그 CTO 숀 에드워드는 "엄격성과 극도의 정확성을 유지하면서, 매우 짧은 순간에 엄청난 양의 데이터를 처리해야하는 기업은 극소수"라고 설명하기도 하고 있습니다. 


티커 플랜트(Ticker Plant)는 모든 금융 데이터를 수집 및 처리하여, 블룸버그의 채널로 내보내는 블룸버그의 소프트웨어 및 하드웨어를 의미하는데요. 블룸버그는 80년대에는 채권 가격을 저장하기 위해서 토트란으로 쓰여진 티커 플랜트를 활용했으나, 2010년에 들어서는 대규모 시계열 데이터셋을 지원하기 위해 구축된 고성능의 자체 데이터 저장소를 도입했다고 합니다. 현재 스토리지 엔진은 수 페타바이트의 데이터를 보유할 수 있으며, 쿼리 엔진은 매일 약 800억 개에 달하는 쿼리를 처리할 수 있게되었습니다. 



나가며,

 

블룸버그의 사례는 NLP의 혁명이 비즈니스에 있어서도 실질적이고, 변화무쌍하게 활용될 수 있다는 것을 재차 증명합니다. 고객들 또한 복잡한 코드나, 드롭다운 메뉴와 같은 방식 보다는 자연어를 활용해서 기술을 활용하는 것을 선호하는데요. 포츈은 블룸버그와 같은 모듈형 방식의 언어모델이 대부분의 기업에게 더욱 보편적인 방법일 것이라고 전했습니다. 


한편, 블룸버그 애플리케이션 프레임워크의 대표를 맡고 있는 폴 윌리엄은 터미널의 미래가 단순히 스크린에 한정되지 않는다고 설명합니다. 음성 인식을 통해서 터미널이 작동할 수도 있고, AR을 통해 고객들이 정보를 확인하게 될 수도 있다고 설명하는데요. 지금도 블룸버그 홈페이지에는 AI, NLP와 관련된 수많은 연구 논문이 발행되는 것을 확인할 수 있습니다. 금융 데이터 플랫폼 선두주자로서 최신기술을 빠르게 도입하는 블룸버그가 앞으로는 어떠한 방식으로 고객들에게 정보를 전달할지 기대가 됩니다.