Clubhouse(CH)의 스트리밍 기술 분석

Calmglow
5 min readFeb 4, 2021

드디어 나올 것이 나왔다. 클럽하우스 서비스의 데뷔와 성공은 나에게 자연스럽다. 언젠가는 나올 서비스였다. 리모트몬스터 식구들도 같은 생각이다. 리모트몬스터가 그동안 만난 수많은 고객사의 서비스와 해외 서비스 사례를 통해 확신하고 있는 미래는 다음과 같았다.

  1. VOD 콘텐츠 시장에서 더이상 혁신 서비스가 나오기는 어렵다. 유튜브와 넷플릭스등을 스타트업이 어떻게 이기나? 시장 파괴는 라이브 스트리밍에서 나온다.
  2. 영상 라이브만 시장이 있는 것은 아니다. Audio 라이브 스트리밍 시장이 별도로 존재한다. 둘은 꽤나 다른 시장을 형성한다.
  3. 화상회의도 아닌 방송도 아닌 하이브리드형 라이브 스트리밍 서비스가 탄생할 것이다.

이번 포스트에서는 하이브리드형 라이브 스트리밍 서비스를 주제로 CH를 다뤄볼까 한다.

CH는 어떻게 이 스트리밍 인프라를 개발했나?

제한된 인력(십여명 정도의 개발자 인력)으로 어떻게 이런 전세계적인 서비스를 만들 수 있었을까? 일단 CH는 당연하게도 WebRTC를 이용해 개발되었다. 또한 중국계 CPaaS회사인 Agora.io 플랫폼을 이용하였다. CPaaS는 1:1통화, 1:N방송, N:N 화상회의 같은 서비스를 구현하기 위한 라이브스트리밍 SDK/API와 클라우드인프라를 제공한다. 미국에는 agora.io, twilio가 있고 한국에는 RemoteMonster 가 있다. 라이브스트리밍 인프라 개발자는 매우 귀하기 때문에 일반적으로 이런 CPaaS회사 도움없이 단기간에 라이브스트리밍 서비스를 개발하는 것은 매우 어렵다.

CH는 기술적으로 무엇이 다른가?

보통 라이브스트리밍 서비스는 1:N이거나 N:N 형태가 대부분이다. 때문에 대부분의 CPaaS는 1:1, 1:N, N:N형태의 API만을 제공한다. 하지만 CH는 N:N과 1:N을 수시로 넘나든다.

물론 RemoteMonster도 그렇고 Agora도 N:N용 API에서 1:N을 위한 수신만 하는 음성 채널을 뽑을 수는 있다. 하지만 엄밀하게 말하면 N:N을 위한 미디어서버의 구성도와 1:N을 위한 미디어서버 구성은 차이가 있다. 1:N은 말그대로 한 방에 몇천명, 몇만명이 접속하더라도 버틸 수 있는 능력이 중요하기에 origin/edge구조의 hierachy한 구성을 가지는데, N:N은 가급적 hierachy한 구조를 지양하는 게 복잡도를 줄일 수 있다.

아무튼 CH는 agora의 N:N용 API를 이용하여 서비스를 구현한 것으로 보이고, 그래서 한 방에 동접자가 몇백명만 넘어도 스트리밍이 불안해진다. 웬지 미국 현지라고해서 이 불안정성이 크게 다를 것이라고 생각하진 않는다.

일단은 급하게 agora를 썼지만 CH만을 위한 스트리밍 인프라 아키텍처는 그들이 직접 개발하지 않는 한 한동안 CH의 성장의 가장 큰 걸림돌은 이 agora와의 협업이 되지 않을까 싶다.

Audio 품질

N:N구조의 경우 기본적으로 voice에 특화되어 튜닝되어 있다. 실제로 CH의 방송을 들어보면 전형적인 WebRTC 의 audio 품질이다. 음악을 방송했을 때의 품질은 사실 스푼라디오등에 비하여 매우 조악한 수준이다. 음악 송출시에 AGC, AEC, NS등에 대한 처리를 자체적으로 하고있는지 의문이다. 나도 말이야 쉽게 하지 WebRTC에서 이러한 처리를 하는 게 쉬운 일은 아니다. 앞으로 CH가 해결해가야할 MediaEngine쪽에서의 튜닝 작업이 매우 급하다는 생각이 든다.

역시 기술이 중요한게 아니야

CH는 사실 라이브스트리밍 경험이 별로 없는 것 같다. 하지만 그들은 적절한 CPaaS를 선택했고 최단 시간에 최고의 UX와 비즈니스 모델 및 마케팅으로 승리했다. 역시 기술은 거들 뿐 중요한 건 콘텐츠

이틀사이에 RemoteMonster 고객가입자 폭증

CH의 영향인가? 단 이틀 사이에 평소의 3–4배의 가입문의가 들어온다. 근데.. 이게 1:1이나 1:N처럼 단순한 스트리밍 방식이 아니다. CPaaS가 있어도 CH스타일의 서비스는 결코 금방 개발할 수가 없다. 리모트몬스터도 일반적인 스트리밍 서비스에 비하여 이러한 고객사에는 기술지원이 몇 배로 들어간다. ㅜㅜ 사실 우리도 자체 서비스만들 때 역시 엄청 고생한다.

하이브리드 실시간스트리밍 서비스는 계속 나올 것이다

CH는 N:N과 1:N을 결합한 재밌는 기술의 서비스인데, 코로나 이후에 국내에서도 심심찮게 자주 목격되는 방식이기도 하다. 리모트몬스터 고객사 중에도 일부 교육서비스에서 이러한 방식을 채택하고 있다. 아마 이러한 시도는 앞으로도 10년 이상 꾸준하게 시도될 것이다. 생각보다 아주 많은 조합이 가능하다.

1:N은 몇 명의 셀럽 콘텐츠에 너무 의존하는 서비스가 되고 N:N만으로는 팬덤형성에 어려움이 많다. 또 수익화를 위해서도 이 둘의 조합을 교묘하게 활용해야 한다고 본다. 때문에 앞으로도 이러한 형태의 서비스는 계속 늘어날 것이다.

--

--

Calmglow

최진호. WebRTC 전문기업 리모트몬스터 창업 후 Exit 후 유랑하고 있습니다.