[테크놀로지]
구글·아마존·MS 등 글로벌 IT 기업 중심 추진…‘데이터 해독·저장 기술 개발이 관건’
구글·아마존이 주목하는 차세대 테이터 저장 매체, 'DNA'
(사진) 마이크로소프트의 데이터센터 내부 모습. /한국경제신문

[한경비즈니스= 전승우 LG경제연구원 책임연구원] 콘텐츠의 폭증, 사물인터넷(IoT)과 인공지능(AI) 등 새로운 정보기술(IT)의 등장으로 데이터 저장이 IT 산업의 주요 이슈로 떠오르고 있다.

구글·아마존·페이스북 등 주요 글로벌 IT 기업을 중심으로 많은 데이터를 저장하기 위한 데이터센터가 건립되고 있다.

하지만 이들만으로는 데이터 증가 속도에 대응하기 어렵다는 전망이 나온다. 수많은 웹사이트는 물론 이미지와 동영상 등 용량이 큰 다양한 멀티미디어 생산이 폭발적으로 늘고 있다.

시장조사 기관 IDC는 2020년 이후 매년 전 세계에서 생산되는 데이터 규모가 44조 기가바이트(GB)를 넘을 것이라고 예상했다.

물론 자기테이프·하드디스크·플래시메모리 등 데이터 저장 매체 기술도 지속적으로 발전해 왔다.

하지만 이들 매체는 단위 부피에 저장할 수 있는 데이터의 양, 즉 데이터 저장 밀도를 꾸준히 높이기 어렵다. 지금까지는 첨단 미세 공정을 통해 더욱 높은 데이터 저장 밀도를 가진 반도체 등 저장 매체를 만들 수 있었지만 날이 갈수록 어려워지고 있기 때문이다.

또한 정보 압축 등 다양한 데이터 처리 기술 역시 저장 용량 증가에 도움을 줄 수 있지만 결국 한계에 도달할 것이라는 의견이 지배적이다. 그러므로 데이터를 저장할 수 있는 혁신 기술 개발이 근본적 해결 방안으로 부상하고 있다.

◆HDD보다 효율 1억 배 커

현재 전 세계적으로 더욱 높은 데이터 저장 밀도를 가질 수 있는 물질을 개발하려는 연구가 활발하게 진행되고 있다. 여러 후보가 거론되고 있는 가운데 최근에는 생명체의 유전자 정보를 보존하는 DNA를 사용해 데이터를 저장하는 DNA 스토리지 기술이 큰 관심을 끌고 있다.

DNA 스토리지의 원리는 간단하다. DNA는 아데닌(A)·구아닌(G)·시토신(C)·티민(T)이라는 4개의 염기를 가지고 있다. 이 염기들을 각기 다른 방식으로 조합해 0과 1의 디지털 데이터를 표현하는 것이다.

즉 특정 배열로 염기를 조작하는 DNA 합성 과정을 통해 수많은 데이터를 DNA에 기록하며 이후 DNA 판독 장치를 사용해 저장된 DNA 합성 구조를 해독해 데이터를 읽을 수 있다.

과학자들이 차세대 데이터 저장 매체로 DNA를 주목하는 가장 주된 이유는 지구상에 존재하는 그 어떤 물질보다 높은 데이터 저장 밀도를 가지고 있기 때문이다. DNA는 이론적으로 ㎟당 약 10억GB의 데이터를 저장할 수 있다.

이는 저장 매체로 광범위하게 사용되는 하드디스크의 1억 배 이상이다. 이런 DNA의 특성 때문에 1kg의 DNA만 있어도 전 세계 정보를 모두 저장할 수 있다.

또한 DNA는 매우 오랫동안 정보를 보존할 수 있다. 고대에 멸종된 동물의 유해에서 거의 완전한 형태의 DNA가 발견되는 사례가 종종 등장하듯이 DNA의 정보 저장 능력은 매우 뛰어나다.

대부분의 저장 매체 수명이 최대 수십 년 정도인 반면 DNA는 무려 수백에서 수천 년이 지나도 정보를 손상 없이 유지할 수 있다. DNA를 데이터 저장 매체로 활용하자는 아이디어는 비교적 오래전에 나왔다.

미국 하버드대 연구진은 1988년 35비트 크기의 간단한 그림을 DNA에 저장하는 실험을 선보였다. 하지만 DNA 처리 기술의 한계 등으로 이후의 발전은 더딘 수준이었다.

그러나 최근 빅데이터 저장 문제가 부각되면서 DNA 스토리지가 새롭게 재조명되고 있다. 또한 유전자 가위 등 한층 고도화된 DNA 분석 및 제어 기술의 등장 역시 DNA 스토리지 연구를 촉진하는 원동력이다.

현재 DNA 스토리지 연구는 학계를 중심으로 이뤄지고 있다. 조지 처치 하버드대 교수는 2012년 5만3000여 단어로 구성된 책을 DNA에 저장하는 실험에 성공했다.

이후 야니브 에를리치 미국 컬럼비아대 교수는 2016년 DNA 분수(DNA Fountain)라는 데이터 저장 기술을 이용해 컴퓨터 소프트웨어·영화·논문 등의 DNA 저장에 성공했다는 연구 성과를 발표했다.

최근 처치 교수는 동영상 데이터를 담은 DNA를 대장균에 주입해 번식시킨 후 다시 DNA를 추출해 저장된 동영상을 재생하는 실험을 선보였다.

유수의 IT 기업들도 DNA 스토리지에 큰 관심을 보이고 있다. 마이크로소프트(MS)는 워싱턴대와의 공동 연구를 통해 약 200메가바이트(MB)의 뮤직비디오를 DNA에 저장하는 기술을 개발했다고 발표했다.

MS는 DNA 생산 및 합성 기술을 가진 트위스트바이오사이언스(Twist Bioscience) 등 여러 스타트업과 협력하는 등 DNA 스토리지 기술 개발에 많은 관심을 보이고 있고 이른 시일 내에 상용화에 근접한 DNA 스토리지 기술을 선보일 수 있을 것이라고 주장한다.

DNA 스토리지의 잠재성은 충분하지만 이를 구현하기 위한 기술은 이제 첫걸음을 내디뎠을 뿐이다. 지금까지의 연구 성과는 아직까지는 실험실 수준으로, 단시간 내 상용화를 기대하기 어렵다는 지적이 많다.

많은 전문가들 역시 DNA 스토리지가 시장에 진입하기 위해서는 보다 많은 기술적 진전이 이뤄져야 한다고 말한다.

게다가 기술 개발이 완성돼도 이를 대량 양산하기 위해서는 보다 많은 노력이 필요하기 때문에 실제 DNA 스토리지의 등장은 예상보다 오랜 시간이 걸릴 수 있다.
구글·아마존이 주목하는 차세대 테이터 저장 매체, 'DNA'
◆상용화를 위한 난제도 많아

DNA 스토리지를 구현하기 위해서는 무엇보다 DNA를 효과적으로 합성할 수 있는 기술을 개발해야 한다. 각종 생명체의 DNA에 관한 연구는 비교적 풍부하게 이뤄진 반면 데이터 저장 및 해독에 필요한 기술은 초보 단계에 머물러 있다.

게다가 이를 위해서는 아직까지 복잡한 화학 공정을 적용할 수밖에 없기 때문에 충분한 경제성 확보도 어렵다. DNA 스토리지를 구현하기 위한 DNA 편집·복제·해독 등 일련의 과정을 자유롭게 처리하기 위해서는 보다 정교한 DNA 합성 기술이 뒷받침돼야 한다.

MS는 DNA에 데이터를 저장 및 해독하는 실험을 수행하기 위해 약 1300만 개 이상의 DNA 조각을 사용했다. MS는 이를 위해 약 80만 달러 이상을 투자했다. MS는 향후 DNA 스토리지 기술이 상용화되기 위해서는 DNA 합성 비용이 지금보다 1만 배 이상 낮은 수준으로 떨어져야 할 것이라고 예상한다.

DNA에 정보를 기록하고 읽는 속도 역시 지금보다 더욱 빨라져야 한다. 자유롭게 정보를 저장 및 검색할 수 있도록 지원하는 능력은 스토리지 기술의 필수 요건이다. 현재 DNA의 데이터 저장 속도는 초당 400바이트(Byte) 수준으로 알려져 있다.

이는 현재의 컴퓨터 환경에 적용하기에 턱없이 부족한 수준이다. 앞으로 DNA 스토리지를 개발하기 위해서는 더욱 빠른 속도로 데이터 입출력을 수행할 수 있는 기술을 확보해야 한다.

또한 DNA 스토리지와 기존 IT 기기와의 호환성도 중요하다. 현재 IT 시스템에서 적용되는 하드디스크나 플래시메모리 등과 달리 DNA 스토리지는 아직까지 데이터를 저장할 수 있는 가능성만 보여준 상황이다.

그러므로 다양한 하드웨어 및 소프트웨어가 DNA 스토리지와 효과적으로 연동될 수 있는지에 대한 심도 있는 연구도 계속돼야 한다.

하지만 이러한 제약에도 불구하고 더 많은 IT 기업들은 DNA 스토리지의 잠재성에 주목할 전망이다. 특히 클라우드 컴퓨팅이 IT 산업의 근간으로 자리 잡으면서 데이터 수용 능력을 지속적으로 발전시켜야 할 필요성이 더욱 커지고 있다.

구글·MS·아마존 등 유수의 IT 기업은 물론 클라우드 컴퓨팅을 기반으로 경쟁력을 강화하려는 여러 분야의 기업들도 DNA 스토리지 기술에 관심을 가질 가능성이 높다.

DNA 스토리지가 IT 산업의 새로운 DNA 활용을 혁신할 가능성도 있다. DNA 스토리지 기술과 한편으로 DNA 배열을 조작해 마치 중앙처리장치(CPU) 반도체처럼 프로그램을 처리할 수 있는 DNA 컴퓨터 기술을 개발하는 연구도 이뤄지고 있다.

정보를 분석하고 연산을 처리하는 컴퓨팅 기술은 단순한 데이터 저장보다 훨씬 어렵기 때문에 실제 구현까지는 더욱 오랜 시일이 걸릴 수 있다. 하지만 DNA 스토리지의 발전으로 DNA 처리 기술 수준을 끌어 올린다면 DNA 컴퓨터 개발 역시 한층 탄력을 받을 수 있다.

데이터는 21세기의 석유라는 주장처럼 전 세계 기업 및 정부 차원의 데이터 확보 및 활용 경쟁이 치열하게 전개되고 있다.

따라서 급증하는 데이터를 효과적으로 저장할 수 있는 기술 역시 해를 거듭할수록 핵심 과제로 강조될 것으로 판단된다. 과거와 달리 오늘날에는 DNA를 가공할 수 있는 바이오 및 각종 IT 하드웨어와 소프트웨어의 융·복합에 기반 한 합성생물학도 빠르게 발전하고 있다.

지속적인 연구·개발로 이어진다면 아직은 멀게만 느껴지는 DNA 스토리지 역시 문제 해결의 실마리를 제공할 수 있을 것으로 보인다.