스타트업얼라이언스-국회 스타트업 지원단체 유니콘팜 'AI 대전환의 동력, 데이터 활용 입법 개선 과제' 정책 토론회 열어

GPU 없고, 데이터도 못 써... AI 경쟁력, 삽 없는 금광 파는 격

스타트업얼라이언스는 국회 스타트업 지원단체 유니콘팜과 함께 26일 국회의원회관 제6간담회의실에서 'AI 대전환의 동력, 데이터 활용 입법 개선 과제'정책 토론회를 개최했다.이번 토론회는 스타트업얼라이언스가 국내 AI 기업 101곳을 대상으로 실시한 설문조사에서 ‘개인정보 보호법’과 ‘저작권 규제’가 AI 비즈니스에 가장 부담되는 데이터 관련 규제로 지목된 데에서 출발해, 현행 법·제도의 구조적 한계를 짚고 실질적인 입법 대안을 모색하고자 마련됐다.이번 행사를 주최한 유니콘팜 공동대표 김한규 더불어민주당 의원은 “유니콘팜을 통해 만난 많은 스타트업 대표들이 데이터 활용 제약과 법적 불확실성을 가장 큰 난관으로 꼽고 있다”며, “오늘 논의를 바탕으로 AI 스타트업이 기술 혁신과 성장에 집중할 수 있는 제도적 환경을 마련하는 데 국회에서도 최선을 다하겠다”고 밝혔다.이어 유니콘팜 공동대표 배현진 국민의힘 의원은 "우리 국민들은 개인정보 보안에 대해 특별히 높은 이해도와 관심을 가지고 있다"면서 "우리 AI 산업 발전을 위해서는 규제 완화가 꼭 필요한 만큼, 국회가 선도적인 입법을 통해 국민들을 안심시켜드리기 위한 노력을 해나가야 할 것"이라고 강조했다.토론회를 주관한 이기대 스타트업얼라이언스 센터장은 “트웰브랩스, 업스테이지 등 국내 대표 AI 스타트업들이 미국에 본사를 두거나 미국 투자 유치에 집중하고 있으며, 많은 후배 창업자들 역시 해외 이전을 진지하게 고민하고 있다”고 말했다.이어 “최근 스타트업얼라이언스 설문조사에서도, 학습 데이터 수집 단계부터 민형사상 책임을 우려하는 기업이 많았다”며 “이처럼 불확실한 법·제도 환경에서는 AI 스타트업이 성장하기 어렵다. 미래 산업의 주역들이 국내에 뿌리내릴 수 있도록 입법 기반 마련이 시급하다”고 강조했다.기조 발제를 맡은 방성현 김앤장 법률사무소 변호사는 ‘AI 시대, 데이터 활용의 법적 한계와 개선 과제’를 주제로 발표하며, 현행 개인정보 보호법과 저작권법이 기술 발전 속도를 따라가지 못한 채 산업 성장의 발목을 잡고 있다고 지적했다.우선 그는 개인정보 보호법의 ‘동의 중심 체계’에 대해 “형식적 동의만으로는 정보주체의 실질적 권리를 보호할 수 없고, AI가 요구하는 대규모·비정형 데이터 활용에도 부합하지 않는다”며, “신규 서비스나 예측 불가능한 활용에는 사실상 ‘하지 말라’는 메시지로 작용한다”고 우려했다.또한 개인정보 보호법상 ‘정당한 이익’ 조항이 있음에도 “EU보다 훨씬 엄격한 ‘정보주체 이익보다 명백히 우선’ 요건이 있어 실무에서는 활용이 어렵다”고 지적하며, “해석 기준을 명확히 하고 사전 판단이 가능한 사례를 축적해야 한다”고 강조했다.저작권법과 관련해서도 그는 “AI 기술은 본질적으로 대규모 데이터를 분석·학습하는 과정인데, 현행 저작권법은 이에 대한 명확한 예외 규정이 없다”며, “아시아 주요국들이 AI 학습 목적의 텍스트·데이터마이닝(TDM) 예외를 입법화하는 가운데, 한국은 규제 불확실성으로 산업 속도만 뒤처지고 있다”고 말했다.이어 “비상업적 이용 한정, 옵트아웃(opt-out) 방식, 합법적 접근에 따른 학습 허용 등 다양한 입법 모델이 제시되고 있는 만큼, 사회적 합의를 바탕으로 균형 있는 방향을 신속히 선택해야 한다”고 강조했다.이어진 종합토론에서는 김민호 성균관대 법학전문대학원 교수가 좌장을 맡아, AI 시대 데이터 활용을 위한 법 제도 개선을 주제로 산·학·정·법조계 전문가들의 심도 있는 논의가 이어졌다.토론을 시작하면서 김 교수는 “AI 산업에서의 데이터 활용은 이제 선택이 아니라 생존의 문제”라며, “GPU도 없고, 데이터도 자유롭게 못 쓰는 상황에서 AI 경쟁력을 논하는 것은 삽도 없이 금광을 파겠다는 격”이라고 지적했다. 그는 “EU는 아직 AI법 시행도 하지 않았고, 미국은 개인정보·저작권 관련 면책 구조가 있는 반면, 우리는 학습 기반조차 제대로 갖추지 못한 상태에서 전 세계 최초로 규제부터 시행하려 한다”고 우려를 표했다. 특히 “AI 시대 데이터 학습을 가로막는 두 개의 장애물은 저작권법과 개인정보 보호법”이라며 “저작권은 기술적 해석과 입법을 통해 해결의 실마리가 보이지만, 개인정보는 이미 정치화·이념화돼 있어 논리로 해결하기 어려운 지경”이라고 분석했다. 이어 “AI 산업 기반을 제대로 마련하려면 정치적 논쟁을 넘어 실질적인 법제 개선에 착수해야 할 때”라고 강조했다.이어 산업계 현장의 목소리도 이어졌다. 신재민 트릴리온랩스 대표는 “웹에 공개된 대규모 데이터를 수집해 LLM을 학습시키는 과정에서 개인정보 필터링으로 전체의 절반 이상을 폐기해야 하는 실정”이라며, “수억 건의 데이터에 대해 일일이 동의를 받는 것은 사실상 불가능한데, 현행 개인정보 보호법은 이를 전제로 하고 있어 AI 학습 자체가 어려운 구조”라고 지적했다.특히 “LLM 학습은 사람처럼 자연스러운 언어를 기반으로 이루어져야 하는데, 필터링이나 대체 데이터 방식은 오히려 품질을 떨어뜨리고 학습 효과에도 한계가 있다”며, “현실을 반영한 유연한 개인정보 활용 기준이 절실하다”고 강조했다.정일권 두들린 CISO/CPO 역시 “AI 학습에 필요한 이력서·자소서·면접 정보는 개인정보, 저작권, 기업 영업비밀 등이 모두 얽혀 있어 동의 확보부터 시작 단계에서 막히는 경우가 많다”며, “지원자에게 직접 AI 학습 목적을 고지하고 동의를 받는 것도 어렵고, 수탁자의 위치에서는 더더욱 법적 책임이 불분명하다”고 설명했다.그는 “기술적으로도 이력서나 면접 평가 데이터를 일일이 태깅하고 필터링하는 데 막대한 시간과 비용이 들기 때문에 스타트업으로서는 사실상 감당이 어렵다”고 토로했다.또 “해외 AI 기업들은 공개 웹 데이터와 SNS를 활용해 학습 모델을 고도화하고 있지만, 국내 기업들은 규제 장벽으로 시작조차 못하는 경우가 많다”며, “지금과 같은 환경에서는 GPU보다 법제도가 정비돼야 한다”고 덧붙였다.김현경 서울과기대 IT정책전문대학원 교수는 “AI 학습의 입력(Input) 단계에서까지 개인정보 보호법을 일률적으로 적용하는 것은 과도하다”며 “해당 단계는 특정 개인을 식별하려는 목적이 아닌 만큼, 보다 유연한 법 적용이 필요하다”고 강조했다.이어 “EU 조차도 최근 ‘디지털 옴니버스 패키지’를 통해 비식별 정보 정의를 완화하고 민감정보 데이터 셋의 활용 가능성을 여는 등 규제 전환을 시도하고 있다”고 설명했다.또한 “AI 학습에 활용되는 저작물에 대해 어떤 기준으로 규제할 것인지에 대한 법적 해석이 여전히 불명확하다”며 “EU는 AI의 투명성을 요구하면서도, 모든 학습 데이터를 목록화해 공개하라는 요구는 비현실적이라는 점을 인정하고 간략한 요약 제공 방식으로 방향을 조정했다”고 소개했다.그는 “이미 글로벌 기업들은 학습을 마친 반면, 국내 기업은 법적 불확실성 속에서 시작조차 못하고 있는 상황”이라며 “입법자는 기술의 입력과 출력 단계를 구분해 규율하고, 국내 기업들에게 최소한의 시작선이라도 보장해야 한다”고 강조했다.김형진 국회입법조사처 입법조사관은 “현행 개인정보 보호법의 ‘정당한 이익’ 조항에서 ‘정보주체의 이익보다 명백히 우월할 것’이라는 요건은 실무상 데이터 활용을 어렵게 만드는 만큼 개정이 필요하다”고 강조했다.다만 “정당한 이익 요건 자체를 지나치게 구체화하면 오히려 입법의 경직성을 초래할 수 있다”며, “AI처럼 기술 환경이 빠르게 변화하는 분야에서는 일반조항 중심의 유연한 규율이 여전히 타당하다”고 설명했다. 이어 “법률의 불명확성은 가이드라인 등 행정적 연성규범을 통해 보완하는 것이 바람직하다”며, “기술 변화에 탄력적으로 대응할 수 있는 입법 설계가 필요하다”고 제언했다.한편, 이번 토론회의 내용은 스타트업얼라이언스의 공식 유튜브 채널에서 다시 볼 수 있으며, 토론회 자료집은 홈페이지에서 다운로드 받을 수 있다.강홍민 기자 khm@hankyung.com