법적 딜레마에 빠진 생성형 AI
컨텐츠 정보
- 4,736 조회
- 0 추천
- 0 비추천
- 목록
본문
개발자들이 마이크로소프트(MS)의 생성형 AI 서비스 중 하나인 '깃허브 코파일럿(GitHub Copilot)'을 상대로 제기한 소송이 법정에서 큰 타격을 입었다. 지난 7월 초에 공개된 캘리포니아 법원 판결에 따르면 판사는 개발자 그룹이 깃허브, 마이크로소프트, 오픈AI를 상대로 제기한 소송에서 대부분의 청구를 기각했다. 개발자들은 AI 기반의 깃허브 코파일럿이 개발자들의 코드를 무단으로 사용해 저작권법을 위반했다고 주장했다. 마이크로소프트는 깃허브의 소유주로서 오픈AI의 기술을 사용해 코파일럿을 운영하고 있다.
누가 어떻게 대가를 지불해야 할까
앞서 소개한 소송과 법원의 판결은 AI 기술 혁신과 저작권 보호 간의 복잡한 관계를 잘 보여준다. 생성형 AI는 텍스트, 이미지, 비디오, 오디오, 코드 등 다양한 콘텐츠를 자동으로 생성해 주는 기술로 주목받고 있다. 생성형 AI는 방대한 데이터를 학습하여 인간의 창작물과 구분하기 힘든 수준의 결과물을 만들어낸다. 그러나 이러한 혁신의 이면에는 저작권 보호 문제라는 법적 딜레마가 자리 잡고 있다.
생성형 AI가 학습하는 대량의 데이터는 대개 인터넷에 공개된 자료에서 수집된다. 예를 들어 깃허브는 개발자들을 위한 온라인 플랫폼으로 개발자들이 자신의 코드를 저장하고 관리할 수 있는 코드 저장소다. 이를 통해 코드의 변경 사항을 시간순으로 기록하고 관리할 수 있다. 또 여러 개발자가 같은 프로젝트에서 함께 작업하며 각자 작업한 내용을 쉽게 합칠 수 있고 서로의 코드를 검토할 수 있다.
깃허브 코파일럿은 깃허브 개발자들에게 코드 작성 보조 기능을 제공하는 생성형 AI 기반 프로그래밍 도구다. 코파일럿이 학습한 데이터는 주로 깃허브에 공개된 오픈소스 코드이다. 오픈소스는 누구나 자유롭게 사용할 수 있지만, 여전히 저작권이 있는 코드이다. 코파일럿이 원작자의 동의 없이 이를 활용하는 것은 저작권 침해의 소지가 있다.
깃허브 코파일럿을 둘러싼 소송은 이런 문제를 여실히 드러낸다. 일부 개발자들은 코파일럿이 자신들의 코드를 무단으로 사용했다면서 이를 AI가 학습하고 다른 사람에게 추천하는 것이 저작권 침해라고 주장했다. 법원은 이 소송에서 대부분의 청구를 기각했는데, 오픈소스 라이선스 위반과 계약 위반을 주장하는 두 가지 청구를 남겨둔 상태다.
생성형 AI와 관련된 매우 중요한 법적 쟁점 중 하나는 '공정 이용(Fair use)'이다. AI 학습을 위한 데이터 사용이 공정 이용에 해당하는지, 그리고 어디까지가 허용 가능한 범위인지에 대한 명확한 기준이 없어 앞으로 관련 소송이 끊이지 않을 것으로 보인다. 공정 이용은 저작권법에서 일정 조건하에 저작물을 권리자의 허락 없이 사용할 수 있도록 허용하는 법적 개념이다. 저작물의 제한적 사용을 허용함으로써 창작과 혁신을 장려하기 위한 것이다.
미국 저작권법에서는 교육, 연구, 비평, 뉴스 보도 등을 목적으로 한 콘텐츠 사용이 공정 이용에 해당할 수 있다. 법원은 공정 이용을 판단할 때 상업적 이용인지 비영리적 이용인지 여부, 저작물이 사실적 정보인지 창작물인지 여부, 전체 저작물 중 사용된 부분의 비율과 중요성, 이용이 저작물의 시장 가치나 잠재적 시장에 미치는 영향 등을 고려해 판단한다. 하지만 실제로 어떤 경우에 공정 이용이 인정되는지는 개별 사례마다 다르게 판단되고 있다. 한국의 경우 공정 이용의 개념 자체는 미국과 비슷하지만 미국만큼 잘 인정되지는 않는다.
그런데 가뜩이나 모호한 공정 이용의 적용 범위가 AI의 등장으로 인해 더욱 모호해졌다. AI가 학습을 위해 저작물을 '소비'하는 행위가 공정 이용에 해당하는지, 그리고 AI가 생성한 결과물을 원저작물의 2차적 저작물로 볼 수 있는지 등의 문제가 제기되고 있다. 이런 쟁점은 법적, 윤리적 딜레마를 야기한다. AI 개발사들은 기술 발전을 위해 광범위한 데이터 접근이 필요하며 이를 공정 이용이라고 주장하는 반면, 창작자들은 자신의 작품이 동의 없이 사용되는 것에 반발하고 있다. 이는 기술 혁신과 창작자 권리 보호 사이의 균형을 어떻게 맞출 것인가라는 근본적인 질문으로 이어진다.
상업적 이용에 뒤따르는 보상문제
더불어 AI가 생성한 콘텐츠의 상업적 이용도 중요한 쟁점이다. AI 생성 콘텐츠는 이미 다양한 산업 분야에서 활용되고 있으며 그 경제적 가치도 급속도로 커지고 있다. 예를 들어 AI가 생성한 이미지가 상업적으로 사용되거나, AI가 작곡한 음악이 광고에 사용되는 등의 사례가 늘어나고 있다. AI가 생성한 콘텐츠는 그 자체로 새로운 창작물로 간주될 수 있지만, 그 기저에는 수많은 원저작물의 데이터가 있다. AI가 학습한 데이터의 원저작자들에게 어떤 형태로든 보상이 이루어져야 하는지, 그리고 그 방식은 어떠해야 하는지에 대한 논의가 필요한 상황이다.
이 문제의 핵심은 AI 학습 과정에서 사용된 원저작물의 가치를 어떻게 평가하고, 그에 따른 보상을 어떻게 실현할 것인가에 달려 있다. 일부에서는 AI 학습에 사용된 모든 데이터의 원저작자에게 개별적으로 보상해야 한다고 주장한다. 그러나 이는 현실적으로 실현 가능한 수단이 아니다. AI 모델은 수억, 수십억 개의 데이터를 학습하는데 각각의 데이터가 최종 결과물에 미치는 영향을 정확히 측정하는 것은 불가능에 가깝기 때문이다. 다른 한편으로는 집단적 보상 체계를 구축해야 한다는 의견도 제기되고 있다. 예를 들어 AI 기업들이 수익의 일정 부분을 기금으로 조성하고, 이를 창작자 단체나 저작권 관리 기관을 통해 분배하는 방식이다. 이는 개별 보상의 어려움을 해결할 수 있는 대안이 될 수 있지만 공정한 분배 기준을 설정하는 것이 또 다른 과제로 남는다.
앞으로 AI 생성 콘텐츠의 저작권 귀속 문제도 깊이 있게 다뤄져야 한다. 현행 저작권법은 기본적으로 인간의 창작물을 보호하기 위해 고안되었기 때문에, AI가 독자적으로 생성한 콘텐츠의 저작권을 누구에게 부여할 것인지에 대한 명확한 기준이 없다. 이는 AI 생성 콘텐츠의 상업적 이용에 있어 법적 불확실성을 초래하며 산업 발전을 저해할 수 있는 요소로 작용한다. 이런 복잡한 상황 속에서 우리는 AI 기술의 발전을 저해하지 않으면서도 창작자들의 정당한 권리를 보호해야 하는, 양립하기 어려운 과제에 직면해 있다. 이 문제를 풀기 위해서는 반드시 기술과 산업에 대한 깊은 이해를 바탕으로 법적, 제도적 연구가 진행되어야 한다. 이에 대한 우리의 대응이 미래 세대의 창작 환경과 기술 혁신의 방향을 좌우할 수 있어서다.