우리는 바야흐로 인공지능(AI) 시대에 살고 있습니다. ChatGPT와 같은 대규모 언어 모델(Large Language Model, LLM)과 Midjourney, Stable Diffusion과 같은 확산 모델 등, 생성형 AI가 우리에게 주는 이로움은 말로 다 표현하기가 어렵습니다. 최근 OpenAI는 Sora라는 동영상 생성 AI 서비스를 공개하며 컴퓨터 비전 분야에서의 중대한 도전 과제였던 동영상 생성 기술까지 섭렵하였습니다. (https://openai.com/sora)
이러한 변화 속에서, 많은 기업에서 인공지능을 활용하여 서비스, 제품을 만들고 있으며, 이 과정에서 새로운 기술적 사상이 등장하기도 합니다. 저는 국내 대기업, 정출연의 AI 기술을 전문으로 권리화 업무를 다수 수행하였는데요, 이 칼럼에서는, AI 특허를 어떠한 자세로 바라보아야 하는지, 또 어떤 점을 권리화할 수 있고, 권리화하면 좋은지에 대한 이야기를 해보려 합니다.
1. 특허 출원일을 빠르게 확보하라!
기술분야 특성상 트렌드가 빠르게 변화하므로, 기술선점을 위한 조속한 특허출원이 필요합니다. Google의 경우, 논문 공개 전에 논문을 그대로 가출원하고, 법정기한인 1년 내에 논문을 가공하여 정식출원을 진행합니다. 지금은 AI 모델에서 필수적인 배치 정규화(Batch Normalization), 드롭-아웃(Drop-out) 기술이 그러했고, 심지어 GPT의 근간이 되는 트랜스포머(Transformer) 역시 그러했습니다. (Google의 특허들에 대해서는 이후 칼럼에서 자세히 소개하겠습니다.)
논문, 학회 등 외부 공개 전에 출원일을 확보하지 않았는데, 해당 기술이 인공지능의 핵심적인 기술이 되었다면 어떻게 될까요? 죽 쑤어 남 주는 꼴이 됩니다.
한국에서는 임시명세서라는 가출원 제도가 존재합니다. 공개할 계획이 없거나 공개까지 시일이 많이 남았다면 문제가 없겠지만, 논문, 학회 등에 공개해야 하는 시점이 임박했다면, 반드시 임시명세서 출원을 진행하여 안전하게 출원일 확보할 것을 권해드립니다. 임시명세서의 경우 정규 출원보다 저렴한 비용으로 빠르게 출원일을 확보할 수 있습니다. 다만, 등록 받기 위해서는 1년 내에 반드시 정규 출원을 진행해야 한다는 사실을 잊지 말아야 합니다.
2. 학습과 추론을 구분하라!
인공지능에서 학습과 추론은 매우 밀접한 관련이 있습니다. 학습 데이터를 이용해 특정 모델을 학습시키고, 학습된 모델을 이용하여 필요한 결과를 추론합니다. 즉, 인공지능에서 학습과 추론은 시간적으로 구분되는 개념입니다. 학습이 먼저 진행되고, 그 이후에 추론이 진행되죠. GAN의 discriminator와 같이 학습 모델과 추론 모델의 아키텍쳐가 일부 다른 경우도 존재합니다.
또한, 학습과 추론은 공간적으로도 구분되기도 합니다. 모델이 학습되는 장치와 추론되는 장치가 다른 것이죠. 학습에는 추론보다 훨씬 많은 연산량이 필요하기에, 학습 장치에는 추론 장치보다 좋은 하드웨어 성능을 기대합니다.
유사한 논리로, 모델을 학습하는 주체와, 모델을 이용하여 추론하는 주체는 구분될 수 있습니다. 통상적으로 모델은 Google, Samsung과 같은 AI 서비스 제공기업이 학습을 하고, 일반 사용자는 이렇게 학습된 모델을 이용하죠.
안타까운 점은, 인공지능 분야의 많은 특허 명세서들이 학습과 추론을 명확하게 구분짓지 못하고 있다는 점입니다. 특허에 있어서, 시간, 공간, 주체는 상당히 민감한 소재입니다. 이 중 하나라도 혼동된다면 특허는 무용지물이 될 수도 있습니다. 특허 청구범위 내에서 학습 동작과 추론 동작이 혼용되어 작성된, 참담한 경우를 가정해보겠습니다. 이 경우, 학습과 추론이 하나의 장치에서 동작하는 것으로 해석되어, 학습 장치와 추론 장치가 다른 경우 침해를 입증하기가 어려워집니다. 유사하게, 학습과 추론이 하나의 주체에 의해 동작하는 것으로 해석되어, 복수 주체가 해당 동작을 나누어 실시하는 경우 역시 침해를 입증하기가 곤란해지겠죠.
따라서, 모델의 내부 아키텍쳐나, 학습 데이터 처리(어그멘테이션 등), 학습 알고리즘 등에 기술적 특징이 있는 경우에는, 학습의 관점에서 청구항을 작성하는 것이 중요합니다. 이와 달리, 특정 서비스에서 인공지능 모델을 이용하는 경우에는, 입출력되는 데이터, 입력 데이터 전처리, 출력 데이터 후처리 등을 청구항에 기재하여 추론의 관점에서 청구항을 작성하는 것이 중요하겠습니다.
3. 인공지능의 분야를 세분화하라!
앞서 말한 것과 같이, 인공지능을 학습과 추론으로 구분할 수도 있겠지만, 이는 특허법적으로 올바른 권리범위를 확보하는 방법론입니다. 인공지능 기술은, 크게 데이터/아키텍쳐/모델 경량화 방법/학습 방법/연산 방법으로 나눌 수 있겠습니다.
먼저, 데이터는, 학습 데이터를 의미합니다. 학습 데이터를 라벨링하는 방법, 모델이 요구하는 스펙으로 입력 벡터의 차원으로 변환하는 방법, 학습 데이터를 어그멘테이션하는 방법 등이 이에 해당할 수 있습니다.
둘째로, 인공지능 모델의 아키텍쳐 자체에 기술적 특징이 존재하는 경우입니다. 완전히 새로운 아키텍쳐, 혹은 이미 제안된 아키텍쳐들 간 선택적 결합, 레이어 추가/생략, 레이어 입출력 데이터플로우 등이 있겠습니다. 예를 들어, 기존 seq2seq 개념과 Attention 기법을 결합하여 제안된 Google의 Transformer 모델에 대한 특허도 아키텍쳐에 기술적 특징이 있는 경우에 속하겠습니다.
셋째로, 모델 경량화에 기술적 특징이 존재하는 경우입니다. 모델의 파라미터 수가 많아지면서, 하드웨어가 감당해야 하는 연산량이 기하급수적으로 늘어나고 있습니다. 이를 해결하기 위한, 프루닝, 양자화, 지식 증류 등의 여러 경량화 기법이 이에 속하겠습니다.
넷째로, 학습 방법에 기술적 특징이 존재하는 경우입니다. 학습 데이터가 입력되어 가중치를 갱신하기까지, 기술적 특징이 있다면 이에 해당할 수 있습니다. 예를 들어, 배지 정규화, 드롭-아웃, 러닝레이트(learning rate) 스케줄링, 가중치 감소(decay) 등의 기법 등이 있습니다. 학습 과정에서 모델의 강건성/안정성/일반화 능력(오버피팅 방지)을 향상시키는 모든 방법이 이에 해당할 수 있습니다.
마지막으로, 연산 방법에 기술적 특징이 존재하는 경우입니다. 인공지능 하드웨어 가속기(NPU)와의 관계에서, 행렬 연산을 수행하는 방식에 기술적 특징이 있는 경우가 이에 해당합니다. 예를 들어, MAC 유닛의 데이터 처리 방식, 데이터의 자료형 변환 등이 이에 해당할 수 있겠습니다.
이외에도, 인공지능 모델의 동작, 기능, 구성과 관련하여 많은 세부 분야들이 도출될 수 있습니다. 하나의 인공지능 모델이더라도, 모델에 집약된 특징들을 세분화하여 권리화함으로써, 더 넓은 권리범위를 확보할 수 있겠습니다.
여기까지 인공지능 기술에서의 특허 전략을 소개해보았습니다. 인공지능 특허 등록 및 권리화 전략에 좋은 결과와 성과가 있길 기원하겠습니다.
우리는 바야흐로 인공지능(AI) 시대에 살고 있습니다. ChatGPT와 같은 대규모 언어 모델(Large Language Model, LLM)과 Midjourney, Stable Diffusion과 같은 확산 모델 등, 생성형 AI가 우리에게 주는 이로움은 말로 다 표현하기가 어렵습니다. 최근 OpenAI는 Sora라는 동영상 생성 AI 서비스를 공개하며 컴퓨터 비전 분야에서의 중대한 도전 과제였던 동영상 생성 기술까지 섭렵하였습니다. (https://openai.com/sora)
이러한 변화 속에서, 많은 기업에서 인공지능을 활용하여 서비스, 제품을 만들고 있으며, 이 과정에서 새로운 기술적 사상이 등장하기도 합니다. 저는 국내 대기업, 정출연의 AI 기술을 전문으로 권리화 업무를 다수 수행하였는데요, 이 칼럼에서는, AI 특허를 어떠한 자세로 바라보아야 하는지, 또 어떤 점을 권리화할 수 있고, 권리화하면 좋은지에 대한 이야기를 해보려 합니다.
1. 특허 출원일을 빠르게 확보하라!
기술분야 특성상 트렌드가 빠르게 변화하므로, 기술선점을 위한 조속한 특허출원이 필요합니다. Google의 경우, 논문 공개 전에 논문을 그대로 가출원하고, 법정기한인 1년 내에 논문을 가공하여 정식출원을 진행합니다. 지금은 AI 모델에서 필수적인 배치 정규화(Batch Normalization), 드롭-아웃(Drop-out) 기술이 그러했고, 심지어 GPT의 근간이 되는 트랜스포머(Transformer) 역시 그러했습니다. (Google의 특허들에 대해서는 이후 칼럼에서 자세히 소개하겠습니다.)
논문, 학회 등 외부 공개 전에 출원일을 확보하지 않았는데, 해당 기술이 인공지능의 핵심적인 기술이 되었다면 어떻게 될까요? 죽 쑤어 남 주는 꼴이 됩니다.
한국에서는 임시명세서라는 가출원 제도가 존재합니다. 공개할 계획이 없거나 공개까지 시일이 많이 남았다면 문제가 없겠지만, 논문, 학회 등에 공개해야 하는 시점이 임박했다면, 반드시 임시명세서 출원을 진행하여 안전하게 출원일 확보할 것을 권해드립니다. 임시명세서의 경우 정규 출원보다 저렴한 비용으로 빠르게 출원일을 확보할 수 있습니다. 다만, 등록 받기 위해서는 1년 내에 반드시 정규 출원을 진행해야 한다는 사실을 잊지 말아야 합니다.
2. 학습과 추론을 구분하라!
인공지능에서 학습과 추론은 매우 밀접한 관련이 있습니다. 학습 데이터를 이용해 특정 모델을 학습시키고, 학습된 모델을 이용하여 필요한 결과를 추론합니다. 즉, 인공지능에서 학습과 추론은 시간적으로 구분되는 개념입니다. 학습이 먼저 진행되고, 그 이후에 추론이 진행되죠. GAN의 discriminator와 같이 학습 모델과 추론 모델의 아키텍쳐가 일부 다른 경우도 존재합니다.
또한, 학습과 추론은 공간적으로도 구분되기도 합니다. 모델이 학습되는 장치와 추론되는 장치가 다른 것이죠. 학습에는 추론보다 훨씬 많은 연산량이 필요하기에, 학습 장치에는 추론 장치보다 좋은 하드웨어 성능을 기대합니다.
유사한 논리로, 모델을 학습하는 주체와, 모델을 이용하여 추론하는 주체는 구분될 수 있습니다. 통상적으로 모델은 Google, Samsung과 같은 AI 서비스 제공기업이 학습을 하고, 일반 사용자는 이렇게 학습된 모델을 이용하죠.
안타까운 점은, 인공지능 분야의 많은 특허 명세서들이 학습과 추론을 명확하게 구분짓지 못하고 있다는 점입니다. 특허에 있어서, 시간, 공간, 주체는 상당히 민감한 소재입니다. 이 중 하나라도 혼동된다면 특허는 무용지물이 될 수도 있습니다. 특허 청구범위 내에서 학습 동작과 추론 동작이 혼용되어 작성된, 참담한 경우를 가정해보겠습니다. 이 경우, 학습과 추론이 하나의 장치에서 동작하는 것으로 해석되어, 학습 장치와 추론 장치가 다른 경우 침해를 입증하기가 어려워집니다. 유사하게, 학습과 추론이 하나의 주체에 의해 동작하는 것으로 해석되어, 복수 주체가 해당 동작을 나누어 실시하는 경우 역시 침해를 입증하기가 곤란해지겠죠.
따라서, 모델의 내부 아키텍쳐나, 학습 데이터 처리(어그멘테이션 등), 학습 알고리즘 등에 기술적 특징이 있는 경우에는, 학습의 관점에서 청구항을 작성하는 것이 중요합니다. 이와 달리, 특정 서비스에서 인공지능 모델을 이용하는 경우에는, 입출력되는 데이터, 입력 데이터 전처리, 출력 데이터 후처리 등을 청구항에 기재하여 추론의 관점에서 청구항을 작성하는 것이 중요하겠습니다.
3. 인공지능의 분야를 세분화하라!
앞서 말한 것과 같이, 인공지능을 학습과 추론으로 구분할 수도 있겠지만, 이는 특허법적으로 올바른 권리범위를 확보하는 방법론입니다. 인공지능 기술은, 크게 데이터/아키텍쳐/모델 경량화 방법/학습 방법/연산 방법으로 나눌 수 있겠습니다.
먼저, 데이터는, 학습 데이터를 의미합니다. 학습 데이터를 라벨링하는 방법, 모델이 요구하는 스펙으로 입력 벡터의 차원으로 변환하는 방법, 학습 데이터를 어그멘테이션하는 방법 등이 이에 해당할 수 있습니다.
둘째로, 인공지능 모델의 아키텍쳐 자체에 기술적 특징이 존재하는 경우입니다. 완전히 새로운 아키텍쳐, 혹은 이미 제안된 아키텍쳐들 간 선택적 결합, 레이어 추가/생략, 레이어 입출력 데이터플로우 등이 있겠습니다. 예를 들어, 기존 seq2seq 개념과 Attention 기법을 결합하여 제안된 Google의 Transformer 모델에 대한 특허도 아키텍쳐에 기술적 특징이 있는 경우에 속하겠습니다.
셋째로, 모델 경량화에 기술적 특징이 존재하는 경우입니다. 모델의 파라미터 수가 많아지면서, 하드웨어가 감당해야 하는 연산량이 기하급수적으로 늘어나고 있습니다. 이를 해결하기 위한, 프루닝, 양자화, 지식 증류 등의 여러 경량화 기법이 이에 속하겠습니다.
넷째로, 학습 방법에 기술적 특징이 존재하는 경우입니다. 학습 데이터가 입력되어 가중치를 갱신하기까지, 기술적 특징이 있다면 이에 해당할 수 있습니다. 예를 들어, 배지 정규화, 드롭-아웃, 러닝레이트(learning rate) 스케줄링, 가중치 감소(decay) 등의 기법 등이 있습니다. 학습 과정에서 모델의 강건성/안정성/일반화 능력(오버피팅 방지)을 향상시키는 모든 방법이 이에 해당할 수 있습니다.
마지막으로, 연산 방법에 기술적 특징이 존재하는 경우입니다. 인공지능 하드웨어 가속기(NPU)와의 관계에서, 행렬 연산을 수행하는 방식에 기술적 특징이 있는 경우가 이에 해당합니다. 예를 들어, MAC 유닛의 데이터 처리 방식, 데이터의 자료형 변환 등이 이에 해당할 수 있겠습니다.
이외에도, 인공지능 모델의 동작, 기능, 구성과 관련하여 많은 세부 분야들이 도출될 수 있습니다. 하나의 인공지능 모델이더라도, 모델에 집약된 특징들을 세분화하여 권리화함으로써, 더 넓은 권리범위를 확보할 수 있겠습니다.
여기까지 인공지능 기술에서의 특허 전략을 소개해보았습니다. 인공지능 특허 등록 및 권리화 전략에 좋은 결과와 성과가 있길 기원하겠습니다.