#사업전략 #운영 #트렌드
앤트로픽 사례로 본 AI 에이전트 특허 확보 전략


생성형 AI 시장의 경쟁축이 단일 모델의 우수성에서 스스로 판단하고 행동하는 'AI 에이전트(Agent)'로 빠르게 이동하고 있습니다. 앤트로픽(Anthropic)이 출시한 Claude의 핵심 기능(Claude Code, Computer Use, Claude Agent SDK)을 중심으로 구축된 미국 특허 포트폴리오 16건을 통해 정교한 지식재산전략을 분석하고, 강력한 특허 권리를 확보하기 위한 실무 청구항 설계 전략을 제시합니다.

 

 

특허 포트폴리오의 구조, 일괄출원과 이원화 전략

앤트로픽의 특허 포트폴리오는 '한 분야, 한 시점, 한 묶음'이라는 일괄출원(Coordinated Filing) 전략을 취하고 있습니다. 16건의 특허는 모두 2024년 10월 7~8일 전후로 일제히 출원되었으며, 동년 3~4월에 제출된 8건의 가출원(Provisional)에 우선권을 두고 있습니다.

 

앤트로픽의 기술 영역별 4대 클러스터 분포

기술 영역건수대표 특허 번호
 
기술적 의의 및 특징
 
에이전트 명세 및 런타임 DSL6건
 
US 12,430,150 B1
US 12,566,913 B2 외
자연어 지시를 실제 웹/앱 이벤트(액션 명령)로 변환하고 실행하는 환경
 
멀티모달 UI 인식5건
 
US 12,387,036 B1
US 12,619,815 B2 외
임의 해상도의 스크린샷 이미지를 효율적으로 인식하는 비전 백본 기술
 
학습 데이터 자동 수집3건
 
US 12,437,238 B1 외사용자의 인터페이스 조작을 가로채 에이전트 학습용 데이터로 자동 변환
 
멀티모달 학습 데이터 구성2건
 
US 12,585,862 B2
US 2025/0299510 A1
비디오, PDF, 에이전트 경로 등 8종의 다양한 데이터셋을 큐레이션하는 노하우
 

[기술 영역별 4대 클러스터 분포]

 

전체 16건의 특허는 등록 6건, 공개 10건의 비율로 구성되어 있으며, 표면적으로는 다양해 보이지만 정교하게 교차 분석 시 위 4가지 기술 클러스터로 수렴됩니다.

한편 앤트로픽의 정체성과도 같은 헌법적 AI(Constitutional AI), 정렬(Alignment), 해석가능성(Interpretability) 등은 특허 출원을 하지 않고 학술 논문과 블로그를 통해 공공재하고, 타사와의 경쟁이 치열한 UI 에이전트 및 하네스 엔지니어링 등 상업적 핵심 기술 영역에는 촘촘하고 두터운 특허 권리망을 형성해 두었습니다.

 

 

Claude 핵심 기능별 특허 분석 및 등록 청구항 패턴

미국 특허법 제101조(특허 적격성)는 "AI 모델이 X를 수행한다"와 같은 추상적인 개념의 청구항에 매우 엄격한 잣대를 들이댑니다. 앤트로픽은 이러한 거절 이유를 피하기 위해 청구항에 매우 구체적인 하드웨어적 구조, 물리적 배치, 내장 함수, 피드백 루프를 한정하여 등록을 받아냈습니다.

 

에이전트 SDK 및 하네스 엔지니어링 (US 12,430,150 B1)

1. A system, running on one or more processors, for client-side implementation of an interface automation language at runtime, comprising:

agent specification logic, running on client-side, and configured to construct an agent specification, and to make the agent specification available for server-side translation into an intermediate representation, wherein the agent specification is configured to automate a multimodal interface workflow; and

     • runtime interpretation logic, running on the client-side, and configured to:
     • receive the intermediate representation;
     • detect one or more agent functions in the intermediate representation;
     • generate one or more agent calls based on the agent functions;
     • issue the agent calls to an agent, and, in response, receive at least one runtime                       actuation function from the agent; and

translate the runtime actuation function into at least one runtime actuation command, wherein the runtime actuation command triggers at least one machine-actuated action as a runtime synthetic action that automates the multimodal interface workflow.

[US 12,430,150 B1 청구항 1]

 

거대 언어 모델(LLM)이 장시간 자율적으로 동작하도록 지원하는 런타임 환경인 하네스(Harness)에 관한 기술입니다. 클라이언트 측에서 에이전트 명세(Agent Specification)를 구성하면, 서버 측이 이를 중간 표현(IR)으로 번역하고, 다시 클라이언트 런타임이 이를 머신 액션 명령으로 변환하는 방식으로 작동합니다.

'클라이언트-서버 분리 아키텍처'를 명시하고, 종속항에 answerQuestionAboutScreen, goToURL, typeInto와 같은 구체적인 내장 함수명을 그대로 열거(Enumeration)하여 특허 적격성의 추상성 논란을 완전히 회피했습니다.

 

멀티모달 비전 기술 (US 12,387,036 B1)

1. A system for magnitude-invariant image-text agentic interface automation, comprising:
memory storing an input image and an input text sequence;

patch extraction logic configured to extract image patches from the input image on a line-by-line basis, and generate a plurality of lines of image patches for the input image;

bit vectorization logic configured to convert image patches in the plurality of lines of image patches into magnitude-invariant bit vectors, and generate a plurality of lines of magnitude-invariant bit vectors;

newline insertion logic configured to interleave a newline character between successive lines of magnitude-invariant bit vectors in the plurality of lines of magnitude-invariant bit vectors, wherein the newline character specifies an end of a line in the input image;

tokenization logic configured to translate the input text sequence into a sequence of input text tokens, and to translate the successive lines of magnitude-invariant bit vectors interleaved with the newline character into a sequence of input magnitude-invariant bit vector tokens;

linear projection logic configured to linearly project a single token stream of the sequence of input text tokens and the sequence of input magnitude-invariant bit vector tokens into a decoder-only Transformer logic, wherein the linear projection of the single token stream bypasses any embedding lookup; and

the decoder-only Transformer logic configured to process the linearly projected, embedding lookup-bypassed single token stream to generate a sequence of output tokens that are responsive to the input image and the input text sequence.

[US 12,387,036 B1 청구항 1]


임의 해상도의 이미지를 패치(Patch) 단위로 잘라 임베딩 룩업(Embedding Lookup)을 우회하고 디코더-Only 트랜스포머에 직접 투입하는 구조입니다.

청구항에 패치 행 사이에 뉴라인(newline) 토큰을 삽입하는 구성과, 선형 투영(linear projection)이 임베딩 룩업을 우회한다는 '구체적인 아키텍처 결정'을 한정하여 진보성을 인정받았습니다.

 

학습 데이터 자동 생성 및 큐레이션 (US 12,437,238 B1)
사용자와 인터페이스 사이에 '중개자(Intermediary)'를 배치하여 사용자의 입력을 가로채고, 실행 직전의 화면 상태를 보존함으로써 에이전트 학습 데이터셋을 자동으로 생성하는 기술입니다. 
 

1769af977c421.png
[US 12,437,238 B1 Fig. 46A, 46B, 46C]


중개자가 인터페이스와 사용자 '사이에 물리적으로 배치(Interposed)'되어 기능한다는 점을 명시하는 '데이터 흐름의 물리적 경계 명시'와 함께, 청구항 내에 '8종의 학습 데이터셋 종류를 직접 열거'하여 특허 적격성을 확보했습니다.
 

1. A system for generating training data to train agents to automate multimodal interface task workflows, comprising:

  • an intermediary interposed between an interface, comprising multimodal content, and a user, and the intermediary is configured to:
    intercept one or more user-actuated actions directed towards the interface by the user, wherein the user-actuated actions, if received by the interface, execute a task on the interface;
    preserve a state of the interface prior to the execution of the task, wherein the preserved state includes multimodal data comprising arbitrary-length text sequences and arbitrary-resolution images;
    translate the user-actuated actions into one or more actuation commands using a transformer-based multimodal neural network comprising multi-head attention mechanisms, wherein the actuation commands are configured to trigger one or more machine-actuated actions that replicate the user-actuated actions on the interface to cause automation of the multimodal task workflow; and generate a multimodal training dataset to train an agent to automate the task, wherein the training dataset requires the agent to process, as input, the multimodal state of the interface prior to the execution of the task, and to generate, as output, the actuation commands, wherein the translation and generation are performed using runtime interpretation logic dynamically executing on a client-side computing device.

[US 12,437,238 B1 청구항1]

 

 

AI 에이전트 특허 확보를 위한 실무 전략

위에서 살펴본 바와 같이 "AI 모델을 활용해 컴퓨터나 UI를 자율 제어한다"는 식의 추상적인 청구항으로는 한국과 미국 모두에서 등록을 기대하기 어렵습니다. 향후 강력한 특허 권리를 확보하기 위해 다음과 같은 청구항 설계 전략이 필수적입니다.

시스템의 물리적 배치와 경계 명시해야합니다. 개념적인 기능 묘사에 그치지 말고, 특정 모듈이나 데이터 흐름이 "어디와 어디 사이에 위치(disposed / interposed)하는지" 구조적 관계를 명확히 기재해야 추상 아이디어 거절을 회피할 수 있습니다.

필요에 따라서 핵심 내장 함수 및 데이터셋의 직접 명명 및 열거하는 것이 필요합니다. 핵심 내장 함수명(예: goToURL, typeInto)이나 데이터셋 유형을 청구항에 직접 언급하는 명명과 열거(Enumeration)는 추상성 거절에 대한 가장 강력한 반론 수단이 됩니다. 다만 이 경우 노하우로 보호할 수 있는 여지도 있으므로 특허로 보호할지 영업비밀로 보호할지에 대한 의사결정이 필요한 부분입니다.

'피드백 루프'와 '자율 반복성' 청구할 수 있습니다. 에이전트가 환경(UI)으로부터 스크린샷이나 실행 히스토리를 피드백받아 다음 액션을 정련해 나가는 '반복적 정련(Iterative Refinement)' 구조를 청구항에 녹여내야 합니다. 이는 단순 자동화 툴과 자율 에이전트를 구분 짓는 진보성의 핵심 근거가 됩니다.

포트폴리오 구축단계에서 가출원을 적극적으로 활용할 수 있습니다. 가출원으로 우선권 일자를 먼저 선점한 뒤, 정식 출원을 거쳐, 개량된 구체적 한정 요소를 계속출원(Continuation/분할출원)으로 계속 쌓아 올리는 앤트로픽식 권리망 레이어링 전략을 벤치마킹해야 합니다.

영문 청구항 형식이 반영된 국문청구항 작성을 고려해야합니다. 미국 특허법상 권리 범위가 축소 해석되는 위험(35 U.S.C. §112(f) Means-plus-function)을 피하기 위해, 영문 청구항 작성 시 configured to ~ 또는 ~ logic 형식을 의도적으로 활용해야 하며, 국내 출원 단계에서부터 이러한 형식적 일관성을 염두에 두는 것이 안전합니다.

 

결론적으로, AI 에이전트 시대의 특허는 단순한 방어용 문서가 아니라 기업의 핵심 기술 좌표를 시장에 선언하는 전략적 무기입니다. 심사관이 거절하기 어려운 한정 유형(구체적 아키텍처 결정, 물리적 배치, 내장 함수 열거, 피드백 루프)을 출원 초기부터 명세서에 적극적으로 반영하여 가치 있는 기술적 해자를 구축해야 합니다.

 

 


BLT 칼럼은 BLT 파트너변리사가 작성하며 매주 1회 뉴스레터를 통해 발행됩니다.
뉴스레터 구독신청

 

 

필자 소개
박기현 변리사는 카이스트 전기 및 전자공학부를 졸업하고 2015년 52기 변리사 시험에 합격했습니다.
국내 대기업의 기술 권리화, 특허 분쟁 대응 및 컨설팅 경험을 보유하고 있으며, 자율 주행, 영상 처리, 의료기기, 기계학습, 디스플레이, 단말 UI/UX, IP 포트폴리오 설계 및 IP 심판 소송 분야를 담당하고 있습니다.


특허법인 BLT
누군가는 특허를 만들 때, BLT는 당신의 사업의 성공을 만들어 냅니다. The Only Firm for Your Success!!

 

원문 보러가기

#AI에이전트 #AIAgent #Anthropic #Claude #GenerativeAI #LLM #AIAutomation #MultimodalAI #ComputerUse #AgentSDK #AI특허 #특허전략 #특허출원 #USPTO #PatentEligibility #Section101 #청구항작성 #ClaimDrafting #IP전략 #앤트로픽 #특허 #특허권 #지식재산권 #특허법인 #변리사

링크 복사

특허법인 BLT 특허법인 BLT · 기타

🤝 대한민국 최고의 지식재산 전문가 그룹

댓글 0
댓글이 없습니다.
추천 아티클
특허법인 BLT 특허법인 BLT · 기타

🤝 대한민국 최고의 지식재산 전문가 그룹

0