"
    SENTENS
    "
    회사소개특허번역 서비스견적·문의블로그
    로그인
    목록으로

    특허 번역 AI, 어디까지 믿어도 될까? — 실무자를 위한 성능 한계와 사용 기준

    Sentens Research·2026-03-26·9분 읽기

    특허 번역 AI, 어디까지 믿어도 될까?

    특허 실무 현장에서 AI 번역을 쓰지 않는 사람을 찾기가 오히려 어려운 시대가 됐다. DeepL로 초벌을 돌리고, ChatGPT로 표현을 다듬고, 전문 번역가가 최종 검수하는 흐름은 이미 많은 특허법인과 번역회사의 일상적인 워크플로우다.

    문제는 "AI 번역을 쓰느냐 마느냐"가 아니다. 어떤 AI 도구를 어떤 목적으로, 어떤 방식으로 쓰느냐다. 특히 특허 청구항(Claims)은 한 단어의 차이가 권리범위 전체를 바꿀 수 있는 법적 문서다. 일반 문서 번역과 같은 기준으로 접근하면 예상치 못한 위험을 마주할 수 있다.

    이 글에서는 최신 학술 연구와 실제 판례를 바탕으로, 현재 LLM이 특허 청구항 번역에서 정확히 어디서 실패하는지, 그리고 실무자가 AI를 안전하고 효과적으로 활용하기 위한 기준은 무엇인지를 정리한다.


    AI 번역은 이미 특허 실무의 일부다

    AI 보조 번역, 즉 PEMT(Post-Editing of Machine Translation)는 이미 번역 서비스 업계의 표준 모델이 됐다. 국제 표준기구(ISO)가 2017년에 ISO 18587을 제정한 것이 이를 증명한다. 이 표준은 기계번역 출력물에 대한 전문가 포스트에디팅의 요건과 포스트에디터의 역량을 규정하며, 현재 개정 작업이 진행 중이며, 2026년 중 업데이트 버전 출판이 예상된다.

    속도와 비용 면에서 AI의 장점은 분명하다. 수백 페이지 분량의 명세서 초벌을 몇 분 안에 처리할 수 있고, 반복되는 표현이 많은 특허 문서의 특성상 AI 번역의 일관성도 상당히 높아졌다.

    다만 번역 업계가 오랜 경험으로 체득한 원칙이 있다. ISO 18587은 PEMT의 목표를 "인간 번역과 동등한 품질"로 명시하면서, 이것이 단순한 오탈자 교정이 아닌 전문 번역가 수준의 검토를 요구한다고 강조한다. 특히 특허 청구항처럼 법적 효력이 있는 문서에서는 이 기준이 더욱 엄격하게 적용된다.


    AI가 특허 청구항에서 실제로 실패하는 지점

    2025년 6월 Machine Translation Summit에서 발표된 연구(Azami et al., 2025)는 특허 데이터로 추가 학습한 LLM을 특허 청구항 번역에 적용한 결과를 체계적으로 분석했다. BLEU, COMET 등 자동 평가 지표에서는 기존 Transformer 모델보다 높은 점수를 기록했지만, 기존 모델에서는 관찰되지 않던 hallucination 오류가 새롭게 발생했다는 점을 지적했다. 단순히 번역이 부정확한 것과 없는 내용을 만들어내는 것은 근본적으로 다른 문제다.

    LLM이 특허 청구항에서 자주 실패하는 패턴은 크게 세 가지다.

    ① Hallucination: 원문에 없는 내용이 생성된다

    LLM은 문맥적으로 자연스러운 문장을 생성하도록 훈련돼 있다. 이것이 일반 번역에서는 강점이지만, 특허 청구항에서는 치명적인 약점이 될 수 있다. 기술적으로 모호하거나 LLM이 학습 데이터에서 접한 적 없는 표현이 등장하면, 모델이 "그럴듯한" 표현으로 빈칸을 채우는 일이 발생한다. 특허 청구항에서 수치 한정이나 조건 표현은 권리범위를 직접 제한하므로, 원문에 없는 내용이 단 하나라도 추가되거나 삭제되면 출원 자체가 위태로워진다.

    원문 A method for forming a gate insulating layer by supplying a silicon precursor and an oxidizing agent alternately to a substrate in a reaction chamber...

    AI 번역 (주의) 반응 챔버 내 기판에 실리콘 전구체 및 산화제를 교대로 공급하여 게이트 절연층을 형성하는 방법으로서, 상기 기판을 500°C로 가열하는 단계를 포함하는...

    전문가 번역 반응 챔버 내의 기판에 실리콘 전구체와 산화제를 교대로 공급하여 게이트 절연층을 형성하는 방법으로서...

    ② 종속항 구조 붕괴

    2024년 발표된 연구(Jiang et al., 2024)는 GPT-4를 포함한 다수의 LLM이 특허 청구항 구조를 처리할 때 독립항은 비교적 잘 다루지만, 종속항으로 갈수록 성능이 급격히 저하된다는 것을 실증했다. 독립항과 종속항 사이의 참조 관계, "상기(said/the aforementioned)"의 선행사 추적, 다중 종속의 처리 등이 LLM의 구조적 취약점이다. 종속항에서 "제N항에 있어서"라는 종속 관계가 누락되거나 잘못 연결되면, 독립항처럼 해석되어 권리범위가 의도와 전혀 다르게 설정될 수 있다.

    원문 Claim 3. The apparatus of claim 1, wherein the controller is further configured to compare the first threshold value with the second threshold value.

    AI 번역 (주의) 장치로서, 제어기는 제1 임계값과 제2 임계값을 비교하도록 더 구성되는 것을 특징으로 하는 장치.

    전문가 번역 제1항에 있어서, 상기 제어기는 제1 임계값과 제2 임계값을 비교하도록 더 구성되는 것을 특징으로 하는 장치.

    ③ 기술 용어 비일관성

    특허 번역에서 용어 일관성은 단순한 품질 문제가 아니라 권리범위의 명확성에 직결된다. LLM은 문장별로 독립적으로 번역하는 경향이 있어, 동일한 원문 용어가 문서 내에서 다르게 번역되는 경우가 빈번하다. "signal processing unit"이 어떤 단락에서는 "신호 처리 유닛", 다른 단락에서는 "신호 처리 장치"로 번역되면 명세서와 청구항 간 용어 불일치 문제가 발생할 수 있으며, 이는 실제로 미국 USPTO, 일본 JPO, 유럽 EPO 모두에서 거절 이유가 된다.


    번역 용어 하나가 특허를 무효로 만든다 — 실제 판례

    AI 번역 오류의 위험성을 가장 잘 보여주는 것은 추상적인 경고가 아니라 실제 법원 판결이다.

    IBSA v. Teva — Fed. Cir. 2020

    IBSA Institut Biochimique, S.A. v. Teva Pharmaceuticals USA, Inc., 966 F.3d 1374 (Fed. Cir. 2020)

    이탈리아 제약사 IBSA는 갑상선 호르몬 치료제 Tirosint®에 대한 미국 특허를 보유하고 있었다. 이 특허는 이탈리아어 원출원을 기반으로 했는데, 청구항의 핵심 표현인 이탈리아어 "semiliquido" 가 영어 출원 시 "half-liquid" 로 번역됐다. 올바른 번역은 "semi-liquid"였다.

    Teva가 제네릭 의약품 출시를 위해 특허 무효를 주장하자, 법원은 "half-liquid"라는 표현의 범위가 명세서와 출원 경과 어디에서도 명확히 정의되지 않는다고 판단했다. 미국 연방순회항소법원(Fed. Cir.)은 이 청구항이 35 U.S.C. §112에 따른 명확성 요건(definiteness)을 충족하지 못한다며 특허 무효를 확정했다.

    단어 하나의 번역 선택이 특허 전체의 효력을 무너뜨린 사례다. 이 판례가 AI 번역 실무에 주는 시사점은 분명하다. LLM은 "half-liquid"처럼 문맥상 자연스러워 보이는 표현을 아무 경고 없이 생성한다. 기술적으로 더 정확한 "semi-liquid"와의 차이를 포착하는 것은 특허 번역 전문가의 몫이다.

    🔗 판결 원문: https://www.cafc.uscourts.gov/7-31-2020-19-2400-ibsa-institut-biochimique-v-teva-pharmaceuticals-usa-opinion-19-2400-opinion-7-31-2020_1628842/

    중국어 번역에서의 유사 사례 — EPO T 354/22

    중국 출원이 늘어나면서 중국어→영어 번역 오류도 EPO 심판에서 주요 쟁점이 되고 있다. EPO 기술심판부 T 354/22 사건(특허번호 EP 3 005 983 B1)은 중국어 PCT 출원의 의료기기 특허에서 "联动(lián dòng)" 의 영어 번역이 쟁점이 됐다. 특허권자는 "movable together with(함께 움직이는)"로 번역했지만, 이의신청인은 "linked to(연결된)"이 올바른 번역이라고 주장했다. 심판부는 특허권자의 번역이 원출원 범위를 초과한다고 판단해 주 청구항을 Art.123(2) EPC 위반으로 무효 처리했다.

    "함께 움직인다"와 "연결된다"는 한국어로도 영어로도 충분히 혼동 가능한 표현이다. AI는 두 표현 중 더 자연스러운 것을 선택하지만, 특허 청구항에서 그 선택은 권리범위를 결정한다.

    🔗 EPO 결정문: https://www.epo.org/en/boards-of-appeal/decisions/t220354eu1


    어떤 AI 도구를 어떻게 쓰느냐가 핵심이다

    특허 번역에서 AI 도구 선택 시 간과되는 중요한 구분이 있다. 기밀 보호 측면에서 같은 회사의 도구라도 어떤 채널로 쓰느냐에 따라 데이터 정책이 전혀 다르다.

    도구 / 접근 방식학습 데이터 활용특허 업무 권장 여부
    ChatGPT 무료 / Plus / Pro (웹 UI)기본으로 학습에 활용 (opt-out 가능)⚠️ 미출원 특허 입력 주의
    ChatGPT Business¹ / Enterprise기본 비활용✅ 기업 계약 시 안전
    OpenAI API비활용 (Abuse 모니터링 로그만 30일 보관)✅ 안전
    DeepL 무료학습에 활용⚠️ 기밀 문서 비권장
    DeepL Pro / API Pro비활용 + 번역 완료 후 삭제✅ 안전
    Google Translate 무료 (웹)학습에 활용⚠️ 기밀 문서 비권장
    Google Cloud Translation API비활용✅ 안전
    Gemini API / Workspace비활용 (Abuse 로그 55일 보관)✅ 안전
    Claude Free / Pro / Max설정에 따라 다름²⚠️ Privacy Settings 확인 필요
    Claude API / for Work비활용✅ 안전

    ¹ 구 ChatGPT Team. OpenAI가 2025년 8월 ChatGPT Business로 명칭 변경. ² Anthropic은 2025년 9월 소비자 약관을 개정했다. 현재 설정은 Claude.ai → Settings → Privacy에서 확인 가능.

    특히 주의해야 할 상황은 미출원 특허 문서를 무료 웹 UI에 입력하는 경우다. 특허는 출원 전까지 기밀이어야 하며, 외부 서버에 내용이 노출되면 신규성 상실로 이어질 가능성을 배제할 수 없다. OpenAI API를 통해 처리하거나 Enterprise 계약을 맺은 서비스를 통해 번역하는 경우라면 이 위험은 해소된다.


    실무 판단 기준 — 용도별 AI 활용 가이드

    특허 번역에서 AI를 어떻게 활용할지는 문서의 성격과 사용 목적에 따라 달라진다.

    용도AI 단독 처리PEMT (AI + 전문가 검수)인간 번역 우선
    내부 검토용 참고 번역✅ 가능——
    선행기술 검색·분석✅ 가능——
    명세서 초벌 (도면 설명, 배경기술)—✅ 권장—
    청구항 번역❌ 단독 불가✅ 전문가 심층 검수 필수✅ 고위험 출원
    미출원 특허 (기밀 단계)—✅ API/Pro 도구만 사용—
    소송·무효 심판 관련 번역❌❌✅ 필수

    핵심 원칙은 두 가지다. 첫째, AI 출력은 반드시 특허 번역 전문가의 검수를 거쳐야 하며, 청구항의 경우 특히 종속항 구조, 전환구(comprising/consisting of), 수치 한정 표현을 집중적으로 확인해야 한다. 둘째, IBSA v. Teva 판례에서 확인됐듯이 번역 용어 선택 하나가 청구항의 법적 효력을 바꿀 수 있으므로, 법적 효력이 있는 문서에 AI 번역을 검수 없이 사용하는 것은 권장하지 않는다.


    ISO 18587 기반 PEMT — 올바른 AI 활용의 기준선

    AI를 특허 번역에 통합할 때 참고할 수 있는 국제 기준이 ISO 18587이다. 이 표준은 AI 번역 출력물에 대한 전문가 포스트에디팅(PEMT) 전 과정을 다음과 같이 구조화한다.

    1단계 — 사전 평가 (Pre-editing assessment): 해당 문서가 기계번역에 적합한지 판단한다. 반복적 표현이 많고 구조가 명확한 명세서 본문 — 도면 참조, 배경기술, 동작 설명 등 — 은 AI가 비교적 안정적으로 처리하는 영역이다. 반면 청구항처럼 한 단어의 해석이 권리범위를 결정하는 법적 문서는 포스트에디팅 비중을 높여야 한다.

    2단계 — 전문가 포스트에디팅 (Full post-editing): ISO 18587은 포스트에디터의 목표를 "인간 번역과 동등한 품질"로 명시한다. 단순한 오타 교정이 아니라 내용의 완전성, 용어 일관성, 법적 표현의 정확성까지 검토해야 한다.

    3단계 — 최종 검증 (Final review): 특허 번역 전문가가 출원 전 청구항 전체를 한 번 더 검토한다. 특히 독립항과 종속항 간 참조 관계, 명세서와 청구항 간 용어 일치 여부를 확인한다.

    특허 번역 전문 서비스를 선택할 때는 AI 초벌의 품질만큼이나, 누가 어떤 기준으로 최종 검수에 책임을 지는지를 확인하는 것이 중요하다.


    FAQ

    Q: ChatGPT로 특허 청구항을 번역하면 법적으로 문제가 되나요?

    A: 번역 자체가 불법인 것은 아닙니다. 다만 IBSA v. Teva(Fed. Cir. 2020) 같은 판례에서 확인됐듯이, 번역 용어 선택 하나가 청구항 전체의 권리범위를 불명확하게 만들어 특허 무효로 이어질 수 있습니다. AI는 "half-liquid"처럼 문맥상 자연스러운 표현을 아무 경고 없이 생성하지만, 그 선택의 법적 의미는 포착하지 못합니다. 전문가 검수 없이 AI 번역을 출원 서류에 사용하는 것은 권장하지 않습니다.

    Q: OpenAI API와 ChatGPT 웹의 데이터 정책이 다른가요?

    A: 그렇습니다. OpenAI API를 통해 처리된 데이터는 기본적으로 모델 학습에 사용되지 않습니다. 반면 ChatGPT Free/Plus/Pro 웹 UI는 기본 설정에서 대화 내용이 학습에 활용될 수 있습니다. 미출원 특허처럼 기밀이 중요한 문서는 API, ChatGPT Business, 또는 Enterprise 계약을 통해 처리하는 것을 권장합니다.

    Q: AI가 잘 처리하는 특허 문서 유형은 무엇인가요?

    A: 반복적인 표현이 많고 법적 해석이 단순한 부분, 예를 들어 도면의 참조 부호 설명, 배경기술 소개, 실시예의 동작 설명 등은 AI PEMT 워크플로우에 잘 맞습니다. 반면 청구항, 특히 종속항 구조가 복잡한 경우와 소송·무효 심판 관련 번역은 전문가 번역이 우선입니다.

    Q: PEMT와 AI 번역 단독 사용은 어떻게 다른가요?

    A: AI 번역 단독 사용은 AI 출력을 검수 없이 그대로 활용하는 방식입니다. PEMT는 AI 초벌을 바탕으로 특허 번역 전문가가 내용·용어·법적 표현을 검토해 완성하는 프로세스입니다. 특히 청구항처럼 한 단어가 권리범위를 결정하는 문서에서는 이 검수 단계의 품질이 최종 결과물의 수준을 결정합니다.

    Q: LLM의 특허 번역 성능은 앞으로 개선될까요?

    A: 개선되고 있습니다. 다만 현재 연구들은 종속항 구조 처리, hallucination 억제, 도메인별 기술 용어 일관성 등의 영역에서 여전히 과제가 남아 있음을 보여줍니다. 특히 특허 출원 시점의 기술 수준을 정확히 반영해야 한다는 법적 요건은 LLM의 구조적 한계와 연결돼 있어 단기간에 완전히 해소되기 어렵습니다. AI가 빠르게 발전하더라도 법적 정밀도가 요구되는 청구항 번역에서 전문가 검수의 중요성은 당분간 유지될 것으로 보입니다.



    참고 자료

    • Azami, H., Kondo, M., Utsuro, T., & Nagata, M. (2025). Patent Claim Translation via Continual Pre-training of Large Language Models with Parallel Data. Proceedings of Machine Translation Summit XX, EAMT. https://aclanthology.org/2025.mtsummit-1.23/
    • Jiang, L., Zhang, C., Scherz, P. A., & Goetz, S. (2024). Can Large Language Models Generate High-quality Patent Claims? arXiv:2406.19465. (특허 청구항 생성 태스크에서 LLM의 종속항 처리 취약성 분석) https://arxiv.org/abs/2406.19465
    • IBSA Institut Biochimique, S.A. v. Teva Pharmaceuticals USA, Inc., 966 F.3d 1374 (Fed. Cir. 2020). https://www.cafc.uscourts.gov/7-31-2020-19-2400-ibsa-institut-biochimique-v-teva-pharmaceuticals-usa-opinion-19-2400-opinion-7-31-2020_1628842/
    • EPO Board of Appeal, T 354/22 (EP 3 005 983 B1). Decision on Chinese-to-English translation error, Art.123(2) EPC. https://www.epo.org/en/boards-of-appeal/decisions/t220354eu1
    • ISO 18587:2017. Translation services — Post-editing of machine translation output — Requirements. International Organization for Standardization. https://www.iso.org/standard/62970.html
    • OpenAI. How your data is used to improve model performance. https://openai.com/policies/how-your-data-is-used-to-improve-model-performance/
    • OpenAI. Enterprise Privacy at OpenAI. https://openai.com/enterprise-privacy/
    • DeepL SE. Privacy Policy. (Last updated: February 2026) https://www.deepl.com/en/privacy
    • Google Cloud. Cloud Translation API — Data Usage FAQ. https://cloud.google.com/translate/data-usage
    • Anthropic. Updates to Consumer Terms and Privacy Policy. (August 28, 2025) https://www.anthropic.com/news/updates-to-our-consumer-terms
    AI번역특허번역ChatGPTLLMPEMTISO18587포스트에디팅청구항번역

    관련 글

    50페이지 넘는 특허 명세서, AI에 그냥 넣으면 안 되는 이유2026-04-03
    © 2026 Sentens. All rights reserved.
    회사소개개인정보처리방침이용약관