Category: Books

[도서 발췌] 생체적합성(Biocompatibility)

<이 글은, 2015년 1학기 동명대학교 의료기기관리제도 과목의 강의 교안으로 사용하기 위해서, 마리 B. 텍세이라의 “의료기기 산업계를 위한 설계 관리” (제2판, 2013년 11월 12일, CRC 프레스) 중 제12장 생체적합성 부분을 번역한 글입니다. <표 12.1>을 제외하고 전문 번역하였고, 일부 설명이 필요한 곳엔 역주를 추가하였습니다.>

[도서 발췌] 생체적합성(Biocompatibility)

의료기기와 그 구성품(components), 재료(materials)가 생체 적합함을 보증하는 일은 어떤 설계 관리 프로그램을 운용하든지 핵심 요소가 된다. 생체적합성(biocompatibility)은 통상 다음과 같은 두(2) 가지 기본 질문에 답할 수 있는 시험을 적용하여 판단한다.

1. 사용한 재료는 안전한가?
2. 그 재료는 사용하고자 하는 기능 수행에 필요한 물리적, 기계적 특성을 가지고 있는가?

생체재료는 보통 복합 개체이고, 그 재료의 독성(material toxicity)은 물리적, 화학적 특성 모두에 의해 영향을 받는다. 생체재료 또는 고분자 제제의 독성은 흔히 표면으로 이동하고, 재료(material)로부터 추출되는 성분들(components)로부터 유래한다. 재료 시험(material testing)은 용해 물질(leachable substances)은 없는지, 재료 또는 기기가 시간에 따라 또는 다른 환경에 처하면 분해되는지와 같은 재료의 독성(the toxicity of the material)을 판단하기 위해 수행한다.

생체적합성은 한 가지 시험만으로 밝힐 수 없다. 그 때문에 가능한 한 많은 생체적합성 변수들을 시험하는 것이 필요하다. 또한, 한 종류의 재료라도 가능하면 많은 시료들(samples)을 가지고 시험하는 것이 중요하다. 적절한 양성대조군과 음성대조군[역주: 양성대조(물질)군(positive control (group))은 규정한 방법대로 시험할 때 재현성 있고 적절한 양성/활성/최대 반응/결과를 나타내어, 시험이 적절하게 수행되었음을 나타내주는 비교 재료 또는 물질을 말하고, 음성대조(물질)군(negative control (group))은 규정한 방법대로 시험할 때 재현성 있고 적절한 음성/비활성/최소 반응/결과를 나타내어, 시험이 적절하게 수행되었음을 나타내주는 비교 재료 또는 물질을 말함]을 사용하여 반복된 시험을 통해 일정한 응답이 나오도록 한다. 더 높은 용량 범위로, 더 장시간 사용한다든지 또는 실제 사용 조건보다 더 가혹한 중복 손상을 가한다든지 하는 과장된 시도를 하는 것이 환자 안전을 확보하는 데 중요하다.

급성 독성을 확인하기 위한 대부분의 생체적합성 시험은 단기 시험이다. 이런 단기 시험 데이터는 아무런 시험 결과가 없는 영역까지 지나치게 확대 적용하지 않도록 한다. 생체적합성 시험은 실제 사용 조건 또는 실제 조건과 가까운 특정 조건에서 발생 가능한 유해 효과(adverse effects)를 사정(assess) 평가할 수 있도록 설계한다. 해당 의료기기와 그 사용목적(용도)[역주: ‘intended use’는 흔히 ‘의도된 사용’으로 풀이하는 경우가 많으나, 용도 또는 사용목적으로 풀이하는 것이 이해에 도움이 됨]이 생체적합성 시험에서 얻은 물리학적, 생물학적 데이터와 어떤 상호 관계가 있는지 파악하도록 한다. 이러한 시험들의 정확성(accuracy)과 재현성(reproducibility)은 사용한 시험방법과 시험장비에 따라 달라지고, 종종 연구자의 숙련도와 경험에 좌우되기도 한다.

생체적합성 시험을 설계하기 전에 고려하여야 하는 독성학 원칙들이 몇 가지 있다. 생체적합성은 의료기기에 접촉하는 조직에 의존한다. 예를 들어, 혈액 접촉 의료기기(blood-contacting device)에 대한 생체적합성 요구사항은 외요도 카테터(external urinary catheter)에 적용하는 요구사항과는 다를 것이다. 또한, 생체적합성 보장 수준은 사람 몸에 대한 침습 정도와 접촉 시간에 좌우된다. 예를 들면, 정형용 임플란트에 사용되는 재료들은 환자 몸속에서 오랜 기간 머물러야 하는 재료이다. 이 경우 그 임플란트를 장기간 사용할 때 신체에 유해한 영향은 없는지를 생체적합성 시험을 통해 입증할 필요가 있다. 재료 또는 의료기기가 생분해될 가능성은 없는지도 무시하면 안 된다. 신체에 의해 생분해되면 임플란트의 안전성과 유효성이 떨어질 수 있기 때문이다. 예를 들어, 1회의 혈액투석 시술(hemodialysis procedure)에 사용하는 플라스틱에서 용출되는 물질은 미량일 수 있지만, 환자가 1주일에 3회 투석을 받는다면 환자가 남은 일생 동안 노출되는 물질 총량은 몇 그램까지도 될 수 있다. 따라서 해당되는 경우, 누적 효과(cumulative effects)도 사정(assess) 평가하도록 한다.

두 가지 재료(materials)가 있고, 그들의 화학 조성은 동일하지만 물리 특성이 다른 경우, 예를 들어 입자 크기가 다르다면 동일한 생물학적 반응을 나타내지 않을 수도 있다. 과거의 생물학적 경험상 동일하게 보였던 물질들도 새로운 응용 분야에 적용할 경우 생체적합성을 보장할 수 없다. 독성이란 재료의 제제상의 차이와 제조 공정의 차이로 인한 용해 성분(leachable components)의 차이 때문에 올 수도 있기 때문이다.

생체적합성 시험의 도전 과제는 가능한 한 기존 데이터를 사용함으로써 미지의 변수를 줄이고 논리적 의사결정을 하는 것이다. 고유한 독성 발현 능력을 가진 물질에 따른 위해요인은 그 물질이 실제로 환자에게 노출될 경우에만 알 수 있게 된다. 따라서, 위험은 독성의 위해요인(hazard)과 노출(exposure)의 함수이다. 의료기기로부터 이동하는 물질, 또는 의료기기 내 또는 그 표면에 포함되어 있는 물질의 안전성은 잠재적으로 유해한 물질의 총량을 결정하고(determining), 환자의 조직에 도달하는 양을 예측하며(estimating), 노출 위험을 사정 평가하고(assessing), 위험 대 이익 분석을 수행하여(performing) 평가 가능하다. 생체적합성 시험을 통해 생체재료 사용 시 잠재적 위해가 밝혀진다면, 비교할 수 있는 다른 재료를 찾아 다른 재료로 대체 가능한지를 알아보아야만 한다.

생체적합성의 규제적 측면(Regulatory aspects of biocompatibility)

독성학적 위험의 사정(assessment)은 생물학적 안전을 확보하기 위해 필요하다. 주된 안전성 확보 목표는 의료기기가 환자, 사용자 또는 다른 사람들의 임상 상태 또는 안전을 위협하지 않도록 하는 것, 즉 “의료기기 사용에 따른 위험이 환자에게 주어지는 이익에 비추어보아 허용 가능한 위험이 되도록 하는” 것이다. 독성학적 위험 사정에는 다음의 세(3) 가지 정보 유형이 요구된다.

1. 재료의 화학적 성질(원료 성분의 독성)
2. 재료의 사용 이력
3. 생물학적 안전성 시험 데이터*
[*원주 Medicines and Healthcare Products Regulatory Agency, “Guidance on the Biological Safety Assessment,” London, January 2006.]

ISO 10993-1 표준규격과 FDA의 블루 북 메모랜덤(Blue Book Memorandum) G95-1은 생물학적 평가 시험 표(표 12.1 참조)를 통해 여러 종류의 의료기기에 요구되는 시험 유형을 보여준다.  ISO 10993-1의 표를 사용하든지 또는 FDA의 수정안을 사용하든지 간에 이 표는 시험 선정에 관한 기본틀(framework)을 제공하는 것으로서 필요한 시험이 무엇인지를 확인하는 목록(checklist)은 아니다. 제품의 안전성과 요구사항에 대한 적합성을 사정(assess) 평가하는 데 필요한 구체적인 안전성 시험의 횟수와 유형은 최종 제품, 구성 재료, 임상에서의 사용목적과 같은 개별 특성에 따라 달라진다. FDA의 블루 북 메모 G95-1에 포함된 표도 제조자로 하여금 510(k)[역주: 기존 허가 제품과의 동등성 비교를 통한 미국  FDA의 허가 방식 중 하나]에 필요할지도 모르는 독성 시험을 확인하는 데 도움을 준다(그림 12.1 참조).

또한, 의료기기 제조자들은 일반적으로 안전하다고 인정된, 즉 “안전성인정등급(generally recognized as safe)”(GRAS) 물질을 사용하는 경우에도 주의할 필요가 있다. GRAS 물질은 미국 연방법규 제21편 제182부(21 CFR Part 182)에 등재되어 있는데 음식에 적용되는 규정이다. 그렇기 때문에 GRAS 목록에 포함되는 재료 또는 물질이라고 해서 의료기기에 사용할 때 자동적으로 안전하고 유효하리라 가정해서는 안 된다.

생체적합성 시험 프로그램(Biocompatibility testing programs)

제조자들은 다음 활동의 일부 또는 전부를 포함하는 생체적합성 시험 프로그램을 개발할 필요가 있다.

– 재료(materials)와 완제품 의료기기에 대한 모든 데이터를 수집
– 재료의 화학적 특성을 파악
– 신속하고, 민감도 높고, 비용 대비 효과가 높은 선별 시험(screening tests)을 확인
– 원재료(raw materials) 수입, 최종 제품, 제조 공정을 감시
– 제품 출하 시험과 적합-부적합(pass-fail) 기준을 확립

추가로, 제조자는 의료기기 사용목적에 적합한 신뢰할 만한, 최신의 생물학적분석법(bioassay)을 사용하여 안전성을 입증하도록 한다.

규제 문제는 과학적 고려사항 만큼이나 복잡하다. 몇 가지 규제 문제를 살펴보면 다음과 같다.

– 사람이 의료기기에 얼마나, 어떻게 노출되는지에 관한 문제
– 화학적 손상(chemical insult)에 대한 생물학적 저항(biological resistance)
– 시험 변수(testing variables)
– 종차(species differences), 종간 차이에 대한 시험의 해석 문제
– 시험이 의료기기와 그 용도에 어떤 관계를 갖는지에 대한 문제
– 시험의 정확성과 시험 예측치가 옳다는 것을 어떻게 입증할 것인지에 관한 문제
– 시험 결과의 합당한 해석에 관한 문제
– 화학적 손상에 대하여 아무런 생물학적 반응(음성 결과(negative results))이 없을 경우 생체적합성을 예측하는 문제

<표 12.1> FDA의 블루 북 메모랜덤 – G95.1, 부록 A. 초기 평가 시험

생체적합성 시험 프로그램을 설계할 때에는 너무 극단적인 것은 피하는 것이 바람직하다. 앞서 언급했다시피, 단일 시험으로 생체적합성을 입증하려는 시도는 하지 않는 것이 중요하다. 그보다 더 중요한 사항은 생체적합성 프로그램이 해당 의료기기의 사용목적을 기초로 한 것이어야 한다는 점이다. 많은 시료(검체)(test samples)를 가지고 다양한 시험을 수행하는 것이 시험의 정확성, 특이성, 유의미성, 경제성 못지않게 중요하다. 의료기기는 그 형식이나 용도, 기능, 노출 방식, 접촉하는 이온 따위의 측면에서 제각각 큰 차이를 보이기 때문이다. 따라서, 하나의 시험 시스템을 가지고 모든 응용 분야를 다 수용할 수 없다. 그러나, 제조자는 의료기기가 이미 잘 알려져 있으며 합당한 검증을 거친 재료를 사용하거나, 동일 사용목적으로 오랜 세월 사용되어 안전하다고 여길만한 이력이 있는 경우라면 단지 문서로써 안전성 근거를 확보하기 위하여 과도한 생체적합성 시험 프로그램을 반복해서는 안 된다. 어떤 경우는 해당 의료기기의 사용목적과는 맞지 않거나 또는 그것에는 불필요한 경우도 있다. 예를 들어, 발열성 시험(pyrogenicity test)은 정맥 카테터[역주: 생리식염수나 영양제 투입을 위해 장시간 피부와 접촉하는 의료기기]에는 적합하지만 상처가 없는 체표에 적용하는 국소용 의료기기[역주: 예를 들면, 주사기]에는 적합하지 않다.

생체적합성 시험의 단계(Phases of biocompatibility testing)

의료기기를 위한 우수 생체적합성 시험 프로그램은 다음과 같은 세 단계를 따른다(표 12.2 참조).

– 1단계 시험은 재료의 물리적, 화학적, 독성학적 특성에 관한 정보를 제공하는 시험이다. 일반적으로 수행하기 어렵지 않고, 시험장비들도 쉽게 구할 수 있는 것들로 이루어져 있으며, 생체재료의 기초적 특성을 파악하기 위한 목적으로 수행하기 때문에 다른 모든 시험의 기초가 된다. 응용 범위가 넓지만 분석 능력은 떨어지기 때문에 개발 초기 부적합 사항을 걸러내고, 새로운 재료들을 지속적 감시(모니터링)하는 용도로 사용하기를 권하는 시험이다.

– 2단계 시험은 급성 독성 시험과 몇 가지 아급성 및 만성[역주: 필요 시 아만성] 시험을 포함한다. 이는 기본적으로 1단계 시험의 연장으로서, 1단계 선별 시험 결과, 추가 시험이 필요한 의료기기를 대상으로 하는 시험이며 다양한 체외(in vitro) 시험[역주: 시험관을 이용하여 실험실에서 수행하는 시험] 및 체내(in vivo)[역주: 실험동물을 이용하여 실험실에서 수행하는 시험] 시험으로 구성한다. 약동학적(pharmacokinetic) 연구, 수명 생물학적분석(lifetime bioassay)과 같은 확대된 전임상 시험(preclinical test) 또는 의료기기의 복잡도 및/또는 사용목적에 대한 적합성 파악을 위한 특수 시험을 포함한다.

– 3단계 시험은 의료기기의 최상위 시험으로서 임상 연구를 포함한다. 이는 이식 의료기기(implantable devices)에 특히 중요하다. 제조자는 1단계 시험 결과에 따라 2단계로 진행할지 또는 3단계로 진행할지를 결정하게 된다.

선별 시험(Screening tests)

구성 재료에 관한 데이터를 먼저 작성하지 않은 채 완성된 의료기기 제품을 시험하는 일은 위험하다. 만일 유해 사건(adverse event)라도 발생하면 어떤 구성요소가 문제를 일으켰는지를 판단하기 어렵기 때문이다. 의료기기의 구성 재료를 선별하는 일은 이러한 위험을 최소화하는 것으로서, 적합하지 않은 물질들은 조기에, 신속하고도 비교적 저렴한 방법을 사용하여 제거하는 것이다. 세포독성 시험, 피내 반응 및/또는 피부 자극 시험, 혈액적합성 시험들은 재료 안전성을 선별하여 판단하는 좋은 후보 시험이다. 그밖에도 생체재료들에 맞게 개발하여 사용하는 세포 또는 조직 배양법(cell or tissue culture methods)이 많이 있다. 명확한 금기 사유가 없는 한, 직접 접촉 시험 및 극성 또는 비극성 추출 용매를 사용한 시험을 모두 고려하도록 한다. 이러한 선별 시험들은 재료의 생체적합성을 입증하기 위한 시험이 아니고, 대체로 부적합해 보이는 재료들을 제외시키기 위한 시험임에 유의한다.

전신 독성(Systemic toxicity)

단기간, 장기간 또는 인체 표면 또는 인체 내 지속적 적용 시 전신 독성 반응을 일으키는 의료기기의 위험은 의료기기를 용도에 맞게 사용하는 동안 상당량의 독성 물질이 제품으로부터 방출되어 전신에 퍼지는 위험과 관련된 것이다. 전신 독성(systemic toxicity)은 동물/사람 신체에 전체적으로 영향을 미치는 독성을 말한다. 전신 독성 시험에서는 실험동물을 시험 검체(test articles)의 추출액 또는 검체에 노출시킨다. 네(4) 범주의 전신 독성 시험이 존재하는데 노출 기간을 기준으로 구분한다.

– 급성 독성(acute toxicity): 화학 물질에 대한 1회의 단기간(24-72시간) 노출로 기인된 유독성
– 아급성 독성(subacute toxicity): 14-28일(1개월까지) 동안 화학 물질에 1회 용량 또는 여러 차례 용량으로 기인된 유독성
– 아만성 독성(subchronic toxicity): 최장 90일(1개월부터 3개월까지) 동안 화학 물질에 지속 노출됨에 따른 유독성
– 만성 독성(chronic toxicity):  90일 이상(통상 6개월부터 12개월까지) 동안 화학 물질에 연속하여 지속적으로 노출됨에 따른 유독성

(그림 12.1) 510(k) 허가를 위한 생체적합성 독성 시험 선택 흐름도

독성 시험은 화학적, 물리적 분석과 연관 지어 수행함으로써 바람직하지도 않은 재료를 가지고 비싼 값으로 개발하지 않도록 한다. 대부분의 의료기기는 만성 독성 시험이 필요치 않다. 필요한 시험 범주는 의료기기의 임상적 사용목적과 유사하게 정해진다고 보면 된다.

생체재료의 급성 독성의 가장 일반적 원인은 독성 물질의 존재 자체와 그 용해능력(leachability) 때문이다. 따라서 용해 물질(leachable substances)을 검출하는 것이 시험계(test systems)의 주된 관심사이다.

급성 독성 시험은 아래의 시험을 포함하여 여러 시험이 있다.

– ISO 10993-11: 전신 독성 시험(Tests for Systemic Toxicity) [역주: 식약처 관련 고시 제10장]
– OECD 423: 급성 경구 독성(Acute Oral Toxicity)
– USP <88>: 체내 생물학적 반응 시험(in vivo Biological Reactivity Tests)
– ASTM F-750: 생쥐(마우스)에 전신 주입하여 재료 용출물을 평가하는 표준 시험법(Standard Practice for Evaluating Material Extracts by Systemic Injection in the Mouse)

<표 12.2> 생물학적 시험: 생체재료

제1단계(Level I)
급성(acute) 선별 시험
(screening tests)
세포독성(cytotoxicity) 시험
USP 생물학적 시험
용혈성(hemolysis) 시험
기타 시험 자극(irritation) 시험
감작성(sensitization) 시험
이식(implantation) 시험
혈액적합성(hemocompatibility) 시험
(돌연)변이(mutagenicity) 독성 시험
생식(reproductive) 독성 시험
발열성(pyrogenicity) 물질 시험
아급성 및 (아)만성
(subchronic
and chronic)
자극(irritation) 시험
감작성(sensitization) 시험
이식(implantation) 시험
혈액적합성(hemocompatibility) 시험
생식 발생(reproductive and developmental)
독성 시험
제2단계(Level II)
만성(chronic) 이식(implantation) 시험
생식 발생(reproductive and developmental)
독성 시험
발암성(carcinogenesis) 시험
기타 제1단계에 근거한 추가 시험
(약동학(pharmacokinetics) 등)
제3단계(Level III) 임상 연구
(clinical studies)

급성 독성(acute systemic toxicity) 시험은 의료기기의 용출물(extracts) 또는 의료기기 재료를 사용하여 전신(국소(local)의 반대말) 독성 효과를 발생시키는 용해물(leachables)을 검출하는 시험이다. 시험 재료의 용출물은 음성대조군으로 사용하는 공시험액을 생쥐(마우스)에 주입한다(추출 용매에 따라 피하(intravenously) 또는 복강 내(intraperitoneally) 주사). 주입 후 독성 징후가 있는지 관찰하고 이후 네 차례 정해진 시간마다 관찰한다. 생체적합성 표에 따르면 이 시험은 모든 혈액 접촉 의료기기에 권장되는 시험이다. 체내 조직과 접촉하는 의료기기들에 대해서도 적합한 시험이 될 것이다.

아급성 독성(subchronic toxicity) 시험은 장시간 또는 여러 차례 노출될 때 잠재적으로 유해한 영향이 있는지를 판단하는 시험이며, 실험동물 수명의 10 퍼센트 이하(예: 시궁쥐(rats)[역주: 규정이나 기준규격 등에는 일본식 표기법을 크게 못 벗어나 랏드, 랫드, 랫트 따위로 표기하고 있음]의 경우 90일 이하)의 기간 동안 시험 재료 및/또는 용출물에 노출하여 시험한다. 아급성 시험에 필요한 동물 모형(animal model)[역주: 동물 모형이란 사용하는 실험동물을 지칭함]을 선정할 때에는 의료기기의 실제 사용 조건을 고려할 필요가 있다. 아급성 시험은 모든 영구(permanent) 유치 의료기기에 필요하고, 체내 조직과 연장된 기간 동안 지속(prolonged) 접촉하는 의료기기도 고려 대상이다. 아급성 전신 독성 시험은 ISO 10993-11 중에 있다.

넷째 유형의 전신 독성 시험은 발열성(pyrogenicity) 시험이다. 이는 시험 검체(test article)가 혈액과 접촉할 경우 발열 반응을 일으키는지를 판단하는 데 사용한다. 순환 혈액(circulating blood) 또는 뇌 척수액(cerebrospinal fluid)과 접촉하는 의료기기는 미국 FDA에 의해 비-발열성(non-pyrogenic)을 요구받고 있는데, 인공수정체(intraocular lenses)가 하나의 예이다. 미국에는 두(2) 가지 유형의 발열성 시험이 있다. 하나는 체외(in vitro) 시험이고 다른 하나는 체내(in vivo) 시험이다.

– 세균성 내독소(bacterial endotoxin; LAL) 시험은 세균에서 유래하는 발열 물질인 내독소를 검출하는 체외 시험이다. LAL 시험은 로트(lot) 출하 시험이며, 각각의 의료기기 또는 재료에 대한 유효성확인이 이루어져야만 한다. (USP <85>: 세균성 내독소 시험(Bacterial Endotoxins Test)/ISO 10993-11)
[역주: LAL이란 리뮬러스 아미보사이트 라이세이트(Limulus Amebocyte Lysate)의 약자로서 이는 검미목 투구게과에 속하는 투구게(horseshoe crab)의 총칭인데, 이 동물은 구리가 포함된 헤모시아닌 성분의 파랑색 혈액을 가지고 있고, 면역 체계가 단순하여 세균 등에 오염될 경우 혈액이 응고되는 성질이 있으므로, 투구게 혈액에서 추출한 단백질, 즉 LAL 단백질을 이용하여 의료기기 등의 제조 공정에 존재하는 병원성 유해물질인 내독소를 검출하는 시험이 LAL 시험임]

– 토끼 발열성(rabbit pyrogenicity) 시험은 체내 생체적합성 시험으로서 시험 재료(test materials) 또는 용출물(extracts)로부터 세균성 내독소와 재료가 매개하는 발열성물질을 검출하는 시험이다.
(USP <151>: 발열성물질 시험(Pyrogen Test)/ISO 10993-11)
[역주: ISO 10993-11은 식약처 관련 고시 제10장 참조]

세포독성 및 세포 배양(Cytotoxicity and cell cultures)

세포독성(cytotoxicity)을 포함한 세포 배양(cell culture) 시험은 다른 시험들과 함께 사용할 때 생체적합성에 대한 훌륭한 예측 수단이 된다. 세포 배양 시험은 재료로 인한 세포의 사멸(lysis)(세포사(cell death)), 세포 성장 저해, 기타 세포에 미치는 독성 효과를 판단하는 시험으로서 직접 접촉법 아니면 용해 물질(leachable substances)(용출물(extracts))을 사용하여 시험한다. 여러 가지 고도로 전문화된 세포 배양 기법은 의료기기 제조 시 또는 제조 공정에 대한 감사 실시 시 원재료(raw materials)의 생체적합성을 감시(모니터)하는 데 사용된다.

세포독성(cytotoxicity) 시험은 신속하고, 저렴하고, 신뢰성 있고, 간편하고, 민감도 높고. 재현성 있는 선별 시험으로서 시험 과정의 초기에 세포사 또는 세포 기능과 관련된 기타의 부정적 영향을 검출하는 시험이다. 시험 결과는 체내 시험을 수행하기에 앞서 생체재료를 선별하는 데 쓰인다. 만일 어떤 시료가 생체적합성 시험에서 부적합으로 판명된다면, 그 시료는 거의 90% 가량 우선 세포독성 시험에서 실패한다. 세포독성 시험은 적합-부적합(pass-fail)을 판정하는 시험은 아니다. 그러나 세포독성 시험에서의 실패는 일반적으로 이식(implantation) 시험 또는 피내 반응(intracutaneous reactivity) 시험과 같은 확인 시험(confirmatory test)을 수행하는 기초로 활용된다.

생체재료를 시험하기 위한 세포독성 시험 방법은 매우 많다. 큰 범주로 구분하면 세 종류인데, 용출물 시험, 직접 접촉 시험, 간접 접촉 시험이 그것들이다. 어떤 방법으로 수행할 것인지는 평가할 시료의 특성, 의료기기가 사용되는 부위, 사용목적에 따라 달라진다. ISO 10993-5에 규정된 세(3) 개의 체외 시험 방법은 다음과 같다. [역주: ISO 10993-5는 식약처 관련 고시 제5장 참조]

– 최소기본배지 용출 분석법(MEM(Minimum Essential Medium) Elution Assay)
[역주: 배지란 세균과 같은 미생물을 키울 수 있게끔 만든 용액을 말하며, 미생물이 자라는 데 필요한 최소한의 영양소만을 포함한 배지를 최소기본배지(또는 최소배지, 최소필수배지, 최소필수영양배지 등)라고 함]
– 직접 접촉 분석법(Direct Contact Assay)
– 한천 확산/중층 분석법(Agar Diffusion/Overlay Assay)

용출물을 사용한 평가(Evaluation using extracts)

의료기기와 재료의 용출물을 세포 배양액(예: L929 생쥐 섬유모 세포주(mouse fibroblast cell line))에 노출시켜 시험한다. 세포독성 삼출물(cytotoxic leachates)의 존재는 세포의 생활력(viability) 손실로 알 수 있다. 용출물을 사용하는 세포독성 시험 방법의 예는 다음과 같다.

– 액상 배지 조직 배양 분석법(fluid medium tissue culture assay)(MEM 용출법)은 시험 용출물에 의한 융합 단층 배양액(confluent mono-layer culture)에서의 세포 손상을 평가한다. 이 방법은 시험용 의료기기에 대하여 실제 사용 조건에 따라 또는 과장된 조건에 따라 서로 다른 용매와 용출 조건을 사용하여 수행한다. 고밀도(high-density) 재료에 적합한 시험이다. 용출액을 조제한 다음 세포층으로 이전하여 세포의 이형성(malformation), 퇴행(degeneration), 사멸(lysis)은 없는지 현미경으로 검사한다.

– 세포 증식 저해 분석법(inhibition of cell growth assay)(증식 저해 시험(Growth Inhibition Test))은 좀 더 많은 정보를 얻을 수 있는 시험이어서 시간과 기술이 필요한데, 의료용 플라스틱 또는 인공수정체 등의 평가에 사용할 수 있다. 증류수 용출물을 조직 세포 배지에 혼입하고 조직 배양 튜브에 세포를 접종(inoculate)한다[역주: 접종(inoculation)이란 미생물을 배양하기 위해서 배지에 심는 행위를 말함]. 세포를 72시간 동안 배양기(incubator)에서 배양한 후 개별 튜브에서 제거한 세포에 대하여 총 단백질 분석법(total protein assay)으로 세포 증식 범위를 정한다.

– 복제 효율 분석법(cloning efficiency assay)(집락 형성 세포독성 시험(Colony Formation Cytotoxicity Test))[역주: 집락(colony)은 발음 그대로 콜로니라고도 하는데, 미생물 배양 시 눈으로 구분할 수 있을 정도로 배양 용기에 자라고 있는 미생물들의 집단을 말함. 통상 둥근 형태의 군체를 형성.]은 한층 더 많은 정보를 얻을 수 있고, 민감도가 높고, 정량적이어서 좀 더 기술이 필요한 시험이다. 복제 효율 분석 절차와 종말점(endpoint)은 증식 저해 분석법 또는 액상 배지 분석법과 유사하지만 좀 더 정확하고, 민감하며, 직접적이다. 복제 효율 분석법(cloining efficiency assay)은 통상 중국산 햄스터 난소 세포주(Chinese hamster ovary(CHO) cell line)와 단일 세포 복제 기법(single-cell cloning technique)을 사용하여 복제 효율에 유발되는 독성 손상을 추정한다. 용출물에 대한 독성 효과는 처리된 세포의 칠(7) 연속일 배양 시의 집락(colony) 형성 능력으로 정한다. 처리된 배양액의 복제 효율과 대조군(control)의 복제율을 비교한다. 용출물의 독성을 평가하는 데에는 한천 중층 방법을 사용할 수도 있지만, 그 방법은 주로 고형 시료/검체(test sample)의 직접 접촉 세포독성 시험에 사용한다.

직접 접촉법에 의한 평가(Evaluation by direct contact)

직접 접촉하여 세포독성을 시험할 수 있는 방법은 몇 가지가 있다. 직접 접촉법(direct contact method)은 콘택트 렌즈용 고분자와 같이 저밀도(low-density) 재료에 권고되는 시험이다. 배양액에서 성장 중인 세포 위에 직접 시험 재료 조각을 놓는 방법을 사용한다. 그러고 난 다음 24시간 동안 배양기에 넣어둔다. 세포 배양 동안, 시험 재료 내의 용해 화학물(leachable chemicals)이 배양액으로 확산되어 세포층과 접촉한다. 시료/검체(test sample)의 반응 여부는 시험 재료 주변 세포의 사멸(lysis), 변성(degeneration), 이형성(malformation)에 의해 알 수 있다.

직접 접촉법은 아래의 시험을 포함하여 여러 시험이 있다.

– ASTM F 813: 의료기기 재료의 직접 접촉에 의한 세포 배양 평가 표준 시험법(Standard Practice for Direct Contact Cell Culture Evaluation of Materials for Medical Devices)
– ASTM F 895: 세포독성 선별을 위한 한천 확산 세포 배양 표준 시험 방법(Standard Test Method for Agar Diffusion Cell Culture Screening for Cytotoxicity)
– ASTM F 10-27: 정형용 재료 및 의료기기의 조직 및 세포 적합성을 위한 표준 시험법(Standard Practice for Assessment for Tissue and Cell Compatibility of On Prosthetic Materials and Devices)

간접 접촉법에 의한 평가(Evaluation by indirect contact)

한천 확산 시험(agar diffusion test)은 용출물을 사용하여 또는 직접 수행할 수 있다. 한천 중층 조직 배양 방법(한천 확산 분석법)은 고무 마개(elastomeric closure)와 같은 고밀도(high-density) 재료에 적합하다. 단층의 L-929 세포 위에 염색제(stain)가 첨가된 한천층 위에 고형 시료/검체(test sample)를 놓고 24시간 동안 배양기에 넣어 둔다. 용해 물질(leachable materials)이 한천에 확산되고 세포층과 접촉한다. 독성은 시험용 의료기기 주변의 활성 세포의 유실로 알 수 있다.

세포독성에 관한 시험의 적정성을 기하기 위해서는 반드시 한 가지 이상의 용출 시험법과 한 가지 이상의 직접 접촉법을 사용하여야만 한다.

USP 생물학적 시험

[역주: USP는 United States Pharmacoepia의 약자로서 미국 약전(藥典)을 말하며, 우리나라에는 대한약전이 있음. 약전이란 국민 보건 증진에 필요한 의약품의 제법, 성상, 성능, 품질, 저장방법의 적정을 기하기 위하여 그와 관련된 여러 가지 기준을 정한 규격서를 말함.]

생물학적 반응(biological reactivity)을 시험하기 위해 제조자는 흔히 USP 절차를 사용하여 탄성중합체(elastomer), 열가소성 플라스틱(thermoplastics), 열경화성 플라스틱(duroplastics)과 같은 중합 물질의 생물학적 위험성을 평가한다. 이 시험들은 의료기기 완제품보다는 의료기기 제조에 사용되는 재료에 주로 적용한다. 시험 종류로는 USP <87> 체외(in vitro) 생물학적 반응 시험과 USP <88> 체내(in vivo) 생물학적 반응 시험이 있다(I부터 VI까지의 플라스틱 분류에 사용). USP 시험 방법은 대체로 ISO 10993으로 대체되었지만, 플라스틱 재료에 관한 USP 시험 계열들은 ISO 10993-1에서 요구하는 평가 시험으로 대치할 수 없다.

약간 차이가 있기는 하지만, USP <87> 체외 생물학적 반응 시험은 한천 확산 시험, MEM 용출 시험, 직접 접촉 시험 등 ISO 10993-5[역주: 식약처 관련 고시 제5장 참조]에 규정된 시험을 포함한다.

USP <88> 체내 생물학적 반응 시험은 다음을 포함한다.

– 전신 주입(systemic injection) 시험 및 피내(intracutaneous) 시험은 시료/검체(sample)로 제조한 특정 용출물(extracts)을 1회 용량 주입하여 플라스틱 및 기타 중합체에 대한 실험동물의 생물학적 반응을 평가하는 시험이다.
– 이식(implantation) 시험은 시료/검체(sample)를 실험동물 조직에 이식하여 플라스틱에 대한 살아있는 조직의 반응을 평가하는 시험이다. 이 시험은 용기나 그 부속품의 제조용, 주사제 조제(parenteral preparations)용, 의료기기나 임플란트, 기타 시스템 용도로 사용하고자 하는 재료들의 적합성을 시험하는 데 쓰인다.

플라스틱 분류(class plastics) 시험(즉, USP <88>)은 네(4) 가지 용매를 하나 이상 조합하는 다양한 시험 조합으로 구성한다. 플라스틱 분류(클래스) 시험은 생체적합성 시험 프로그램에서 일정한 가치를 지닌 시험이지만, 클래스 VI 시험은 의료기기에는 거의 사용하지 않는다. 일반적으로, FDA 블루 북 메모와 ISO 10993의 경우가 미국 약전의 경우보다 전체적으로 폭넓은 관점에서 규정하고 있기 때문에 FDA에 제품 등록을 입증하는 평가 자료를 제출할 경우에는 그 자료들이 USP 자료들을 대체한다.

자극 시험(Irritation tests)

일단 체외 시험을 끝내면(예: 세포독성 시험), 의료기기의 용도를 기초로 체내 시험을 수행할 수 있다. 자극(irritation) 또는 피내(intracutaneous) 시험은 실험동물 모형(animal model) 및/또는 사람의 점막 및 피부와 같은 적당한 장소 또는 이식된 조직 부위를 이용하여 의료기기, 재료 및/또는 용출물의 자극 및 감작 능력을 추정한다. 노출 경로(피부, 눈, 점막)와 접촉 시간은 예상되는 의료기기의 임상 목적에 적합한 것으로 선택한다. 예를 들어, 제품이 콘택트 렌즈를 담는 용기라면 안(눈) 자극 시험을 수행한다.

자극 및 피내 반응 시험은 아래의 시험을 포함하여 여러 시험이 있다.

– USP <88>/ISO 10993-10/ASTM F-749: 피내 반응 시험(Intracutaneous Reactivity Test)
– ISO 10993-10/OECD 404: 진피 자극 시험(Dermal Irritation Test)(드레즈(드레이즈) 피부 자극 시험(Draize Skin Test))
– ISO 10993-10: 점막 자극 시험(Mucosal Irritation Test)(질, 항문, 구강, 음경)
– ISO 10993-10/OECD 405: 안(눈) 자극 시험(Ocular Irritation Test)(드레즈(드레이즈) 눈 자극 시험(Draize Eye Test))
[역주: ISO 10993-10은 식약처 관련 고시 제9장 참조]

피내 반응, 진피 자극, 눈 자극 시험은 가장 보편적인 세(3) 개의 자극 시험이다. 그러나, 의료기기의 사용목적에 따라서는 다른 시험 방법을 사용할 수도 있다.

피내(intracutaneous) 시험은 시험 재료로 만든 용출액(extracts)과 공시험액(blanks)[역주: 아무런 반응을 일으키지 않는 증류수로서 시험액에 대한 반응과 비교해보기 위하여 사용함]을 진피내로(intradermally) 주사하여 잠재적인 국소 자극을 탐지하는, 감별력 높은 급성 독성 선별 시험이다. 주사액 주입 부위의 홍반(erythema; redness)과 부종(edema; swelling)을 관찰하여 점수를 매긴다. 이 시험은 체외로부터 체내로 들어오거나 또는 내부 조직이나 체액과 접촉하게 되는 의료기기에 권고되는 시험이다. 생체재료(biomaterial)에서 추출되는 화학물질로 인한 국소 자극 가능성을 신뢰성 있게 검출하는 시험이다.

1차 피부 자극(primary skin irritation) 시험은 피부와 접촉하는 의료기기의 잠재적 독성을 증명하는 시험이다. 상처가 없는 또는 상처가 있는 피부와 외적 접촉하는 의료기기에 대하여 고려하는 시험이다. 시험 재료 또는 용출액(extract)은 실험용 토끼의 상처없는 피부 위 또는 마찰시켜 상처를 낸 피부에 직접 접촉시킨다. 24시간 후 시험 재료를 제거하고 접촉한 부위의 홍반과 부종을 관찰하여 점수를 매긴다.

점막 자극(mucous membrane irritation) 시험은 체외에서 상처가 없는 자연적 통로로 접근하는 또는 내부 조직과 접촉하는 의료기기에 권고되는 시험이다. 이 시험은 재료 자체보다는 용출액(extracts)을 자주 사용한다. 일반적으로 사용되는 시험은 질, 볼주머니(협낭, cheek pouch). 눈 자극 시험이다.

감작성 시험(Sensitization tests)

감작성(sensitization) 시험은 재료에 반복 또는 지속적으로 노출될 때 유해한 국소 또는 전신 효과(즉, 알러지(알레르기) 반응)를 유발하는 화학물질이 있는지 여부를 판단하는 데 도움을 주는 시험이다. 감작성은 지연된 과민성 반응(발현되는 데 며칠 정도가 걸리는 면역 반응)의 일종으로서 다양한 합병 증상으로 나타난다. 감작 능력 시험은 시험 재료에서 나오는 특정 화학물질이나 시험 재료 자체, 아니면 대부분의 경우처럼 시험 재료의 용출물(extracts)을 사용하여 시험할 수 있다. 특별히, 의료기기, 원재료, 용출물의 감작 특성을 평가하는 데에는 실험용 큰쥐(기니픽; guinea pigs)가 적합하다.

감작성 시험은 아래의 시험을 포함하여 여러 시험이 있다.

– ISO 10993-10/OECD 406/ASTM F-720: 기니픽(또는 기니피그) 극대화(또는 최대화) 시험(Ginea Pig Maximization Test)
– ISO 10993-10/OECD 406: 설치류 국소 림프절(임파절) 분석(Murine Local Lymph Node Assay)
– ISO 10993-10/OECD 406: 폐쇄 패치(첩포) 시험(Closed Patch Test; Buehler Test)
[역주: ISO 10993-10은 식약처 관련 고시 제9장 참조]

기니픽 극대화(guinea pig maximization) 시험(Magnusson-Kligman Method(마그누손-클리그만 시험법))은 체외에서 접근하거나 또는 신체 내부나 체액과 접촉하는 의료기기에 권고되는 시험이다. 시험 재료를 프로인트 완전 면역보강제(CFA: Complete Freund’s Adjuvant)와 혼합하여 피부 자극 반응을 증강한다. 재료로 만든 용출물(extracts)을 기니픽의 진피 내로 주사하고, 이후 피부에(국소적으로) 처리한다. 이 방법은 다른 시험보다 한층 민감도가 뛰어나다고 여겨지는 시험이다.

설치류 국소 림프절 분석(murine Local Llymph Node Assay; LLNA)은 자극제에 반응하여 림프구(임파구)의 수가 증가하는 것으로 판단하는 시험이다. 만일 어떤 분자가 피부 자극제(skin sensitizer)라면, 랑게르한스(랑거한스) 세포(Langerhans cells)[역주: 이자(췌장)에 있는 내분비 세포로서 인슐린, 글루카곤 따위의 호르몬을 분비하여 체내 혈당을 조절함]를 자극하여 자극 항원을 배출 림프절로 운반하고, T-림프구 증식을 유발, 이상 반응을 일으킨다. 재료 용출물(extracts)을 생쥐 피부에 처리하고, 림프구를 체외 분석하는 방법이다.

폐쇄 패치(closed patch)[역주: 액체가 잘 스며드는 솜이나 일회용 밴드에 시험액을 스며들게 한 다음 피부에 붙이고 – 패치(첩포) –  붕대로 묶는다든지 하여 고정 – 폐쇄(폐색) – 한다는 의미임] 시험은 시험 용량을 여러 개소에 국소 적용하는 방법이며, 표면 접촉 의료기기에 권고되는 시험이다.

혈액적합성 시험(Hemocompatibility tests)

혈액적합성(hemocompatibility) 시험은 혈액 또는 혈액 성분과 (직접 또는 간접) 접촉하는 의료기기 또는 재료라면 모두 적용할 필요가 있는 시험이다. 실제로 양호한 혈액적합성을 나타내는 재료들은 희소한 편이다. 정도의 차이가 있을 뿐 모든 재료가 혈액과 양립하기 어려운데 그 이유는 혈액 세포를 파괴한다거나 아니면 응고 경로(coagulation pathways)(혈전 형성(thrombogenicity)) 및/또는 보체계(complement system)[역주: 보체(complement)는 척추동물의 혈청 단백질 복합체로서 혈청 내에서 불활성 상태이지만 항원항체복합물 등에 의해 활성화되어 용혈 반응 등 여러 생물학적 반응을 일으킴]를 활성화할 수 있기 때문이다.

ISO 10993-4 표준규격[역주: 식약처 관련 고시 제4장]은 혈액 접촉 의료기기 또는 구성품에 대한 시험 평가 범주를 정의하고 있으며, 이 장의 표 12.1에는 의료기기 유형별로 수행할 필요가 있는 시험이 요약되어 있다. FDA는 그 표에 동의하고 있지 않지만, 시험에 관해서는 아무런 지침도 제공하고 있지 있다.

ISO 10993-4에 요약된 혈액적합성 시험의 다섯(5) 범주는 혈전증(thrombosis), 응고(coagulation), 혈소판(platelets), 혈액학(hematology), 보체계(complement system)(면역학)이다. 체내(in vivo) 시험인 혈전증 시험을 제외하고는 모두 체내(in vitro) 분석법이다. [역주: ISO 10993-4는 식약처 관련 고시 제4장 참조]

혈전형성(thrombogenecity)(혈전증(thrombosis)) 시험에서는 검체(test article)를 실험동물의 혈관계에 이식한다. 일정 시간 후 이식된 혈관을 제거하고, 검체에서 혈괴(핏덩이) 형성(clot formations) 유무를 관찰한다. 혈전형성 시험은 일반적으로 어렵고, 결과에 대해서도 이론이 많고, 비용도 많이 들기 때문에 제조업체는 FDA와 사전 협의하여 평가에 적합한 모형과 시험 프로토콜을 선정하도록 한다.

나머지 네(4) 개 시험은 시험관에서 진행하며, 검체가 혈액이 뭉쳐지거나 또는 응고되는 데 영향을 미치는지, 면역 반응을 조절할 수 있는지, 혈액의 세포 성분을 손상하는 것이 가능한지 따위의 특정한 활동을 평가한다.

용혈성(hemolysis) 분석은 피부 또는 점막에만 접촉하는 의료기기를 제외하고 모든 의료기기 또는 재료에 권고되는 시험이다. 이 시험은 재료 또는 재료의 용출물과 직접 접촉할 때 적혈구 세포가 파괴되는지를 측정하여 그 결과를 양성 및 음성 대조물질과 비교한다. 용혈성 시험은 신속한 시험에 속하여 실험장비도 간단하고, 시험 결과도 정략적으로 쉽게 해석할 수 있다. 용혈 능력을 측정하는 데에는 ASTM F-756 재료의 용혈성 사정 평가를 위한 표준 시험법(Standard Practice for Assessment of Hemolytic Properties of Materials)을 사용할 수 있다.

응고(coagulation) 분석법은 검체가 사람의 혈액 응고 시간에 미치는 효과를 측정한다. 혈액과 접촉하는 모든 의료기기에 권고되는 시험이다. 혈액 응고 시간에 해당하는 프로트롬빈 시간(PT: prothrombin time) 분석법은 외인성 경로(extrinsic pathways)의 응고 이상(coagulation abnormalities)을 탐지하는 일반적인 선별 시험이다. 부분 트롬보플라스틴 시간(PTT: partial thromboplastic time) 분석법은 내인성 경로(intrinsic pathways)의 응고 이상을 검출하는 시험이다.

보체 활성화(complement activation) 시험은 순환 혈액에 접촉하는 임플란트 의료기기에 권고되는 시험이다. 이 체외(in vitro) 분석법은 검체(test article) 또는 용출물(extract)에 혈장(plasma)이 노출될 때 나타나는 사람 혈장 중의 보체 활성 정도를 측정한다. 보체 활성 척도는 검체가 사람에게서 보체 유도 감염 면역 반응(complement-induced inflammatory immune response)을 유발할 수 있는지를 나타낸다.

혈소판(platelet) 시험은 얼마나 잘 응집하여 혈괴를 유발하는지를 보기 위한 시험이다. 실험동물에서 혈액 시료를 취하여 손상되지 않은 재료에 노출한다. 그 후 세제곱 밀리미터 당 혈소판 수를 측정한다.

기타 혈액 적합성 시험(예: 적혈구 안정성(erythrocyte stability), 단백질 흡수(protein absorption) 등) 과 특정 체내 시험은 재료-혈액 상호작용에 대한 사정(assessment)을 보완하는 데 필요할 수 있다.

이식 시험(Implantation tests)

이식(implantation) 시험은 이식된 의료기기 또는 재료의 국소 및/또는 전신 효과를 판단하기 위해 수행하는 시험이다. 이식 시험에서 검체(test material)는 시험 동물(test animals)의 체내 또는 적당한 조직 내에 삽입하거나 또는 유치한다. 이식 장소로 사용되는 조직은 검체에 가장 적합한 조직으로 한다. 판단하기 어려운 경우에는 근육 이식 시험을 수행한다.

이식 시험에서는 의도하고 있는 임상 사용목적과 인체 접촉 기간(예: 단기 또는 장기)을 반영하도록 한다. 중간 확인 지점을 여러 차례 두어 경과를 관찰한다. 영구 임플란트인 경우 짧게는 1-4주 동안 시험을 수행하고, 길게는 12주 이상 시험을 수행한다.

흡수 또는 생분해 재료를 시험할 때에는 평가 시점(time-point) 선택에 특히 신중을 기한다. 평가 시점은 시험 재료의 분해율(degradation rate)에 기초하여 정해야 한다는 것이다.

이식 시험의 예로는 다음의 것들이 있다.

– USP <88>/ISO 10993-6: 근육 내 이식(Intramuscular Implantation) [역주: ISO 10993-6은 식약처 관련 고시 제6장 참조]
– ISO 10993-6: 피하 이식(Subcutaneous Implantation) [역주: 식약처 관련 고시 제6장]
– ASTM F763: 임플란트 재료에 대한 단기 선별 표준 시험법(The Standard Practice for Short-Term Screening Implant Materials)
– ASTM F981: 외과용 임플란트 생체재료의 근육 및 뼈에 미치는 영향에 관한 적합성을 사정 평가하기 위한 표준 시험법(The Standard Practice for Assessment of Compatibility Biomaterials for Surgical Implants with respect to Effect of Materials on Muscle and Bone)

돌연변이성(유전독성) 시험(Mutagenicity tests (genotoxicity))

유전독성(genotoxicity) 시험은 검체가 DNA, 유전자, 염색체에 손상을 유발하여 암 또는 유전적 결손 위험을 증가시키는지를 평가하는 시험이다. 유전독성 시험은 보통 발암성 시험 또는 생식 독성 시험을 고려하기 전에 수행하는데 그 이유는 변이성과 발암성, 생식 독성 간 유의미한 상관관계가 있다고 추정되기 때문이다. 전부는 아니지만, 상당수의 발암물질(carcinogens)이 돌연변이원(mutagens)으로 알려져 있는데, 반면에 모든 변이원들이 사람의 발암인자는 아니다.

돌연변이는 DNA 한 가닥에서의 점 돌연변이(point mutation), 전체 DNA 구조에 대한 손상, 염색체(DNA 포함) 구조에 대한 손상을 포함한다. 따라서, 점 돌연변이(유전자 변이), 염색체 수 변화(이상(aberrations)), DNA 손상 증거를 연쇄적인 시험 또는 한 벌의 시험으로 간주하여 시험하도록 한다.

(30일보다 길게 신체와 접촉하고, 24시간보다 길게 체내에 머무는) 장기 노출 의료기기는 일반적으로 에임즈 시험(Ames test)과 두(2) 가지 생체 시험이 요구되는데, 후자는 보통 염색체 이상(chromosomal aberration) 시험과 생쥐(마우스) 소핵(mouse micronucleus) 시험이 된다. 신체 접촉의 위험이 덜 심각한 의료기기라면 에임즈 시험만 할 수도 있다.

ISO 10993-3 표준규격[역주: 식약처 관련 고시 제3장]은 적어도 세(3) 가지 이상의 분석법으로 유전 독성을 사정하도록 권고한다. 그 중 두(2) 가지는 시험 시스템으로 포유동물 세포를 사용하고, DNA 효과, 유전자 돌연변이, 염색체 이상이라는 세(3) 가지 유전독성 효과가 포함되도록 하고 있다. 시험 재료의 용출물 또는 용해시킨 시험 재료를 사용하여 시험할 수 있다.

변이성(유전독성) 시험은 다음을 포함한다.

– ISO 10993-3//OECD 471: 에임즈 박테리아 복귀 돌연변이 분석법(에임즈 변이 분석법)(Ames Bacterial Reverse Mutation Assay(Ames Mutagenicity Assay))
– ISO 10993-3/OECD 476: 생쥐(마우스) 림프종 분석법(Mouse Lymphoma Assay)
– ISO 10993-3/OECD 473: 염색체 이상 시험(Chromosome Aberration Test)
– ISO 10993-3/OECD 474.475: 생쥐(마우스) 골수 소핵 시험(한계 시험)(Mouse Bone Marrow Micronucleus Test(Limit Test))
[역주: ISO 10993-3은 식약처 관련 고시 제3장 참조]

에임즈 변이성(Ames mutagenicity) 시험은 가장 일반적인 시험이다. 이 시험은 다섯(5) 종의 살모넬라 티피뮤리움(salmonella typhimurium) 균주를 사용하여 점 돌연변이를 검출한다. 복귀(revertant; 역전) 세균(야생종(wild-type)[역주: 일반적으로, 돌연변이형의 반대 개념으로서 자연 상태에서 보이는 정상형을 말함]으로 되돌아간 세균)이 증식하였다면 양성 결과가 된다.

생쥐(마우스) 림프종(mouse lymphoma) 시험은 일부 손상된 유전자가 존재하는 생쥐의 돌연변이 암 세포주를 사용하는 시험이다. 이 유전자가 완전히 손상되면 변이 세포주는 생존하고 특정 화학물질이 존재하는 환경에서는 복제도 가능하다. 검체에 세포를 노출시킨 뒤 특정 화학물질이 존재하는 환경 속에서 세포를 배양한다. 만일 생활력 증가가 탐지되면 이는 검체가 유전자를 완전히 비활성화 또는 손상시킬 수 있었음을 나타낸다.

염색체 이상(chromosomal aberration) 시험은 통상 중국산 햄스터 난소(CHO: Chinese hamster ovaries) 세포를 사용하여 시험한다. 이 세포들을 가지고 유사분열(mitosis) 또는 세포 분열을 촉진시킨다. 이어 검체에 노출시킨 뒤 유사분열을 정지시키는 화학물질을 유사분열 중기(metaphase stage)에 노출시킨다. 유사분열 중기는 모든 염색체가 눈에 보이는 시기이다. 200 개 이상의 유사분열 중기 세포를 관찰하여 염색체 손상 여부를 평가한다.

생쥐(마우스) 소핵(mouse micronucleus) 시험은 체내(in vivo) 시험으로서 생쥐들을 검체(test article) 또는 용출물(extract)에 노출시킨다. 실험동물의 골수 또는 말초 혈액을 채취하여 소핵 존재 유무를 평가한다. 소핵은 염색체 또는 염색체 조각으로 구성되며, 염색체 손상의 지표이다.

보충 시험(Supplemental testing)

보충 시험은 생식 독성 시험, 발암성 평가, 분해성 연구를 포함한다. 이들은 장기간 시험으로서 상당한 예산이 필요하다.

발암성 시험(Carcinogenicity testing)

발암성 시험(carcinogenicity testing)은 실험동물 수명(예: 시궁쥐(rats)는 2년, 생쥐(mouse)는 18개월, 개(dogs)는 7년)에 상당하는 장시간에 걸쳐 의료기기, 재료 및/또는 그 용출물에 1회 노출 또는 여러 차례의 노출될 경우의 종양형성(tumorigenic) 가능성을 판단하기 위한 시험이다.

의료기기의 발암성 시험은 고 비용 시험이기 때문에 제조자는 여러 근거 자료로부터 발암 유도 경향성이 보이는 경우에 시험을 수행한다. 발암성 시험을 고려할 필요가 있는 상황은 다음과 같다.

– 흡수 기간이 30일 이상인 흡수성 재료와 의료기기로서 독성동태학(toxicokinetics)적 근거, 사람에게 사용한 데이터가 없거나 노출과 관련하여 유의미하고 적절한 데이터가 없는 경우

– 유전 독성 시험 결과가 포유류의 세포와 생체 내에서 모두 양성으로 판정된 재료와 의료기기
– 인체 및/또는 체강cavities)에 삽입되어 30일 이상 영구 또는 누적(cumulative) 접촉되는 재료 또는 의료기기로서 사람에게 사용한 유의미하고 적절한 이력이 없는 경우

발암성 시험에는 다음이 포함된다.

– ISO 10993-3: 유전성, 발암성, 생식 독성 시험(Tests for Genotoxicity, Carcinogenicity, and Reproductive Toxicity) [역주: 식약처 관련 고시 제3장]
– OECD 451: 발암성 연구(Carcinogenicity Studies)
– OECD 453: 만성 독성/발암성 병행 연구(Combined Chronic Toxicity/Carcinogenicity Studies)

생식 발생 독성(Reproductive and developmental toxicity)

생식 발생 독성(reproductive and developmental toxicity) 시험은 의료기기, 재료 및/또는 그 용출물이 생식 기능, 배 발생(최기형성(teratogenicity[역주: 한자로 催奇形性으로서 생체에 섭취 또는 흡수되어 배아 또는 태아의 기형 또는 이상 발육을 유발하는 특성을 말함)), 태아기와 출생 후 초기 발생에 어떠한 잠재적 영향을 미치는지를 평가한다.

생식 이상은 남성과 여성 모두에게 영향을 미치며, 그 범위는 생식 능력의 미미한 감퇴로부터 완전 불임에 이르기까지 광범하다. 최기형성은 물질의 유해 효과가 배 발생과 태아에게 영향을 미침을 말한다. 독성 효과로 인해 자녀가 사망할 수 있고, 출생 시 체중 감소와 같이 미미한 상태를 포함, 질병을 겪을 수도 있다.

생식 독성 시험은 일반적으로 다음과 같은 의료기기가 고려 대상이다.

– 자궁 내 피임기구(IUDs; intrauterine devices) 또는 생식 조직 또는 배아와 직접 연락될 수 있는 장기간 신체 접촉 의료기기
– 에너지[역주: X선과 같은 방사선 에너지 따위] 투입 의료기기
– 흡수(resorbable) 또는 용해(leachble) 재료 및 의료기기

생식 발생 독성 시험은 다음을 포함한다.

– ISO 10993-3: 유전성, 발암성, 생식 독성 시험(Tests for Genotoxicity, Carcinogenicity, and Reproductive Toxicity) [역주: 식약처 관련 고시 제3장]
– OECD 414: 최기형성(Teratogenicity)
– OECD 415: 한(1) 세대 생식 독성 연구(One-Generation Reproduction Toxicity Study)
– OECD 421: 생식/발생 독성 선별 시험(Reproduction/Development Toxicity Screening Test)

생분해성(Biodegradation)

의도한 또는 의도하지 않은 재료의 분해(degradation) 가능성에 대한 신중한 고려는 의료기기의 생물학적 안전성 평가에 필수적이다.

ISO 10993-9 표준규격의 부속서(Annex) A에 따르면, 다음과 같은 경우에 분해 시험(degradation studies)을 고려한다.

– 의료기기가 생체에 흡수되도록(bioresorbable) 설계된 경우
– 의료기기가 30일 이상의 기간 동안 이식되는 경우
– 재료 시스템(material(s) system)에 대한 정보에 입각하여 고려할 때 인체와 접촉하는 동안 독성 물질이 방출될 수 있는 징후가 있는 경우

생분해성(biodegradation) 시험은 제품 또는 재료가 얼마나 인체에 흡수되는지를 파악하고, 이후에 제품 또는 재료가 체내에 흡수되는 과정을 추적하여 시간에 따른 효과를 판단한다. 분해 산물(degradation products)은 기계적 방식이나 피로 하중(fatigue loading)에 의해 및/또는 환경과의 상호작용 또는 복합작용에 의해 의료기기로부터 방출되는 등의 여러 방식으로 생성될 수 있다. 분해 산물에 대한 생물학적 내성(tolerability)은 그것들의 성질과 농도에 따라 다르기 때문에 일차적으로 임상 경험 및 집중 연구를 통해 사정(assess) 평가하도록 한다.

생분해성 시험은 다음을 포함한다.

– ISO 10993-9: 잠재적 분해 산물의 확인과 정량을 위한 체제(Framework for Identificaton and Quantification of Potential Degradation Products) [역주: 식약처 관련 고시 제8장]
– ISO 10993-13: 고분자 소재 의료기기에서 얻어진 분해 산물의 확인과 정량(Identification and Quantification of Degradation Products from Polymeric Medical Devices) [역주: 식약처 관련 고시 제12장]
– ISO 10993-14: 세라믹 소재에서 얻어진 분해 산물의 확인과 정량(Identification and Quantification of Degradation Products from Ceramics) [역주: 식약처 관련 고시 제13장]
– ISO 10993-15: 금속과 합금 소재에서 얻어진 분해 산물의 확인과 정량(Identification and Quantification of Degradation Products from Metals and Alloys) [역주: 식약처 관련 고시 제14장]
– ISO 10993-16: 분해 산물과 용해물에 관한 독성독태시험(Toxicokinetic Study Design for Degradation Products and Leachables) [역주: 식약처 관련 고시 제15장]

 

의료기기 임상평가 (1-4), (1-5)

의료기기 임상평가 (1-4), (1-5)

4. 임상 연구 계획의 요소(Elements of a Clinical Investigation Plan)

 

임상 조사 연구는 관찰 연구와 분석 연구의 둘로 분류할 수 있다. 관찰 연구(observational study)란 실험에 참여한 또는 치료를 받은 피험자에 관한 데이터를 수집 및 분석하도록 설계한 연구로서 대조군을 사용하지는 않는다. 임상시험연구자(investigator)가 데이터를 수집, 기록, 분석하여 가설을 수립 또는 검정하는 것이다. 관찰 연구의 설계 예로는 하루하루의 강수량과 온도 기록 데이터 수집, 영양 섭취에 관한 조사, 전국적인 암 발생률 데이터 수집 등이 있다. 관찰 연구는 실험적 접근법(experimental approach)이 현실성이 없거나 또는 불가능할 때 유효하다.

분석 연구는 가설 검정 시험으로서 코호트(cohort)*에 구체적인 치료방법을 적용하고, 그 후속적 효과를 평가하는 방식으로 조사한다. 분석적 임상 시험 설계의 이상적 표준(gold standard)은 전향적 맹검 연구를 대조군과 동시 병행하는 시험(prospective randomized study with concurrent control group(s))이다. 독자들이 이와 관련된 좋은 자료를 찾아서 구체적 내용을 상세히 공부한다면 임상 연구 계획, 수행, 분석 원리를 좀 더 잘 파악할 수 있을 것이다. 의약품의 관점에서 저술한 자료를 공부하더라도 상관없다. 좋은 임상 연구 설계의 원칙은 의약품이나 의료기기 모두에 동등하게 적용되기 때문이다.[12]-[16]

통상, 의료기기 시험용 임상 프로토콜에는 의료기기에 대한 설명, 환자에 대한 위험 분석, 시험의 설계, 수행, 분석 내역 등 계획된 임상시험에 대한 관련 정보를 포함시킨다. 표 3에 임상 시험 계획에 포함시킬 필수 요소 목록을 보인다. 이들 각각에 대해서는 이하에 논의하는데, 특별히 의료기기에서 문제가 될 만한 내용에 대해서는 강조하고자 한다.

* 용어설명: 코호트(cohort)

코호트는 한 집단의 사람을 일컫는 임상시험 용어로서 일정한 기간 동안 (이를테면 그 기간 동안 태어났다든지, 그 기간 동안 어떤 약을 복용했다든지 또는 주사를 맞았다든지 하는 등의) 공통된 특성이 있거나 또는 그러한 공통의 경험을 한 사람들을 말한다. 말하자면, 1948년의 어느 날 또는 어느 기간에 태어난 사람 집단이 있다고 할 때 이들은 출생 코호트를 형성한다고 말한다. 이들과의 대조군은 동일 코호트 내의 일반인들일 수도 있고, 조사하고자 하는 약물 등을 거의 사용하지 않았거나 또는 전혀 사용하지 않은 사람들의 코호트일 수도 있는데, 물론 후자의 경우 약물 등의 사용과 관련된 것 이외의 모든 사항은 동일해야 한다. 또한, 코호트 내의 하위집단 각각을 상호 비교할 수도 있다.

[출처: 영문 위키피디아(http://en.wikipedia.org/wiki/Cohort_study), 2010년 3월 22일 수정판]

A cohort is a group of people who share a common characteristic or experience within a defined period (e.g., are born, are exposed to a drug or a vaccine, etc.). Thus a group of people who were born on a day or in a particular period, say 1948, form a birth cohort. The comparison group may be the general population from which the cohort is drawn, or it may be another cohort of persons thought to have had little or no exposure to the substance under investigation, but otherwise similar. Alternatively, subgroups within the cohort may be compared with each other.

[source: http://en.wikipedia.org/wiki/Cohort_study,  last modified on 22 March 2010]

표 3 – 임상 연구 계획 요소(Elements of the Investigational Plan)

  의료기기 설명(Device description) 
  연구 목표(Study objective)
  연구 설계(Study design)
  치료 계획(Treatment regimen)
  대조군(Control group)
  종점 평가(Endpoints evaluated)
    유효성(Effectiveness)
    안전성(Safety)
  가설 검정 연구인 경우, 시험 성공에 대한 정의(Definition of trial success)
  연구 절차 및 기간(Study procedures and duration)
    치료 선별 및 배정(Screening and assignment to treatment)
    평가 및 추적검사(Assessments and follow-up) 
    해당될 경우, 훈련 절차(Training procedures)
  표본 크기 계산(Sample-size calculations)
  데이터 분석 계획(Data analysis plan)
  위험 분석(Risk analysis)
  증례 보고서 양식(Case report forms)
  동의서 양식(Informed consent forms)
  연구 장소 및 IRB 정보(Investigational site(s) and IRB information)
  (선택사항) 데이터 안전성 감시 위원회(Data safety monitoring board)
  평가 계획(Monitoring plan)

 

4.1 의료기기 설명(Device Description)  

피시험 제품에 대한 설명으로서 충분한 정보를 임상시험연구자(investigator)에게 제공하여 의료기기의 설계 내역을 이해하고, 제품 설계의 근간이 된 기초자료(전임상 시험(preclinical testing) 자료 등), 의료기기 성능 규격, 사용 목적, 사용 방법 등을 이해할 수 있게끔 한다.

4.2 연구 목표(Study Objective)

임상 연구 설계에 앞서, 연구를 통하여 얻어내야 할 답변에 대한 질문을 명료하게 정리할 필요가 있다. 프로토콜의 목표를 요약문 등의 형식으로 기재하는데, 다음의 네 가지 내용을 알 수 있도록 작성한다.

  1. 피시험 제품(The product tested)

  2. 무엇을 치료하자는 것인지, 치료해야 하는 증상 등의 적응증(The indication for use)

  3. 주된 치료 결과 척도(The primary outcome measure)

  4. 질환의 단계 등과 같은 피험자의 특징(The subject characteristics)

4.3 연구 계획(Study Design)

임상 연구 계획에는 연구를 전향으로 할지 또는 후향으로 할지, 비맹검(open-label; nonblinded)으로 할지 또는 통제를 적용할지, 한 기관에서 할지 또는 여러 기관에서 할지 등을 기술한다. 통제를 적용한 가장 단순한 설계는 두 개의 피험군을 사용하는 방법이지만, 통제 시험에는 여러 가지 변형된 형태가 가능하다(예를 들면, 교차(crossover) 연구, 연속(sequential) 연구 등). 피험군이 2 개 이상이면 다치료군 시험(multiple-arm trial)이 되므로 가짜 대조군(sham control group)과 실제 대조군(active control group)을 사용하는 등의 설계가 가능하다. 일반적으로 가장 좋은 방법은 가장 덜 복잡한 설계 방법을 선택하여 성공적으로 시험 목표를 달성하는 것이다. 임상 시험 설계에 대하여 더 상세히 공부하려면 스필커의 교과서를 참고한다.[12]

4.4 연구 모집단(Study Population)

피험자의 임상 상태를 표현하는 것 외에도 임상시험연구자에 따라서는 종종 나이, 성, 인종과 같은 인구학적 기준을 기재한다. 경제적 상태 또는 교육 수준도 도움이 될 경우가 있는데, 예를 들어 약국 등 시중에서 구매하는 체외진단기기인 경우에는 표시사항이나 사용설명서의 숙지 여부를 평가할 필요가 있으므로 유용할 수 있다. 특정한 피험자를 넣고 빼는 기준을 명확하게 세우는 일은 피험자 범위를 정밀하게 조정하는 중요한 수단이기 때문에 관리되지 않는 변수들의 영향을 최소화하고, 유효성과 안전성의 종점에 미치는 변동성을 최소화하는 데 도움이 된다. 미국 FDA 허가를 얻기 위한 임상시험 본 시험(pivotal clinical trial)에서는 환자 모집단의 정의가 중요한데 그 이유는 일반적으로 PMA 허가 내역에는 표시사항(label)이 포함되고, 그 표시사항의 효능․효과는 임상시험에서 평가된 것과 같은 환자 집단에 적용할 때 유효하기 때문이다.

4.5 치료 계획(Treatment Regimen)

임상연구에서 행하는 개입(intervention)의 본질적 양태는 의료기기에 관한 설명, 사용지침(instructions for use; 보통 IFU라는 약자를 잘 사용함), 수반되는 또는 관련된 절차와 치료법 등에 나타난 모든 내용을 포함한다. 외과 수술 시험인 경우, 수술이 이루어지는 모든 장소에 임상시험연구자가 참여하여 사용하고자 하는 수술 절차에 대하여 가능한 한 최대 한도로 일치된 의견을 형성하는 게 특히 중요하다. 또한, 시험이 진행되는 모든 장소에서의 절차를 통일하고, 그렇게 될 수 있게끔 임상시험연구자와 보조인력들을 훈련하는 것이 변동성을 줄이고 장소에 따른 편이를 줄이는 데 가장 중요한 두 가지 요소이다. 또한, 정말 새로운 개념의 신개발 의료기기인 경우, 그래서 임상시험연구자들이 그에 대하여 판단할 수 있는 경험 요소를 전혀 갖고 있지 않을 때에는 연속하여 진행될 절차를 임상시험연구자의 경험의 함수로서 계층화하여 탐색기간(prespecified run-in period)을 미리 정해둠으로써 학습곡선(learning curve)이 의료기기의 성능 판단에 미치는 영향을 평가할 수 있게끔 한다.

4.6 대조군(Control Group)

대조군은 의료기기의 안전성 및 유효성을 가늠하는 비교 대상으로서 이를 통하여 임상시험연구자들은 정의된 환자 모집단에서 해당 의료기기의 효과가 임상적으로 유의한지를 추정할 수 있다. 정의에 의해, 대조군은 환자 또는 피험자 집단을 가리키며 이들에게는 해당 의료기기를 적용하지 않거나, 아니면 그것을 사용한 치료를 하지 않는 집단을 말한다.

대조군에는 크게 두 개의 범주가 있는데, 하나는 동시병행 대조군(concurrent controls)이고, 다른 하나는 비동시병행 대조군(nonconcurrent controls)이다. 동시병행 대조군은 비교하고자 하는 환경(control exposure)에 놓아둔 피험자로서 이들을 실험군과 동시에 비교 관찰한다. 대조 환경(control exposure)이라 함은 치료를 전혀 하지 않는 경우, 가짜(placebo)를 가지고 치료하는 경우, 대안이 되는 치료법 또는 의료기기를 가지고 치료하는 경우 등을 말한다. 임상시험에서는 동시병행 대조군을 사용하는 게 언제나 최우선적 선택이 된다. 왜냐하면 동시병행 대조군을 사용하면 피험자를 대조군과 치료군으로 무작위화할 수 있기 때문에 선택 편이를 배제할 수 있고, 혼동 변수들을 제어할 수 있기 때문이다.

비동시병행 대조군은 실험군과 동시에 비교 관찰하지 않는 피험자를 말한다. 가장 일반적인 비동시병행 대조군은 과거 대조군(historical control group)으로서 이 대조군은 이미 과거에 관찰, 치료, 연구, 보고된 코호트(cohort)로 구성된다. 하지만, 과거 대조군은 매우 조심스럽게 사용해야 하는데, 대개의 경우 과거 데이터 집합의 질적 수준은 변동성이 크고, 신뢰할 수 없는 경우도 있기 때문이다. 또한, 과거의 코호트에 포함된 피험자들은 인구학적 특성 또는 질병의 상태라는 측면에서 치료군 내의 피험자들과는 비교하지 못할 수도 있고, 무작위화를 통한 혼동 변수 통제도 불가능하다는 단점이 있다. 게다가 의학 치료의 종류와 성공률은 시간이 지남에 따라 개선되고 있기 때문에 과거의 코호트를 비교 대상으로 얻은 긍정적인 평가는 자못 임상시험의 결과를 왜곡할 가능성도 있는 것이다.

적절한 대조군을 선택하는 방법은 임상시험 목표에 따라 정해야 하겠지만, 그와 같은 결정은 타당한 근거, 윤리적이고 실제적인 제약조건들에 의해 뒷받침되어야 할 것이다. 과학적 관점에서 보아 이상적인 대조군임에도 불구하고 논리적인 또는 윤리적인 이유(예를 들면, 수술을 요하는 임상시험에서 가짜 수술(sham-operated control)을 사용하는 경우) 때문에 그것이 항상 실현 가능한 선택이 될 수 없음이 그리 드문 일이 아니기 때문이다. 그렇기 때문에 임플란트 의료기기의 경우, 만일 대안이 될 만한 의료기기 또는 시술법이 없다면, 환자 자신을 대조군으로 사용하는 연구도 잘 제어된 임상연구가 될 수 있는 것이다. 또한, 과거 대조군을 사용하는 경우는 데이터 집합의 품질이 신뢰할 수 있고 타당한 경우에 한하여 사용하여야 할 것이며, 연구 중인 질환의 발병기전을 잘 이해하고 있는 경우에만 사용하여야 할 것이다. 또한, 과거 대조군은 임상시험이 목표로 하는 한계를 일정하게 제한하고 있는 경우(예를 들어, 타당성 연구 등으로)에 사용하기도 한다.

4.7 유효성 및 안전성 종점(Effectiveness and Safety Endpoints)

임상시험연구계획서, 즉 프로토콜에는 의료기기의 유효성을 평가하여 확정할 임상적인 종점(clinical endpoint)을 명시하여야 한다. 1차적인 유효성 평가항목, 즉 주된 유효성 종점(primary effectiveness endpoint)의 선택은 임상시험의 성공에 있어서 중요한 요소이다. 적합한 종점이라 함은 임상적으로 유의미한 결과(clinically significant outcome)를 말하며 이는 타당한 검증방법을 사용하여 측정할 수 있는 것이어야 한다. 가설 검정 연구의 경우, 비교 대상과 대조할 때 차이의 정도가 뚜렷하게 커서 삶의 질, 질병의 진전, 진단 또는 경감 등의 측면에서 환자에게 유의미한 변화가 나타나는 것이어야 한다. 또한, 비록 대부분 단일한 1차 종점(single, primary endpoint)을 사용하기는 해도, 일부의 경우에는 달성 목표에 여러 개의 1차 종점(multiple primary endpoint)을 포함시켜, 두서너 개의 척도를 통하여 임상적으로 유의한 응답이 얻어졌음을 입증하기도 한다. 부수적 유효성 평가항목, 즉 2차 종점(secondary endpoints)은 추가적인 데이터를 제공하는 기능을 담당하여 제품이 표방하는 주장을 뒷받침하고, 유효성을 확인하며, 비용상환(reimbursement) 전략을 수립하는 데 도움을 줄 수 있다.

이와 관련, 피연구 의료기기의 개입(intervention)과 연관된 안전성이나 유해 사고(adverse events)와 같은 데이터들은 가능한 한 폭넓게 수집하여야 한다. 그런데, 해당 의료기기에 대한 과거의 임상 경험 그리고/또는 전임상 연구 데이터 등이 있으면 오히려 그러한 경험 때문에 현재의 임상시험에서 과거의 데이터와 관련된 특정한 안전 문제를 지나치게 강조하는 경향이 있다. 그러나, 이렇듯 표적으로 삼고 있는 평가항목이 있다손 치더라도 그것이 관찰되는 모든 유해 사고 데이터를 수집할 필요는 없기 때문이 아니므로, 의료기기와 관련된 사고인지 아닌지와 무관하게 관련 데이터는 모두 수집하여야 한다.

4.8 시험 성공의 정의(Definition of Trial Success)

만일 임상시험이 가설 검정 연구라고 할 때 그 시험은 치료군과 대조군 간 임상적으로 의미 있는 차이를 검출할 수 있는 임상시험이다. 이는 보통 해당 의료기기가 기준 값(baseline value) 그리고/또는 대조군의 응답(control group response)에 비하여 효과가 있다는 결론에 맺기에 충분한 크기의 임상 결과로서 표현한다. 그런데, 미국에서는 의료기기의 유효성을 입증할 때 새로운 의료기기가 기존의 의료기기보다 우월함을 입증하는 결과를 제시하라고는 요구하지 않는다. 그 대신에 기준이 되는 대안적 치료 방법보다 제품의 성능이 더 나쁘지만 않다면 승인할 수 있는 것으로 본다.

4.9 연구 절차 및 기간(Study Procedures and Duration)

연구 수행 항목과 기간을 기술하는 부분으로서 선별 절차(screening procedures), 초기의 환자 검사 항목, 추적검사를 위한 방문 일정 및 절차, 시험 중단 절차 등을 포함한다. 개입 치료에 피험자를 배정하는 절차(즉, 무작위 배정 계획(randomization scheme))도 포함하지 않으면 안 된다. 

또한, 표준 훈련 절차(standardized training procedures)에 따라 의료기기의 사용법을 익히는 일은 잘 제어된 임상 연구에서 중요한 부분이다. 훈련 프로그램이 임상시험의 엄밀성(rigor)을 향상시켜 편이(bias)를 최소화할 뿐더러, 종종 개인의 숙련도와 분별력의 차이로 말미암아 유래하는 혼동 변수가 의료기기 성능에 미치는 영향을 최소화해 주기 때문이다. 사용자에게 제공하여야 하는 훈련의 범위는 임상시험마다 다른데, 너무 광범한 훈련을 제공하게 되면 제조업체가 마케팅을 개시할 때 제공하게 되는 훈련 범위를 문제시할 수 있다. 일부 임상시험(예: 약국 등에서 구입하는 체외진단용 의료기기)에서는 실제 사용 조건을 모의하기 위하여 의료기기에 대한 사용법 훈련을 하지 않는 게 적합할 때도 있다. 

4.10 표본 크기 계산 및 데이터 분석 계획(Sample-Size Calculation and Data Analysis Plan)

가설 검정 연구에 포함시켜야 하는 피험자 수는 표본 크기 계산에 의해 정당화되어야 하는데, 이는 통계적 검정력(statistical power)을 나타내 주는 요소가 된다. 표본 크기를 계산하기 위해서는 먼저 사용하고자 하는 통계학적 모형에서 규정하고 있는 피험자 수를 정의하는 게 필요하다. 보통 이러한 요인들은 검증하고자 하는 의학적 개입을 통하여 어느 정도로 예상하는 결과가 산출되었는지, 그 결과를 측정하는 척도의 변동성은 얼마나 되는지, 연구를 통한 희망 검정력(보통 80%)은 얼마나 되는지, 통계학적 유의성(대개의 경우 95%)은 얼마인지 등을 포함한다. 수집한 데이터 분석을 위한 통계학적 접근법은 데이터 분석 계획에 기술한다. 이 부분에 잘 대처하기 위해서는 통계학 전문가의 자문을 받거나 협력을 얻는 게 필요하다.

4.11 위험 분석(Risk Analysis)

위험 분석은 피험자에 대한 잠재적인 위험과 이익을 상술함으로써 동의서 작성에 필요한 정보를 제공하고, 환자에 대한 위험이 얼토당토않은 내용은 아님을 뒷받침한다. 위험 분석에 포함되는 내용으로는 위험을 피하기 위한 대안적 절차, 잠재적인 고장 형태, 피험자에 대한 위험을 최소화하기 위하여 의료기기와 임상 시험을 설계할 때 취해진 여러 조치들, 환자에 대하여 예상되는 이익의 근거 등이 있다.

4.12 동의서 양식(Informed Consent Forms)

피험자에게 주는 동의서 자료는 치료 절차와 그로 인한 잠재적인 위험에 관한 완전한 정보가 담겨 있어야 할뿐더러 읽기 쉽고 이해하기 쉬워야 한다. 이러한 동의서 양식에는 피험자의 연구 참여는 자발적이라는 것, 연구 참여에 따른 기지의 그리고 잠재적인 위험과 이익, 연구에서 요구하고 있는 모든 사항에 피험자가 스스로의 의지로 참여한다고 하는 내용들이 명시되어야 한다. 전세계적으로 규제당국들은 임상시험피험자(clinical trial subjects)에게 연구에 적합한 동의서를 받도록 하고 있다.[17]-[19]

4.13 증례 기록서 양식(Case Report Forms)

각 임상시험마다 증례 기록서 양식을 구비하여 연구 프로토콜에 따라 각 피험자에게서 수집한 데이터를 기록하여야 한다. 이 양식은 피험자 선별(subject screening), 수술 정보(operative information), 수술 후 그리고 추적검사를 위한 방문 데이터(postoperative and follow-up visit data), 유해 사고 보고서(adverse events reports), 피험자 참여중지 양식(subject withdrawal forms) 등에 관한 정보를 포함한다.

4.14 연구 기관 및 기관 내 임상시험윤리위원회 승인(Investigational Site(s) and Institutional Review Board Approvals)

연구 계획에는 연구가 이루어지는 장소를 명시하고, 임상시험연구자의 자격 정보를 기재하여야 하며, IRB 승인 절차, IRB 승인 기록 등을 포함한다.

4.15 임상시험연구자 안내서(Investigator’s Brochure)

임상시험연구자 안내서의 목적은 임상시험연구자가 해당 의료기기와 관련된 위험(risks)과 유해 작용(adverse reactions)에 대하여 철저히 이해하도록 하기 위한 것으로서, 해당 의료기기에 대한 상세 설명을 포함하여 기능에 대해서도 이해할 수 있도록 한다. 임상시험연구자 안내서에 포함되는 주제로는 다음의 내용들이 있다.

  1. 문서 개요(A summary of the literature)

  2. 이전의 임상 연구 개요(A summary of previous clinical research)

  3. 의료기기 설명(A description of the device)

  4. 위해 내역과 위험 분석(Device hazards and risk analysis)

  5. 의료기기 성능 및 전임상 시험(Device performance and preclinical testing)

  6. 피험자에게 예상되는 위험(Anticipated risks in human subjects)

  7. 보고된 유해 사고(Reported adverse events)

4.16 데이터 안전성 감시 위원회(Data Safety Monitoring Board)

경우에 따라서 임상시험의뢰자(sponsor)는 데이터 안전성 감시 위원회를 설립하여 전문가들로 하여금 임상 연구에서 발생되는 안전성 데이터를 지속적으로 평가하게끔 한다. 이는 심각한 이환율(morbidity) 또는 치사율(mortality)이 예상되는 임상 연구 또는 그러한 의료기기에 대한 임상 시험 초기에 보편적으로 많이 사용된다. 그 중의 어떠한 경우이든지 연구와 함께 안전성 데이터 감시를 진행할 때에는 눈가림(맹목)을 적용하고, 예기치 않게 임상시험을 조기 종료할 수밖에 없는 유해한 결과가 발생하지 않도록 임상시험연구자에게 경고할 수 있는 감시 체계를 갖춤으로써 환자에 대한 위험을 최소화되도록 꾸며야 한다. 또한 그와는 달리, 치료를 진행하면서 예상치 않게 뚜렷한 효과를 나타낼 때에는 임상시험을 조기 종료하기도 하는데, 치료군에 주어지는 이득이 분명히 나타났는데도 연구를 계속 진행하는 것은 비윤리적일 수 있기 때문이다.

4.17 감시 계획(Monitoring Plan)

임상시험 감시 계획은 임상시험의뢰자(sponsor) 또는 그 대리인(representative)이 수행하여야 할 절차를 정의한 내용으로서 연구 수행 활동의 품질 보증(quality assurance)에 해당한다. 감시 계획은 임상연구가 프로토콜에 규정된 절차에 따라 수행되었는지를 보증하는 역할을 하는 것이다. 용의주도하게 설계 및 실행하여야 하는 감시 계획의 중요성은 재삼 강조해도 지나치지 않는다. 왜냐하면 좋은 감시 계획은 임상시험에서 얻어진 데이터가 유효하다는 것과 연구 수행 중 중대한 문제가 발생되더라도 조기에 식별할 수 있음을 보증할뿐더러, 임상연구에 대한 규제당국의 사후 감사가 만족스러울지를 보증하는 지표가 되기 때문이다.

 

5. 맺음말(Conclusions)

 

잘 관리된 의료기기 임상시험은 신제품의 판매 전 평가를 위한 표준이자 이미 출시된 기존 제품의 체계적인 성능 평가를 위한 표준으로서 산업계에 자리 잡고 있다. 또한, 의약품 임상시험에 쓰이는 좋은 임상연구 설계의 기본 원리들이 의료기기의 임상시험 설계에서도 최적의 기반이 된다. 물론, 의료기기의 전향, 분석 연구(prospective, analytical study)에서는 임상시험의 전략 수정을 불가피하게 만드는 편이(bias) 및 혼동요인(confounders)이 발견되는 게 일반적이지만, 창의적인 방법 또는 대안적인 방법을 사용함으로써 엄밀한 연구가 이루어지도록 할 수 있다. 이와 관련, 성공적인 임상연구의 요인을 꼽으라면 주도면밀한 계획에 입각하여, 검정 가능한 가설을 명확하게 제시하고 다음의 세 가지 내용을 잘 선정하는 게 관건이라고 할 것이다.

  1. 필요로 하는 분석 결과를 뒷받침할 수 있는 연구 설계(A study design) 

  2. 연구에 적합한 대조군(A suitable control group)

  3. 객관적이고, 타당하며, 임상적인 연관성을 나타낼 수 있는 1차 결과 척도(Primary outcome measures)

그리고, 중요하게 기억할 사항으로는, 의료기기의 안전성 및 유효성과 관련된 일부 문제들인 경우, 제어된 전향적 임상 연구(prospective, controlled clinical studies) – 특히, 이식 의료기기 연구에서는 쉽게 답을 얻을 수 없다는 점이다. 이와 관련하여 특기하자면, 이러한 문제들은 실험실 검사(bench testing), 동물 시험(animal studies), 의료기기 회수 분석(device-retrieval analysis), 관찰 연구(observational research) 등으로부터 얻은 데이터를 조합함으로써 생체 내에서의 성능 발휘(anticipated durations of in vivo performance) 예상 기간, 고장 형태(failure mode), 이식 재료의 경시 변화(long-term fate of implanted materials) 등을 일정한 신뢰도 범위 내에서 확인하는 방식으로 대처하여야 할 것이다. 

 

참고문헌(References)

[12] Spilker, B. and Schoenfelder, J. 1990. Presentation of Clinical Data. Raven, New York.

[13] Food and Drug Administration, Center for Drug Evaluation and Research. 1998. Guideline for the Format and Content of the Clinical and Statistical Sections of an Application. Rockville, MD, pp. 1-125.

[14] Minert, C.L. 1986. Clinical Trials. Design, Conduct, and Analysis. Oxford University Press, New York.

[15] Food and Drug Administration. 1995. International conference on harmonization. Draft guidelines on good clinical practice. Fed Regist. 60:42,948-42,957.

[16] Committee for Proprietary Medicinal Products. 1994. Biostatistical Methodology in Clinical Trials in Applications for Marketing Authorization for Medicinal Products. Document No. III/3630/92-EN. European Commission, Directorate-General III, Brussels.

[17] Food and Drug Administration, 2004. Protection of Human Subjects. 21 CFR §50.

[18] Declaration of Helsinki. World Medical Assembly, Helsinki, Finland, 1964; 1975; 1983.

[19] CEN. European Committee for Standardization. 1993. Clinical Investigation of Medical Devices for Human Subjects. Document No. EN 540; 1993 E. European Standard, Central Secretariat, Brussels.

 

의료기기 임상평가 (1-3)

의료기기 임상평가 (1-3)

3. 제품 개발에서의 임상 연구의 역할(The Role of Clinical Studies in Product Development)

 

임상 연구를 하는 가장 보편적인 추동력이라면 제품 판매에 앞서 연구용 의료기기가 안전하고 효과가 있음을 입증하는 것이라고 할 수 있다. 이는 미국 내에서 그리고 대부분의 국제 시장에서 임플란트 및 고위험(SR: significant risk) 의료기기를 등록할 때 요구되는 사항이다. 고위험(SR) 의료기기는 사람의 건강, 안전, 안녕에 심각한 위험을 가져올 가능성이 있는 제품으로서 임플란트 또는 생명유지용 제품(life-sustaining products)이 가장 대표적인 것들이다.[9] 임상 연구의 목적은 실험실 그리고/또는 동물 시험에서 얻은 데이터를 확인하고, 검증하고, 보완하는 것이다. 임상 연구는 보통 새로 설계한 제품, 신기술 적용 제품 그리고/또는 적응증을 새롭게 추가한 제품을 지원하기 위하여 수행한다. 그러나, 신중하게 고안된 임상 연구는 고위험 의료기기가 아닌 제품의 개발과 판매를 향상하는 역할을 하기도 한다. 물론, 그러한 대부분의 의료기기와 체외진단시약들은 동물 모형을 사용하고, 체외에서 수행하는 안전 및 성능 시험만으로도 시장에 진입할 수 있다. 또한, 판매 후 임상 연구는 안전성(예를 들면, 장기간의 안전성 및 성능, 희귀한 합병증 사례 등)에 관한 정보를 수집할 수 있게 하므로 제품 설계(product design) 향상에 기여하고, 표시사항의 효능(labeling claims)을 확장할 수 있으며, 비교 가능한 유효성(comparative effectiveness) 데이터를 얻을 수 있고, 비용-이익 효과(cost-benefit claims)에 대한 근거를 제공할 수 있다. 표 2는 의료기기의 임상 연구에 관한 대표적인 분류 갈래들을 요약한 것이다.

표 2 – 의료기기 임상 연구 분류

판매 전 안전성, 성능 그리고/또는 설계에 관한 예비 연구(pilot studies)
판매 전 안전성 및 유효성에 관한 본 연구(pivotal trials)
판매 후 연구(postmarketing studies)
  표시사항에 기재한 효능, 효과를 확장하기 위한 연구
  성능을 비교하기 위한 연구
  경제성 평가를 위한 연구
  안전성 또는 성능과 관련된 구체적 문제들을 관찰 또는 분석하는 연구
  이식 의료기기의 회수(explant retrieval) 및 고장 분석에 관한 연구

 

3.1 예비 연구(Pilot Studies)

예비 연구는 실현가능성을 타진하는 타당성 연구(feasibility studies)로서 보통 한 장소에서 수행하고, 제한된 수의 환자를 대상으로 하며, 하나의 임상 시험 프로그램 내에서 몇 가지 목표를 달성하기 위하여 수행하는 연구이다. 통상적으로 예비 연구는 가설 검정(hypothesis-testing)을 위한 연구는 아니며, 엄밀한 분석 시험(이를테면, 가설 검정 시험)의 설계를 뒷받침하는 데 필요한 데이터를 만들어내는 데 쓰인다. 임상시험용 신개발 의료기기를 사람에게 적용해보는 초기 연구는 보통 소규모 예비 연구로 수행하는데, 시험 조건을 엄격하게 통제하면서 안전성을 평가하게 되므로 좀 더 많은 환자를 대상으로 좀 더 큰 규모의 성능 시험을 수행하는 데 필요한 데이터를 얻게 된다. 예비 연구는 실제 임상 조건에서 의료기기를 사용할 때 사용자의 역할을 평가하는 첫 번째 기회이기 때문에 설계 특성과 연관된 정보를 수집하여 의료기기가 적절하게 사용될 수 있게끔 최적화할 수 있다. 의료기기의 안전성 및 유효성을 평가하는 본 임상 시험(pivotal clinical trial) 설계에 앞서 수행하는 예비 연구에서는 임상시험의뢰자(sponsor)가 여러 환자들의 결과 데이터를 수집하여 이를 의료기기의 성능과 연관시켜 파악할 수 있기 때문에 본 시험에서 유효성 종점(effectiveness endpoints)으로 사용할 수 있는 유의미한 임상 척도들(clinically significant measures)을 확인․선택하는 데 기여한다. 그리고 안전성 및 유효성 척도 선별에는 대개의 경우 검증된 평가 방법이 필요하므로 평가 방법을 개발하여 적용한다. 예비 연구의 규모를 좀 더 확장하면 평가 도구의 검증도 포함 가능하고, 종점에서의 환자 간 변동에 대해서도 충분한 데이터를 만들어낼 수 있기 때문에 가설 검정 연구에서 사용할 수 있는 만큼의 표본 크기 계산(sample size calculations)까지도 뒷받침할 수 있다.

3.2 안전성 및 유효성에 관한 본 시험(Pivotal Trials of Safety and Effectiveness)

미국 FDA에서 고위험(SR) 의료기기의 판매허가를 얻는 데에는 의료기기의 성능을 검증하는 1회의 잘 통제한 임상 시험(single, well-controlled clinical trial)만으로도 충분하다. 이들 전향적 분석 연구(prospective, analytical studies)는 유효성에 관한 객관적 증거를 제시해주는데, 유효성을 확인해주는 근거는 비중 있는 단일 또는 복수의 임상 결과가 된다. 실험실 검사(bench testing), 동물 시험(animal studies)에서 얻는 데이터와 조합할 경우, 1회의 임상 시험 결과는 안전성 및 유효성에 관한 “합리적인 증거(reasonable evidence)”로서 손색이 없다. 다른 치료 방법과 직접 비교하는 경우라면, 새 의료기기가 기존의 의료기기 또는 다른 치료방법에 비하여 그 유효성이 뒤떨어지지 않으면 되는 것이다. 그리고 아주 드문 예이지만, 미국 FDA에서 판매 전 허가(Premarket Approval Applications; 약자로 PMA)용 본 시험을 다기관(multicentered) 시험으로서 수행한 경우가 있다.

임상시험용 의료기기에 대하여 행해지는 판매 전의 임상 연구는 일단 판매 허가가 이루어진 이후에 그 표시사항(label)에 새길 수 있는 효능, 효과의 주장 근거를 형성한다. 이 점은 미국에서는 특히 중요한데, 표시사항(label)에 기재되는 모든 내역은 신뢰할 만한 근거 데이터로 뒷받침되고 있다는 사회적 기대가 있기 때문이다. 이 때문에 제품 개발 계획에서 임상 연구 부분을 최종적인 마케팅 목표로부터 별도로 분리하여 취급하면 절대로 안 된다. 또한, 일부 사례에서는, 실험실 검사와 동물 시험이 임상 연구를 보강하는 추가적인 성능 데이터로 인정되어 표시사항(label)의 효능을 확장하는 경우도 있다. 

3.3 판매 후 연구(Postmarketing Studies)

판매 후 연구는 두 범주로 구분할 수 있는데, 하나는 허가 후 의무적인 연구(mandated postapproval studies)이고, 다른 하나는 판매 후 감시를 위한 연구(postmarket surveillance studies)이다. 미국 FDA에서는 3등급 의료기기 의뢰자에 대한 PMA 허가 조건으로서 의무적인 허가 후 임상 연구를 요구하는 사례가 점차 증가하고 있다. 이러한 연구들은 보통 연구 범위는 좁지만, 추가적인 데이터 수집에 초점을 맞춤으로써 제품 허가를 보완하여 임상시험의 본 시험 결과를 확장하는 기능을 담당한다. 판매 후 연구의 목표는, 그것이 규제당국에서 강제로 요구하는 것이든지 아니면 최신 과학 기술이어서 검증을 필요로 하는 것이든지 간에, 통상 장기간에 걸친 추적 검사(longer-term follow-up), 시간 경과에 따라 발생하는 사건과 유해 사고(adverse events)에 대한 추가적인 데이터 수집, 표시사항(label)의 주장을 확장(예를 들면, 적응증 확장, 유효 기간 증가, 제품이 줄 수 있는 혜택의 수효 증대 등)하는 데 필요한 추가적인 데이터 수집 등을 포함한다. 판매 후 연구는 임상연구계획(protocol)을 개정하여 추적 검사(follow-up)를 늘임으로써 본 연구의 연장선상에서 수행할 수도 있고, 아니면 완전히 별도의 연구로 진행할 수도 있다. 이러한 의무적인 판매 후 임상 연구 부과 추세는 1993년 이전에 임상시험계획을 수립한 임상시험의뢰자들과 함께 작업하겠다는 미국 FDA의 공약을 반영한 결과로서 그 때부터 미국 FDA는 임상시험 요구사항의 기준을 좀 더 엄격 적용하는 방향으로 정책을 전환하였다.[6],[10],[11] 따라서 임상시험의 본 시험 개시 전에 임상시험계획을 설계하는 단계에서부터 미국 FDA와 긴밀하게 협력하면서 임상시험의 본 시험을 좀 더 면밀하게 준비한다면, 의무적인 판매 후 연구의 필요성을 최소화할 수 있을 것이다.

허가 후 연구(postapproval studies)와 구분해야 하는 것들로서 제조업체가 자신의 목적을 위하여 수행하는 다양한 유형의 판매 후 연구(postmarketing studies)가 있다. 이를테면, 제기된 안전상의 문제를 파악하고자 의뢰자가 스스로 또는 규제당국이 요구하여 수행하는 연구가 그런 것들이다. 또한, 1990년의 미국 연방정부의 안전한 의료기기법(Safe Medical Devices Act)과 1997년의 미국 FDA 현대화법(FDAMA: FDA Modernization Act)으로 말미암아 미국 FDA는 일부 의료기기에 대하여 판매 후 감시 활동을 강제 적용할 수 있는 권한을 갖게 되었는데, 판매 후 감시 차원에서의 임상시험을 요구할 수 있는 재량권을 갖게 된 것이다. FDAMA 법으로 말미암아 미국 FDA는 다음 조건을 갖춘 2등급 및 3등급 의료기기에 대하여 판매 후 감시를 위한 임상시험의 실시를 요구할 수 있게 되었다.

  1. 고장 난다면 심각한 보건상의 문제를 유발할 가능성이 있는 의료기기

  2. 1년을 초과하는 기간 동안 사람 몸에 이식되는 의료기기 

  3. 생명 유지(life-sustaining) 또는 생명 지원(life supporting) 제품이면서 전문의료인들의 도움을 받을 수 없는 장소, 즉 의료기관 이외의 장소에서 사용하는 의료기기 

현재까지 판매 후 감시를 위하여 의무적으로 적용한 임상시험은 장기간 고장 형태(long-term failure modes) 그리고/또는 의료기기(인공심장판막, 체내주입용 콜라겐, 폴리우레탄 인공유방, 페이스메이커 리드 등)를 사용하는 소수의 환자들에게서 발생하는 심각한 유해 사고(serious adverse events)의 가능성에 관한 체계적인 데이터를 개발하는 지침 역할을 하였다. 또한, 미국에서 제조업체는 의료기기 품질체계규정(Quality System Regulations; 약자로 QSR)을 준수하기 위해서도 판매한 제품들에 대한 판매 후 감시 활동을 수행하여야 한다. 이러한 감시 활동에는 사용자 불만, 제품 고장, 제품 사용 시 발생한 유해 사고 등에 관하여 판단하고 해결하는 활동이 포함된다. 이는 결코 수동적인 활동이 아니다. 책임을 부담하는 제조업체에서는 이에 관한 업무 절차를 상시 유지함으로써 판매 후 현장 경험을 체계적으로 평가하여 제품의 실패와 성공 요인이 파악될 수 있게끔 유도하는데, 이러한 절차에는 제품의 성능과 안전성을 개선하기 위한 연구(실험실 검사 또는 임상 시험)가 포함되기도 한다. 

규제 요구사항에 대한 만족이라는 목적 이외에도 판매 후 연구가 지향하는 목적 중에는 다른 치료법 그리고/또는 의료기기, 즉 대안이 되거나 경쟁 상대가 되는 방법들과 견주어보는 비교연구가 있는데, 이는 경제성 비교(pharmacoeconomic research), 효능․효과 비교(comparative effectiveness claims), 표시사항의 효능․효과 확장(expanded label claims) 등을 뒷받침하는 데 사용할 수 있다. 앞서 언급했듯이 이식 의료기기에 관한 전향적인 임상 시험을 2 년 넘게 수행하는 것은 현실적으로 바람직하지 않은데, 후속검증기간 동안 떨어져나가는 환자들이 있고(loss of follow-up), 막대한 비용이 소요되며, 그 동안 의료 기술의 발전과 변화가 눈부시게 진행되기 때문이다. 따라서 몸에서 제거한 임플란트 분석(explant analysis), 고장 조사 방법 등을 위시한 면밀한 프로그램들과 판매 전의 설계 제어요소들에 대한 분석을 연계하는 것이 장기간에 걸친 성능 데이터를 수집하는 데에는 가장 일반적이면서도, 유효하고, 효과적인 수단이 된다. 또한, 근래에 임상시험의뢰자들이 임상 경험을 후향적으로 연구(retrospective studies)할 때 효과적인 연구 방법인 관찰 연구(observational studies)를 사용하기 시작했는데, 특별히 이 방법은 그 목적이 환자에 특유한 또는 의료기기에 특유한 요인이 장기적으로 성능 결함(long-term performance failure)에 얼마나 영향을 미치는지와 관련된 데이터를 수집할 때 사용된다. 또한, 의약품과 마찬가지로, 유해 사고 보고, 제품 회수, 불만사항 등의 평가에 있어서 감시활동(vigilance)은 임상 경험에 관한 중요한 정보의 원천이 된다. 물론, 단속적이라는 한계가 있기는 해도 이러한 데이터들은 설계의 결핍 요소와 강점을 연구하는 기초가 되며, 제품의 성능 향상에 기여하기도 한다.

[6] Food and Drug Administration. 1993. Final Report of the Committee for Clinical Review. “The Temple Report.” FDA Report. March 1993. pp. 1-45.

참고문헌(References)

 

[9] Food and Drug Administration. 2004. General Provisions. Definitions. 21 CFR §812.3(m).

[10] Food and Drug Administration, Center for Devices and Radiological Health. 1995. Clinical Trial Guidance for Non-Diagnostic Medical Devices. Rockville, MD, pp. 1-25.

[11] Food and Drug Administration, Center for Devices and Radiological Health. 1996. Statistical Guidance for Clinical Trials of Non-Diagnostic Medical Devices. Rockville, MD, pp. 1-32.

의료기기 임상평가 (1-2)

의료기기 임상평가 (1-2)

2. 의약품 대 의료기기: 정말 차이가 있나?(Drug vs Devices: Is There a Difference?)

 

1976년 발효된 미국연방 식품의약품화장품법(FD&C)의 의료기기수정법(Medical Devices Amendments)은 의료기기의 상업적 사용과 관련하여 FDA에게 막강한 사법권 및 행정권을 부여하였다. 이러한 의료기기수정법이 마련되기 전에 미국연방 보건복지부장관(Secretary of Health and Human Services)은 작업반(task force)을 조직하여 미국 의료기기 산업계의 성격, 규제가 필요한 제품의 범위, 산업계에 부당한 부담을 주거나 또한 기술 혁신을 방해하지 않으면서도 공중보건을 수호하는 최상의 기제를 파악하는 작업을 하였다. 그 작업반을 쿠퍼 위원회(미국 국립심폐혈액연구소[NHLBI: National Heart, Lung, and Blood Institute]의 소장을 역임한 씨어도어 쿠퍼(Theodore Cooper) 박사의 이름을 사용한 위원회)라고 불렀는데, 바로 이 쿠퍼 위원회가 1970년에 제출한 보고서의 결론을 좇아 1976년에 법제화의 틀이 완성되었던 것이다.[2]

쿠퍼 위원회의 결론은 다음과 같았다. 의료기기는 의약품과는 전혀 다르다는 것이다. 따라서 의료기기 제품에 “의약품 관리제도의 모형(drug model)”을 직접 적용하는 것은 바람직하지도 않거니와, 그렇게 하는 것은 불가능하다는 것이었다. 그래서 쿠퍼 위원회에서는 의료기기를 사용할 때 환자에게 나타날 수 있는 위험(risk)의 경중을 고려하는 전혀 새로운 제도적 접근 방법을 채용하도록 권고하였다. 쿠퍼 위원회에서 지적한 “의약품과 의료기기 간에 내재하는 고유한 차별성(inherent differences between drugs and devices)” 항목에는 다음과 같은 것들이 있었다. 의료기기는 극단적으로 서로 다른 제품군을 포함하므로 사용목적과 동작원리 면에서 너무나 큰 차이를 갖는다. 또한, 의료기기는 때로는 의사가 설계하는 경우도 있는데, 그럴 경우 형태나 용법상의 혁신이 아주 자주 이루어진다. 또한, 의료기기는 주로 보건의료전문인들이 사용하기는 하지만 환자들도 사용한다. 그리고, 의료기기는 대부분의 경우 중소기업이 개발의 주체이며, 연간매출액도 너무나 작아서 단위매출액기준으로 볼 때 대표적인 의약품제조업체와는 비교가 되지 않는다는 등의 지적을 한 것이다.

쿠퍼 위원회의 권고와 관련된 증언에 입각하여 미국연방의회에서는 이를 법제화하였는데 의료기기의 규제 경로가 포함된 이 법안의 주안점은 의료기기의 규제는 개개의 제품들이 가지고 있는 위험의 상대성에 입각한 규제가 이루어져야 한다는 점, 또한 개개의 의료기기가 발휘하는 성능은 연방의 규제 요건과는 무관하게 궁극적으로 사용자의 숙련도와 임상에서의 판단능력이 주된 역할을 담당한다는 원칙을 분명히 수용하여야 한다는 점이었다. 따라서, 미국 내에서 의료기기를 판매하고자 하는 자들은 의료기기 판매 전 허가 규정에 따라 안전성과 유효성에 관한 유효한 과학적 증거를 제출하게 되었다. 그런데, 의약품 허가 요구사항에서와는 달리, 이러한 증거는 잘 관리하여 수행한 임상 조사(well-controlled clinical investigations) 이외의 근거일지라도 무방하다. 이를테면, “부분적으로 제어하여 수행한 임상연구, 짝을 이루는 대조군 없이 수행한 객관적인 임상시험과 연구, 자격을 갖춘 전문가가 수행하여 깔끔하게 문서화한 증례 이력, 이미 사용 중인 의료기기에 대하여 유의미한 경험을 기록한 보고서 등”도 괜찮다는 것이다.[3] 그러나, 규정에서는 비전문적 사례 보고(anecdotal reports) 또는 의견(opinion)과 같이 데이터로 뒷받침되지 않는 임상 경험 보고서 등은 구체적으로 지목하여 배제하도록 요구하고 있다.  

규정에서 요구하는 의료기기 허가 기준은 “합리적으로 판단하여 확신에 이를 수 있는(reasonable assurance)” 수준의 안전성 및 유효성이기 때문에 많은 대가를 지불하면서 ”실질적 증거(substantial evidence)”를 제시하여야 하는 의약품에 비해서는 부담이 덜 하며 좀 더 유연하다고 할 수 있다.[4],[5] 따라서, 비록 미국 FDA의 의료기기 및 방사선보건센터(Center for Devices and Radiological Health; 약자로 CDRH)에서 책임을 부담시키는 강력한 절차를 통하여 임상 연구(clinical research)를 엄밀하게 수행하도록 함으로써 새로운 의료기기 등록 시 그러한 근거를 요구한다고 하더라도, 최근에 재천명된바, 의료기기의 허가를 위한 증거 제시에는 의약품과는 차별된 기준을 적용하고 있는 것이다.[6],[7] 또한, 미국 FDA에서 표명하고 있듯이, 의약품 허가 요건의 경우 규제를 통하여 얻고자 하는 실질적 결과는 임상시험에서 발견한 결론을 되풀이할 수 있는 능력(즉, 2회  이상의 임상 시험)인 것이지만, 의료기기의 경우에는 단 한 차례의 결정적인 임상 시험만으로도 충분하다는 것이다. 왜냐하면, “의료기기의 작용 기전은 제품의 설계 자체에 녹아있고, 그것은 실험실에서의 성능 시험을 통하여 상당 부분 검증되기 때문이며, 규제기관에서도 일상적으로 내부 및 타 검증기관 일치성을 확인하는 단일 임상 연구 결과를 신뢰하고 있기 때문이다.”[6]

쿠퍼 위원회가 35년 전에 밝힌 의약품과 의료기기 간의 차이점들은 오늘날에도 여전히 유효하다. 또한, 그 중 몇 가지는 의료기기의 기능을 이해하는 핵심 사항으로서 제품 개발 계획 및 임상 연구 설계에 영향을 미치는 요소들이다(표 1 참조).
 

표 1 – 임상시험 설계에 영향을 미치는 의료기기의 특성들

특성 임상연구 설계시 고려사항
보건의료전문인이 주로 사용하는 의료기기 제품의 성능이 사용자에 의해 영향을 받는다.
빈번하게 자그마한 개선이 끊임없이 이뤄지는 의료기기 연구 도중 개입이 불가피하여 종종 사용자를 눈가림(맹검)하는 게 불가능할 수 있다.
실험실 및 동물 모형을 통한 시험검사만으로 새롭게 추가된 설계 내역에 대한 검증이 가능하기도 하다.
이식 의료기기 연구윤리 문제로 대조시험은 사전 배제되기도 한다.
장기간 임상 연구 결과는 현재 사용하는 제품과 시술 방법에는 더 이상 효과가 없을 수도 있다.
한 번 이식하면 쉽사리 종결하는 것이 어렵고, 환자에게 돌이킬 수 없는 결과를 남긴 연후에야 중단할 수 있다.
가짜(placebo) 대조군(=가짜 수술)이 불가능하다.
무작위 대조군을 세워 동시에 수행할 수 있는, 의학적으로 적합한 대안적 치료 방법을 찾기가 어렵다.
장기간 성능 평가는 주로 설계 관리와 고장 분석에 의존한다. 
의료기기는 대개 중소기업에서 개발되기 때문에 단위 제품 당 매출액이 의약품의 평균 매출액에 비해 현저히 떨어진다. 현실적인 고려(규제사항, 재정적 한계) 때문에 신규 제품 개발 및 시험에 족쇄가 채워진다.

  

2.1 의료기기는 주로 보건의료전문인이 사용한다(Devices Are Primarily Used by Health Care Professionals) 

의약품에 관한 연구에서는 상호작용하는 두 가지 주요 변수가 있는데 하나는 약물이고 다른 하나는 환자이다. 따라서 만일 연구자가 그 밖의 다른 변수들을 관리할 수 있다면, 즉 약물 병용, 기존 증상, 질환의 경과 등을 통제만 할 수 있다면 연구 결과는 결국 약물과 환자라는 두 변수의 상호작용의 함수가 된다. 반면에 의료기기와 환자의 상호작용에는 보통 제3요인이 개입하는데 의료기기 사용자, 즉, 통상적으로 의사나 간호사 등의 보건의료전문인이 중간에 낀다. 따라서 의료기기의 안전성과 유효성을 확인하기 위한 임상 연구에서 연구 결과는 의료기기와 환자의 상호작용의 함수이면서 사용자의 숙련도의 함수가 된다. 이렇듯이 중간매개자로서의 사용자는 의료기기 임상 시험을 설계할 때 두 가지의 큰 어려움을 빚게 되는데 의약품 연구에서는 여간해서는 발생하지 않는 어려움들이다. 이를테면, 사용자들을 치료 행위로부터 눈가림(맹검)시키는 게 거의 불가능하기 때문에 사용자들의 행위가 제품의 성능에 영향을 미칠 수 있게 된다. 다시 말해, 사용자가 제품 성능의 내장 변수라는 말이다. 숙련된 사용자가 조작하면 초보자가 조작할 경우보다 의료기기는 좀 더 우수한 성능을 발휘하게 되는데, 통상 이러한 현상을 가리켜 학습 곡선(learning curve)을 따른다고 표현한다. 의료기기 사용에 숙달되는 것이 의료기기 임상 연구와 마케팅에 있어서 핵심적인 부분이 되는 것이다. 만일 사용자의 숙련도를 정확하게 산정할 수 없거나 또는 그 중요성이 간과된다면, 의료기기 성능은 부정확하게 평가될 수밖에 없는 것이다.

연구 개입에 대하여 사용자를 눈가림(맹검)하는 것이 불가능할 경우, 그리고 때로는 환자에게도 그게 불가능할 경우, 만일 임상시험연구자(clinical investigator)가 치료 및 성능 평가를 연계하여 수행하는 책임을 맡고 있다면 임상 수행 내역을 평가할 때 편견(bias)이 개재될 수 있다. 따라서, 가능하다면, 유효성을 평가하는 임상시험연구자는 맹검한 평가자가 되어야 한다.

2.2 의료기기는 빈번하게, 조금씩 개선된다(Devices Are Subject to Frequent, Incremental Innovations)

의료기기 산업계에서는 설계 및 사용법에 대한 빈번한 개선이 보편적으로 이루어진다. 주로 자그마한 변경 사항들이기 때문에 안전성, 신뢰성, 환자의 안락감, 사용편리성 등을 향상시키지만, 대부분의 경우 판매 전 허가 또는 신고를 하지 않아도 되는 사항들이다. 따라서, 대개의 경우 실험실 검사(bench testing) 그리고/또는 동물 모형 평가(evaluation in animal models)만으로 설계 변경 사항의 적절성에 관한 평가가 가능하여 통제된 임상 시험(controlled clinical trials)까지는 불필요하다. 그러므로 설계 변경 내역을 평가할 때 임상시험연구자들이나 임상연구윤리위원회(Institutional Review Board; 약자로 IRB. 임상시험검사위원회, 기관/병원/원내 생명윤리위원회 등으로 부르기도 함)에서 새로운 설계 내역에 대한 체외 성적 평가(in vitro performance evaluation)의 결과를 인정하는 게 그리 예외적인 경우는 아니다. 왜냐하면 신 모델과 비교하기 위하여 변경 이전의 구 모델을 사용하여 임상 시험을 수행하는 것은 비윤리적일 수 있기 때문에 비교를 위한 비교를 위하여 마지못해 하는 시험에 대하여 충분히 경쟁력이 있기 때문이다. 그러나 성능 인자(유효성)에 획기적 개선이 이루어졌다든지 또는 적응증상을 확장했다든지 하는 설계 혁신에 대해서는 통상 임상 연구가 필요하다.

2.3 이식하는 의료기기가 있다(Some Devices Are Implanted)

미국 내에서만 2천만 명에서 2천5백만 명이 어떤 종류이든지 이식 의료기기(implanted medical device), 예를 들면 페이스메이커(pacemaker; 인공심장박동기, 인공심박동기, 인공심박조율기 등으로 부르기도 함), 인공수정체(intraocular lenses), 인공관절(artificial joints) 등을 몸에 지니고 살고 있다고 한다.[8] 의료기기를 몸에 이식하고 그로 인하여 몸에 초래되는 결과 중에는 그걸 얼마나 오래 사용하느냐에 관계없이 환자에게는 불가역적인 영향을 미치게 된다. 따라서, 의약품 임상 시험과는 달리, 이식 의료기기는 어느 날 갑자기 쉽게 임상 시험을 종료할 수 없게 된다. 만일 그 임상 시험이 외과 수술을 요하는 임상 시험이라면, 보통의 경우 가짜(placebo or sham) 수술 대조군은 아예 그 가능성을 배제한다. 왜냐하면 윤리적으로 적합하다고 여겨지는 대안 치료군(alternative treatment group)을 확보하는 게 어렵기 때문에 그러한 경우에는 시간적으로 비교할 수 있는 대조군을 사용하거나 또는 환자 자신을 대조군으로 사용하여(수술 전후를 비교하는 방식으로) 성적을 평가하기도 한다. 그러므로, 제어된, 전향의, 장기(> 2년) 임상 평가(controlled, prospective, long-term performance evaluation)를 이식 의료기기에 대하여 수행하는 경우는 드물다. 왜냐하면 공급 측면의 한계(예를 들면, 경과 추적을 하다가 제외되는 환자들을 감안해야 하기 때문에 표본 크기를 크게 해야 하지만, 시험 수행에 적합한 충분한 수의 환자를 확보하기가 어렵고, 시장 규모를 고려할 때 대규모 임상 시험의 비용을 감당할 수 없는 등)가 있기 때문이다. 따라서, 드물게 발생하는 합병증(rare complications) 추적, 고장 형태(failure modes) 파악, 설계 향상(enhanced designs)이 성능 개선에 얼마나 기여했는지 등에 관한 정보는 그러한 방법 대신에 대개의 경우는 증례 모음(case series) 분석, 기록(registries), 회수 기기(retrieved devices)에 대한 고장 분석(failure analysis), 실험실 시험(bench testing), 공식 설계 검토회의(formal design reviews) 등을 통하여 수집하게 된다.

2.4 의료기기 제조업체는 중소기업이 많다(Device Manufacturers May Be Small Companies)

의료기기는 대체적으로 중소기업에서 개발하는 제품으로서 연간매출규모가 평균적인 제약업체의 매출규모와는 비교가 되지 않을 정도인 경우가 많다. 따라서, 책임을 다하는 제조업체라면 안전하고 신뢰성 있는 제품 개발을 위하여 필요하다면 어떠한 시험이든지 그 비용을 감당하고자 하겠지만, 중소규모의 보건의료산업계가 마주하는 이러한 현실적인 제약 요인들은 특히 제품 개발 및 시험과 관련된 의사결정에 영향을 미치게 된다.

[2] Study Group on Medical Devices. 1970. Medical Devices: A Legislative Plan. Department of Health, Education, and Welfare, Washington, DC.

참고문헌(References)

 

[3] Food and Drug Administration. 2004. Determination of Safety and Effectiveness. 21 CFR §860.7(c)(2).

[4] U.S. Congress. Federal Food, Drug, and Cosmetic Act of 1938. Public Law Number 75-717, 52 Stat. 1040(1938) 21 USC §505.

[5] Hutt, P.B., Merrill, R.A. and Kirschenbaum, A.M. 1992. Devices are not drugs: the standard of evidence required for premarket approval under the 1976 medical device amendments. Unpublished.

[6] Food and Drug Administration. 1993. Final Report of the Committee for Clinical Review. The Temple Report.” FDA Report. March 1993. pp. 1-45.

[7] Food and Drug Administration. 1995. Notice. Statement regarding the demonstration of effectiveness of human drug products. Fed. Regist. 60:39, 180-39,181.

[8] Marwick, C. 2000. Implant Recommendations. JAMA. 283:869.

의료기기 임상평가 (1-1)

의료기기 임상평가 (1-1)

의료기기 임상평가: 원리와 사례 연구(Clinical Evaluation of Medical Devices: Principles and Case Studies)

여러분들의 의료기기 임상시험에 대한 이해 증진과 적용을 돕기 위하여 연속기획으로서 이 주제를 다루고자 합니다.

사용할 자료는 2006년도 휴마나 출판사(Humana Press, Inc.) 간행, 카렌 베커와 존 화이트(Karen M. Becker and John J. Whyte) 편저, 의료기기의 임상시험 제2판(Clinical Evaluation of Medical Devices: Principles and Case Studies; 2nd ed.)으로서 요약정리하는 방법보다는 전문을 번역하는 방식으로 소개하고자 합니다.

아쉬운 점이 있다면, 출판사의 후원이 없는 상태이므로 간헐적으로 짬을 내어 작업할 수밖에 없다는 점일 것입니다. 그러나, 오랜 시간이 걸리더라도 완역된다면 의료기기 관련 보건의료계에 많은 도움이 될 것이라 생각합니다. 그 때의 기쁨을 생각하며 대장정의 첫걸음을 옮겨봅니다.

오늘은 간단하게 서문과 1장의 도입부만 옮겨봅니다. 다만, 이 글의 경우, 내용 이해를 돕는 것이 목적이기 때문에 번역은 직역 아닌 의역을 할 것입니다. 따라서 원문의 직접적 표현을 갈망하시는 분들께는 양해를 구합니다. 아울러, 우리말로 풀었을 때 혼동의 소지가 있는 용어 몇 가지는 원문과 병기하겠으며, 번역 속도를 위하여 띄어쓰기 원칙 적용은 최소화하겠음을 밝힙니다.

                                                                                                                                 

Clinical Evaluation of Medical Devices: Principles and Case Studies

Second Edition

Edited by Karen M. Becker, PhD and John J. Whyte, MD, MPH

@2006 Humana Press, Inc.

이 책의 초판인 의료기기의 임상평가: 원리와 사례 연구(Clinical Evaluation of Medical Devices: Principles and Case Studies)는 현장에서 적용되는 사례 연구를 상세하고도 다양하게 제시함으로써 의료기기 임상시험의 핵심 원리와 접근 방법에 관한 기초적인 내용을 개괄적으로 제공한 바 있다. 새로운 의료기기를 개발하고, 개발된 의료기기를 널리 보급하는 데 도움이 될 수 있게끔 임상평가전문가(clinical professionals)와 관련제도전문가(regulatory specialists)용으로 내용을 편성하였기 때문이다. 그런데, 1997년의 초판 출간 이래,  보건의료기술 분야의 급속한 혁신 속도로 말미암아 관심도와 중요도 측면에서 주목되는 신제품들이 속속 등장하고 있다. 또한, 규제제도 분야에서도 이러한 의료기기산업계의 변화와 요구를 반영하면서 발빠르게 대응하고 있다.

서문(Preface)

 

이에 제2판에서는 위험도가 큰 새로운 의료기기의 임상연구에 적용되는 과학적 방법론과 규제요건에 대하여 최신의 자료를 정리하여 개정 증보하였다. 그 중  대표적인 내용을 살펴보면, (1) 신제품에 대하여 미국연방의료보험(Medicare)과 영리보험회사로부터 비용상환(reimbursement)을 받을 수 있는 요건과 절차에 대한 새로운 정보를 추가함과 동시에 신제품 연구개발용으로 맞춤설계한 임상연구 사례를 보건의료기술 평가방법과 더불어 추가하였고, (2) 의료기기 임상시험에 적용되는 새로운 통계학적 방법론에 관한 정보도 추가하였으며, (3) 복합기술제품(combination products) 사례, 타당성(feasibility) 예비조사, FDA 허가 문제, 미국연방의료보험 비용상환(Medicare reimbursement) 등을 포함하는 3상 개발 모형(three-phase development model), 희귀제품 임상연구 설계법(novel study designs) 등을 망라한 모든 새로운 형태의 사례 연구도 추가하였다.

따라서, 제2판은 초판의 기초 위에 견고하게 구축될 수 있었던바, 이는 책이 최종 출판되기까지 내용 작성과 의견 공급에 참여한 각계 제현들의 도움이 없이는 불가능하였을 것이다.

공동편저자 카렌 베커(Karen M. Becker, PhD)/존 화이트(John J. Whyte, MD, MPH) 드림.

                                                                                                                                 

제1부 – 임상연구 설계 및 평가 기초(Fundamentals of Clinical Study Design and Evaluation)

1 – 임상시험을 하여 개발하고 판매하는 의료기기(Clinical Trials in Development and Marketing of Medical Devices) – 카렌 M. 베커(Karen M. Becker)

1. 머리말(Introduction)

의료기기(medical devices)는 보건의료제품(health care products)이지만 의약품(drugs)과는 구별되기 때문에 대부분의 나라에서는 규제를 위한 관리 방법을 달리 하고 있다. 왜냐하면 의약품과 달리 의료기기는 물리적인 또는 기계적인 방법으로 작동하며, 의도하는 주된 효과가 신체의 대사작용에 의존하지 않기 때문이다. 참고로, 미국연방 식품의약품화장품법(FD&C: Food, Drug, and Cosmetic Act)에서는 의료기기를 다음과 같이 정의하고 있다.

(의료기기는) “… 기구, 기계, 용구, 도구, 장치, 발명품, 임플란트, 체외시약 등의 관련 품목으로서… 질병과 기타 증상의 진단, 또는 질병의 치료, 완화, 처치, 예방에 사용하고… 신체의 구조 또는 기능에 변화를 주고자 하는 것으로서… 주된 사용목적이 신체 내부 또는 신체상의 화학 작용을 통하여 달성하지 않는 것…” (을 말한다.)[1]

이처럼 정의가 포괄적이기 때문에 의료기기는 헤아릴 수 없이 많아서 수 만 종을 상회하며 여기에는 체외진단제품(in vitro diagnostics)도 포함된다.

새로운 의료기기를 개발하거나 이미 출시한 제품의 성능을 확장하고자 할 때에는 종종 임상 검사(clinical investigations)를 수행해야 할 필요가 있다. 그런데 의료기기를 대상으로 적절히 제어된 전향적 임상시험(well-controlled prospective clinical trials)을 설계하는 일에는 의약품 임상연구에서 마주하는 것과는 다른, 독특한 어려움이 존재한다. 예를 들면, 의료기기 연구에서 관찰되는 임상 결과들(clinical outcomes)은 평가 중인 제품과 환자 사이에서만 영향을 받는 게 아니라 의료기기 사용자(user)의 숙련도(skill)와 사리판단능력(discretion)에 의해서도 영향을 받는데, 여기에서 의료기기 사용자란 대표적으로는 보건의료에 종사하는 전문인을 가리키지만 환자일 수도 있다. 이러한 제3의 요인(parameter) – 의료기기 사용자 – 으로 인한 영향은 의료기기 임상연구에 특유한 변수(variable)로서,  임상 결과에 지대한 변동을 초래하는 요소가 될 수 있다.  이와 같이 의료기기 성능에 영향을 미치는 사용자라고 하는 요소에 대한 주의와 통제는 임상 연구 설계에 있어서 주목을 요하는 매우 중요한 변수가 된다. 기타 대조군의 선택, 편향(bias; 편이, 치우침 등으로도 풀이 가능) 감소, 혼동요인(confounder;  교란변수 등으로도 풀이 가능) 통제 등 의약품과 의료기기에 공통된 대표적 요소들로서 통제 잘 된 임상연구(well-controlled studies) 설계 시에 고려하여야 하는 중요한 기능들이 있는데, 제출된 어려움의 본질적 성격상 그리고 그러한 도전들에 대처하는 효과적인 접근방법 등의 차이로 인하여 이들마저도 종종 다른 문제를 야기한다.

의료기기에 관한 임상시험을 설계할 때에는 법적 요구사항(regulatory requirements)과 제조자가 세워놓은 사업목표(manufacturer’s established business goals)를 함께 고려하는 게 좋다. 왜냐하면 미국 식품의약품청(FDA: Food and Drug Administration)의 경우에는 제품의 안전성과 유효성이 주관심사이지만, 병원 등의 보건의료서비스제공자나 보험기관 등의 비용지출자들은 성능 측면의 비교우위성, 월등성 또는 제품의 차별성, 그리고/또는 경제적 손익 등에 관심이 있기 때문이다. 따라서, 최적의 임상 연구 프로그램은 한 나라(여기에서는 미국)의 관리당국의 판매 허가를 얻는 데 필요한 데이터뿐만 아니라 목표로 하는 의료시장에 있어서 보험의 보상범위와 상환율 등에 관한 정보도 제공하게 된다.

이 장에서 상세하게 논할 사항은 의료기기의 다양한 면모와 관련하여 적절히 통제 가능한 임상연구(well-controlled clinical studies)를 설계할 때에 제기되는 여러 가지 문제점들과 이러한 설계상의 난점들에 대처하는 방법에 관한 사항들이다. 또한 제품 개발과 판매에 걸친 전반적인 의료기기의 생명주기에서 임상 연구가 차지하는 역할과 함께 전망적 의료기기 임상시험(prospective medical device clinical trial)을 위하여 임상 연구 계획(clinical investigational plan)을 수립할 때 필요한 필수 요소들도 제시한다.

[1] U.S. Congress. Federal Food, Drug, and Cosmetic Act of 1938. Public Law Number 75-717, 52 Stat. 1040(1938) 21 USC §201.

참고문헌(References)