오후

연속 척도에 대한 평가

대부분의 물리적 측정은 연속 수치 척도에 있습니다. 종종 문제의 양을 측정하기위한 하나 이상의 기술 또는 도구가 있으며,이러한 기술이 얼마나 밀접하게 일치하는지 문제가 발생합니다(1). 의료 변수를 측정 하는 새로운 방법을 소개 하고자 하는 경우 하나 먼저 얼마나 잘 그것은 이미 설립 된 방법 또는 황금 표준으로 동의 확인 하 여 그것의 유효성을 평가 해야 합니다.

이 섹션에서는 두 가지 측정 기술을 비교하기위한 통계적 방법을 제시하고 일부 가상의 예에 적용 할 것입니다. 우리는 어떤 숫자 엔 사람이나 물체(아마도 100 개)가 각각 두 가지 기술로 측정되어 총 엔 쌍의 측정 값을 산출한다고 가정합니다. 첫 번째 단계로,두 기술에 의해 얻어진 측정은 그래프에 서로에 대해 플롯된다: 샘플의 각 구성원에 대해 하나의 점이 그려지며,엑스 좌표는 첫 번째 기술로 얻은 측정이고 와이 좌표는 두 번째 기술로 얻은 측정입니다. 두 기술이 완벽하게 또는 거의 일치한다면,모든 플롯 된 점은 대각선 위 또는 근처에 있어야합니다 엑스=와이.

두 가지 뚜렷하고 쉽게 이해할 수있는 상황이 그림 1 에 나와 있습니다. 정확하게 동일한 측정 쌍(측정 1=측정 2)은 대각선에 놓인 점으로 그려집니다 엑스=와이,두 그래프에 그려집니다. 예를 들어,두 측정 기법은 밀접하게 일치한다;예를 들어,비,그러나,플롯은 한 번에 측정 1 과 2 의 차이가 증가 값에 대해 점점 더 광범위하게 변화하고 예에 비해 전반적으로 더 큰 것을 알 수있다.

이러한 관계를 표시하는 더 유익한 방법은 소위 개성-알트만 다이어그램입니다. 이전과 마찬가지로 각 측정 쌍은 엑스-와이 평면에 그려 지지만 다른 방식으로 그려집니다.이 두 측정의 평균은 엑스-좌표로 그려지고 그 사이의 차이는 와이-좌표로 그려집니다. 또한,모든 차이의 평균은 실선 수평선으로 그려지고,두 개의 추가(점선)수평선은 차이의 표준 편차의 1.96 배의 거리에서이 선 위와 아래에 그려집니다. 이 두 줄은 소위 계약 한도에 해당합니다. 모든 차이 평균 선은 일반적으로 보정이 도입 될 수있는 두 가지 측정 기술의 체계적인 편차를 나타냅니다;합의의 한계는 일반적으로 수정할 수없는 추가 편차의 크기를 나타냅니다. 측정되는 양이 정상적으로 분배되면 측정 된 차이의 5%가 합의의 한계를 넘어서야합니다(즉,모든 차이의 평균보다 1.96 표준 편차 이상). 요인 2 는 1.96 대신 단순화를 위해 자주 사용되며 후자는 97 에 더 정확하게 해당합니다.정규 분포의 5%분위수입니다. 요약하면,개성-알트만 다이어그램은 측정 기술의 시각적 비교를 가능하게하는 유용한 원조입니다.

도 2 에서,예를 들어 블랜드-알트만 다이어그램은 두 가지 측정 기술이 밀접한 관계에 있음을 확인한다. 평균-의-모든-차이 라인 매우 0;근처 따라서,두 기술의 측정된 값 사이 체계적인 편차가 있을 것 같다. 이 예에서 모든 차이의 표준 편차는 대략 0.05 입니다. 측정되는 양이 정상적으로 분포되어 있다고 가정하면 두 측정 사이의 차이가 95%의 경우 0.1 보다 작다는 결론을 내릴 수 있습니다.이 차이는 측정 된 수량 자체와 관련하여 작습니다. 이 예에서 두 합의 한계 사이의 거리(즉,합의 영역의 너비)는 0.2 입니다.

개성-알트만 다이어그램은 두 측정 기술이 얼마나 잘 동의 볼 실제 상황에서 사용되는 경우,일치의 관찰 정도가 충분히 좋은 여부 질문은 기술이 사용되는 특정 응용 프로그램에 관하여서만 대답 할 수있다(즉,”무엇을 위해 충분히 좋은?”). 장래 사용자는 측정이 임상 목적을 위해 수락가능하기 위하여 얼마나 가깝게 동의해야 하는지(그렇지 않으면 진술하는:계약의 한계 사이 악대가 이어야 하는 방법 좁은)결정해야 합니다. 테츨라프 외. (1),예를 들어,비교 자기 공명 영상(자기 공명 영상)(다른 방법 중)개성-알트만 다이어그램을 사용 하 여 특정 임상 응용 프로그램에 대 한 폐활량 측정 하 고 만족 스러운 계약의 정도 발견.이 두 가지 측정 기술의 합의에 대한 한 가지 이상의 한계가 즉시 드러난다. 두 측정 사이의 평균 차이는 다시 한 번 0 에 가깝지만 합의의 한계는 평균값보다 1.4 단위입니다.,측정 된 모든 차이의 95%가 -1.4~+1.4 범위에 있다고 기대할 수 있습니다. 이 크기의 편차가 허용되는지 의사는 결정해야합니다. 또한,이 다이어그램에서 점의 비 균일 분포는 체계적인 왜곡(체계적인 바이어스)을 나타냅니다.

그럼에도 불구하고,개성-알트만 다이어그램에서 가난한 계약은 우리가 조기에 새로운 측정 기술을 거부하도록 유도해서는 안된다. 그림 3 에서는 두 가지 측정 기법이 분명히 일치하지 않는 두 가지 추가 사례(예:씨 및 디)가 표시되지만(플롯 된 점은 합의 라인에서 멀리 떨어져 있음)그럼에도 불구하고 회귀 곡선이 각 경우에 보여 주듯이 기능적으로 관련이 있습니다. 두 기술 간의 관계는 예제 씨에서 선형(그림 3 씨),예제 디에서 비선형(그림 3 디).

기능적으로 관련된 두 가지 측정 기술을 비교하기위한 포인트 클라우드 다이어그램; 측정 1 대 측정 2 예 씨(위)및 예 디(아래)

따라서 두 측정 자체가 매우 다른 값을 산출하더라도 두 측정이 명확하게 기능적으로 관련되어 있기 때문에 한 측정이 다른 측정에서 정확하게 예측 될 수있는 경우가 종종 있습니다. 예를 들어,측정 1 이 값 3.0 을 산출 할 때 회귀 곡선을 사용하여 측정 2 가 값 7.65 를 산출 할 것으로 추정 할 수 있습니다. 따라서 두 측정 기술 간의 명백한 합의 부족은 크게 수정할 수 있습니다. 두 측정 사이의 기능적 관계에 대한 최선의 추정치에 해당하는 회귀 곡선을 통해 이러한 방식으로 측정 2 를”수정”한 결과 이미 설명 된 방법(예:새로운 개성-알트만 다이어그램)을 사용하여 보정 된 측정 2 와 측정 1 을 비교할 수 있습니다. 이 절차는 측정 장비의 교정과 매우 유사합니다. 기능적 관계 자체의 결정,즉,그림 3 에서 볼 수있는 유형의 회귀 곡선의 생성은 선형 및 비선형 회귀와 같은 다양한 통계적 방법을 필요로하므로 여기에서 더 자세히 논의 할 수 없습니다.

두 측정 기술 사이의 피어슨 상관 계수(2)는 종종 이들 사이의 선형 관계(따라서 특정 종류의 기능적 관계)를 나타내는 것으로 간주됩니다. 실제로,높은 절대 값(1 또는 -1 근처)을 가진 계수는 그러한 관계를 나타냅니다. 그러나 일반적인 오류는 상관 계수에 적용되는 유의성 검정의 의미를 잘못 해석하는 것입니다. 두 측정 기술 간의 상관 관계가 0 과 크게 다르다는 것이 반드시 두 기술이 잘 일치한다는 것을 나타내는 것은 아닙니다. 두 기술 사이의 사소한,실질적으로 관련이없는 관계조차도 원칙적으로 이러한 유형의 통계적으로 유의미한 발견을 산출 할 수 있습니다. “중요한”상관 관계는 실제로 두 가지 유형의 측정(3,4)간의 불일치 크기에 대한 정보를 전혀 포함하지 않습니다.

답글 남기기

이메일 주소는 공개되지 않습니다.