혼란 간단한

추상:관찰 연구에서 치료 및 결과 변수의 모든 공변량을 조정해야하는 것은 아닙니다. 기본적으로,하나는 맹목적으로 인과 이유로 자신의 선택을 정당화하지 않고 많은 혼란을 조정 연구를 의심한다.

면책 조항:인과 추론에 대한 나의 지식은 내가 매우 잘못된 것을 말할 수있을 정도로 제한적이다. 당신이 실수를 발견하면 트위터@제세 빌라 몰에 나에게 도달!

결과에 대한 치료의 인과 적 효과를 확인하려고한다고 가정합니다. 사업의 첫 번째 순서는 그들 사이에 통계적 상관 관계가 있는지 여부를 결정하는 것입니다.

여전히 도전적이지만 복잡한 변수 집합 간의 통계적 연관성 네트워크를 결정하는 좋은 통계 도구가 있습니다.

그러나 상관 관계는 인과 관계가 아니며 상관 관계는 치료와 결과의 인과 적 선행 인 혼동 자에 의해 발생할 수 있습니다.

예를 들어,치료는 흡연 일 수 있고,결과는 호흡기 질환 일 수 있으며,그럴듯한 혼란은 나이입니다; 나이가 많은 사람들은 더 자주 담배를 피우며 호흡기 질환에 걸리기 쉽습니다.

이 상황을 인과 다이어그램으로 설명 할 수 있습니다.:

흡연 연구

에 대한 인과 다이어그램 우리는 치료에서 나이를 통한 결과까지의 차단되지 않은 백도어 경로,즉 흡연<=나이=>호흡기 질환이 있다고 말합니다.

이상적으로 우리는 백도어 경로를 전환 할 수 있도록 무작위로 치료를 할당하는 무작위 대조 시험을 실행하기를 원할 것입니다.

예를 들어,치료가 비 윤리적 일 수도 있고,과거 데이터로부터 결론을 도출하기를 원할 수도 있습니다. 우리는 그 상황에서 무엇을해야합니까?

교란자를 조정하지 않는 방법

교란자의 가짜 영향을 차단하는 대체 방법은 예를 들어 계층화를 통해 조정하는 것이다. 흡연 예에서,우리는 젊은이와 노인에서 우리의 데이터를 나눌 수 있습니다,각 그룹에서 흡연과 질병 사이의 상관 관계를 연구 한 다음 인과 효과의 추정으로 가중 상관 관계를보고.

이것은 우리가 공변량이 실제로 교합,또는 치료와 결과 모두의 인과 조상이라고 확신한다면 잘 작동 할 것입니다—연구 된 각 그룹 내에서 교합 변수가 고정되어 있기 때문에 더 이상 치료와 결과에 대한 가짜 영향을 중재 할 수 없으며 치료의 진정한 인과 효과에 대해 주장 할 수있을 것입니다.

따라서 연구자들은 치료 및 결과와 상관 관계가있는 변수를 식별 할 때마다 그것을 조정하는 경향이 있습니다.

하지만 그 세 변수 사이의 유일한 가능한 인과 관계가 아니다!

치료 사이의 가능한 인과 관계 엑스,결과 와이 및 공변량 지

혼자의

중재자

충돌기

공변량이 치료와 결과 사이의 상호 작용을 매개하는 경우가 발생할 수 있습니다. 즉,엑스=>지 및 지=>와이.

예를 들어,유전자 조작 작물이 소비자 건강에 미치는 영향을 연구 할 수 있으며 유전자 조작 작물이 병원체에 감염 될 가능성이 적다는 것을 알 수 있습니다. 이 경우 병원체의 존재는 유전자 변형 물질과 소비자 건강 사이의 중재자가 될 것입니다.

매개체가 효과를 설명하는 유일한 메커니즘 일 필요는 없다는 점에 유의하십시오.(우리가 특별히 공변량에 의해 매개되지 않는 치료 효과의 일부를 분리하여 측정하려고 시도하지 않는 한)우리의 보고서는 오해의 소지가 있습니다.

세 번째 가능성은 공변량이 치료와 결과의 충돌 자라는 것입니다. 예를 들어,인공 지능 연구자와 체스 전문가 모두 자동화 된 체스 게임에 대한 개발을 읽고 싶어 할 수 있습니다.

충돌기를 조정하면 결과에서 치료 효과의 명백한 강도가 증가합니다.

앞의 예에서,우리가 자동 체스 재생 기사를 읽은 사람들을 조사한 경우,체스 친화력이 인공 지능 연구자가 될 가능성이 적다는 것을 알 수 있습니다.

그래서 중재자와 충돌자를 조정 조심!

이제 공변량이 케이스와 혼동되는 케이스와 중재자 또는 충돌자 인 케이스를 어떻게 구별 할 수 있습니까?

짧은 대답:우리는 적어도 데이터를 관찰하는 것만으로는 할 수 없습니다. 우리는 기본 인과 관계의 도메인 특정 지식에 의존 할 필요가있다.

여러 공변량이 관련되면 이야기가 더 복잡해집니다. 우리는 모든 공변량,치료 및 결과 사이의 전체 인과 관계 그래프를 매핑하고 과학적 근거로 인과 관계 매핑을 정당화해야합니다.

그런 다음 미적분학의 규칙과 백도어 기준과 같은 원리를 사용하여 치료와 결과 사이의 가짜 상관 관계를 차단하기 위해 조정할 공변량 세트를 찾아 진정한 인과 관계를 추정 할 수 있습니다.

일반적으로 연구가 조정하는 변수가 많을수록 충돌기를 통해 가짜 상관 관계를 도입하거나 중재 경로를 차단할 가능성이 높아집니다.

자유도 문제

많은 변수를 원칙적으로하지 않는 방식으로 조정하는 연구를 의심해야하는 별도의 강력한 이유는 연구를 수행하는 방법에 대한 자유도를 추가하는 것입니다.

두 변수 간의 관계를 1000 가지 다른 방식으로 측정하고 가장 큰 상관 관계를 나타내는 변수를 선택하면 치료의 효과를 과대 평가할 수 있습니다.

더 큰 공변량 집합을 사용하면 원하는 하위 집합을 조정할 수 있습니다. 예를 들어 10 개의 공변량에 액세스 할 수있는 경우 2^10 개의 1000 개의 가능한 하위 집합 중 하나를 조정할 수 있습니다.

단일 연구 그룹이 체계적으로 가능한 모든 조정 하위 집합을 시도하고 최상의 하위 집합을 선택해야할 필요는 없습니다(특히 일부 통계적 방법은 변수 선택의 단계적 또는 최상의 하위 집합 방법과 매우 유사한 작업을 수행하고 있지만). 그것은 다른 연구자들이 서로 다른 하위 집합을 시도하고,그 결과를 결합하는 메커니즘이 편향되어있을 수 있습니다.

예를 들어,100 개의 연구 그룹이 100 개의 서로 다른 하위 집합을 시도할 수 있습니다. 그들 중 95 명은 효과가 없다는 것을 정확하게 식별하지만,출판 편향 때문에 결과를 널리 사용할 수 없게하는 반면,실수로 강력한 효과를 확인한 5 개 그룹은 출판 된 유일한 그룹이며,수행 된 모든 연구가 실제로 아무 것도없는 곳에서 강력한 효과를 발견했다는 인상을 남깁니다.

요약하면,연구에서 조정을 수행하는 원칙적인 방법을 따르는 것에 미리 착수하지 않으면 결과에 편견이 생길 가능성이 더 큽니다.

주의의 말씀:당신은 여전히 좋은 컨트롤이 필요합니다

이 문서에서 우리는 너무 많은 선택의 문제에 초점을 맞추고있다,그 직관 때문에 나는 더 많은 사람들이 부족 참조,심지어 적용 통계에 대한 다른 지식들 사이.

그러나 반대의 실수를 할 수 있다는 것을 명심하십시오—당신은 관련 혼란을 조정하지 못할 수 있습니다—그리고 결국 초콜릿 소비가 노벨상을 초래한다는 결론을 내립니다.

특히 복잡한 현상에 대한 관찰에서,단지 몇 가지를 조정하면 사실상 당신이 조정해야 할 것들을 생략하고 있다는 것을 보장 할 수 있습니다.

관련 과제는’잔여 혼란’이라는 제목으로 진행됩니다. 너가 혼자를 확인하고 그것을 위해 조정하면 비록,정확하게 너가 그것을 측정할 수 있는 까 라고에 아직도 결과에 상응하는 좌우할 것이다—자연적으로 우리는 가장 큰 것을 부정확하게 또는 대리인에 의하여 측정한다.

그래서 문장에서 요점을 되풀이하기: 관찰 데이터에서 인과 효과를 추론하려는 경우 혼란자를 제어하는 것이 중요합니다.

그래서 우리는 무엇을해야합니까?

리트머스 테스트로서,인과 적 근거에 대한 조정 선택을 정당화하지 않고 변수를 조정하는 관찰 연구를 더 의심하십시오.

그러나 일부 연구는 혼란자의 선택을 정당화하는 데 필요한 작업을 수행하지 않으며,이로 인해 우리는 작업에서 신뢰할 수있는 데이터를 추출 할 수있는 훨씬 더 나쁜 위치에 놓이게됩니다. 우리는 그 경우에 무엇을 할 수 있습니까?

우선,우리는 선택된 각 혼란자들을 고립된 상태로 조사할 수 있고,그들이 치료 및 결과와 관련하여 어떻게 인과적으로 행동하는지 생각할 수 있다.

예를 들어,비확산 조약이 핵무기 투자 수준에 미치는 영향에 대한 연구를 검토하고 있다고 가정하자.

음,국내총생산이 높은 국가들도 더 영향력이 있고 조약이 그들에게 유익하도록 형성 될 수 있습니다. 그리고 국내총생산이 높은 국가는 핵무기에 더 많은 투자를 할 수 있다.

그러나 우리는 조약에 서명하는 국가들이 더 협조적이고 더 나은 무역 협정을 맺을 것으로 인식 될 것이라고 주장하는 똑같이 매력적인 이야기를 할 수 있습니다.그래서 국내총생산은 충돌기가 될 것이고 우리는 그것을 조정해서는 안 된다.

대체 설명을 거부 할 강력한 이유가없는 경우,우리는 국내 총생산에 대해 조정해서는 안된다.

그러나이 연구는 다른 핵 협정에 참여하는 대신 조정하고 있다고 상상한다. 다른 조약의 참여가 핵연합에 참여하게 되었다고 주장하는 것은 인위적인 것으로 보인다;둘 다 핵조약에 서명하는 국가의 일반적인 경향에 의해 보다 직접적으로 야기된 것으로 보인다.

이 경우”조약에 대한 소인”은 핵투자에 대한 핵보유국의 영향에 대한 혼란이지만,우리는 그것을 직접 관찰 할 수 없다. 그러나 우리는 백도어 기준에 따라”다른 핵 조약”을 조정함으로써 가짜 영향을 차단할 수 있습니다.

만약 이 연구가 핵개발과 다른 핵조약 참여를 모두 조정한다면 어떻게 될까?

기본적으로 우리는 그들의 결론의 인과 적 타당성을 의심해야한다.

우리는이 정보를 사용하여 몇 가지 예측을 할 수 있지만(예를 들어,위의 연구 결과를 사용하여 어쨌든 조약에 서명 할 국가가 핵무기에 대한 투자를 줄일 것인지 추측 할 수 있음)치료 권고를 할 수는 없습니다(예를 들어,국가 행위자가 핵무기를 수용하도록 로비하는 것이 무기고를 줄이는 효과적인 방법이라고 주장 할 수는 없습니다).

우리가 그들의 결과를 구출하려는 경우 우리는 관련 변수의 인과 다이어그램을 구축하고 혼란 자의 선택이 관련 기준을 충족하는지 고려할 수 있습니다.

그들이 선택한 조정 변수가 제대로 가짜 효과를 차단하지 않거나 충돌기를 통해 새로운 효과를 도입하고 데이터에 액세스 할 수 있다면 조정 변수를 더 잘 선택하여 연구를 다시 실행하려고 할 수 있습니다.

그러나 물론 우리는 여전히 저자가 데이터 세트에 포함하지 않은 주요 혼란을 식별 할 수 있습니다. “일부 데이터와 답변에 대한 갈망의 결합은 주어진 데이터 본문에서 합리적인 대답을 추출 할 수 있도록 보장하지 않습니다.”

결론

이 게시물에서 우리는 공변량과 치료 결과 쌍 사이의 세 가지 유형의 인과 관계를 설명했습니다. 우리는 인과 적 효과를 추론하기 위해 혼란자를 위해 조정해야하지만 중재자 또는 충돌자를 위해 조정하지 않아야한다는 것을 보았습니다.

우리는 관측 연구가 조정하는 변수가 많을수록 인과 적 오류를 범하거나 추가 자유도와 출판 편견이보고 된 효과를 과장할 가능성이 높다고 주장했다.

우리는 또한 반대 실수를하지 않도록 독자에게 경고했다—원칙적인 방법으로 혼란을 조정하는 것은 인과 정보로 관측 데이터를 변환하는 것이 필수적이다.

이전 연구에서 데이터를 추출 하는 방법으로,우리는 비판적으로 인과 기준에 따라 조정 공변량의 그들의 선택을 검토 제안 했다. 그들이 불필요한 변수를 조정하면 데이터를 사용할 수있는 경우 분석을 다시 실행할 것을 제안한 반면,데이터에 키 혼입자가 누락 된 경우 우리는 때때로 우리가 관심있는 질문에 제대로 대답 할 수있는 충분한 정보가 없다는 것을 받아 들여야합니다.

답글 남기기

이메일 주소는 공개되지 않습니다.