체계적인 오류. 체계적이고 무작위적인 오류


체계적이고 무작위적인 오류.

특정 나누기 값 w가 있는 도구를 사용하여 물리량을 측정할 때 결과를 가장 가까운 전체 나누기 또는 적어도 인접한 나누기 사이의 중간에 해당하는 값으로 반올림해야 했습니다. 우리가 동일하다고 생각한 오류는 본질적으로 호출될 수 있습니다. 반올림 오류. 이 오류는 항상 존재하며 일반 클래스에 포함됩니다. 체계적인오류. 줄이는 것이 가능한가요? 물론 더 비싸고 정확한 장치를 사용할 수도 있습니다.

반올림 오류 외에도 최대 기기 오류, 공장에서 스케일 제조 시 부정확성과 관련이 있습니다. 눈금자 눈금의 간격이 실제로 1mm에 해당한다고 정말로 믿은 사람이 있습니까? 물론 그렇지 않습니다. 밀리미터 눈금자의 눈금 값은 약 1mm입니다. 그리고 이 근사치는 장치 제조업체의 데이터 시트에 명시된 최대 오류로 표현됩니다. 예를 들어, 길이가 300mm인 강철 눈금자에 허용되는 최대 오차는 mm입니다. 그리고 눈금자가 길수록 기기 오류가 커집니다. 데이터 처리를 단순화하기 위해 반올림 오류만 고려하고 기기 오류는 무시합니다.

스톱워치를 사용하여 시간 간격을 측정하면 버튼을 누를 때 사람의 반응과 관련된 체계적인 오류가 발생합니다. 한 사람은 본질적으로 느리고 프로세스 시작보다 늦게 스톱워치의 버튼을 누르고, 두 번째 사람은 반대로 너무 일찍 스톱워치의 버튼을 누릅니다. 이 문제에 대한 의학 연구에서는 프로세스 시작과 끝에서 버튼을 누를 때 측정된 간격 s의 절대 오차의 평균값을 제공합니다. 이 오류는 주걱. 그게 다야! 그러면 벽돌 낙하를 동시에 측정하는 두 가지 사이의 큰 차이를 이해할 수 있습니다(2.2.1 참조). 그것은 나와 내 파트너의 서로 다른 반응으로 설명될 수 있습니다.

체계적인 오류 외에 또 어떤 오류가 있나요?

이 질문에 답하기 위해, 수평에 대해 a 각도로 스프링 건으로 발사된 작은 공의 비행 범위를 측정하는 (정신적으로) 실험실 작업을 수행해 봅시다. 한 번 쏘면 공이 종이에 자국을 남깁니다. (이렇게 하려면 일반 시트 위에 카본지를 올려놓으면 됩니다.)

그림 19. 공의 비행 범위를 측정하기 위한 실험 계획입니다.

공의 초기 좌표에 해당하는 총 축에 수직인 선 A를 그립니다(그림 19). 선 A와 평행하게 추적점 중 하나를 통과하는 선 B를 그립니다. 거리를 측정해보자 x 나는그 사이에서 우리는 이 값을 비행 범위라고 부를 것입니다. 이러한 측정의 예를 적어 보겠습니다.

표 3. 자를 사용한 볼 범위 측정.

엑스나, mm

매번 같은 총과 같은 공을 사용하는데 결과가 다른 이유는 무엇입니까? 바람을 막기 위해 창문을 닫았지만 흩어진 데이터는 그대로 남아 있었다. 아마도 봄이 아닐까? 총을 장전할 때 스프링이 매번 조금씩 다르게 압축됩니까? 공이 배럴 안에서 매번 조금씩 궤적을 바꾸는 것은 아닐까요? 하지만 더 이상 이것을 고려할 수 없습니다! 이 설정에서는 스프링 압축과 공의 궤적이 완전히 무작위 변수입니다. 따라서 데이터의 분산은 무작위성으로 설명될 수 있으므로 무작위 변수 클래스가 도입되고, 이를 통해 특별한 형식이 사용됩니다. 무작위 오류.

랜덤 변수 데이터 세트를 처리하려면 다음을 입력하십시오. 평균값

및 평균으로부터의 표준편차

,

표 3의 데이터를 사용하면

계산기의 모든 숫자를 복사하면 더 정확한 답을 얻을 수 있다고 생각하는 사람이 있다면 눈금자를 나누는 데 드는 비용과 체계적인 반올림 오류를 상기시켜 드리겠습니다. 반올림 오류는 mm이므로 10분의 1이 넘는 숫자를 드래그하는 것은 의미가 없습니다. 일반적으로 계산할 때 숫자의 문자 수에 대한 엄격한 요구 사항을 도입할 수 있습니다. 중간 계산에서는 원래 데이터의 자릿수보다 한 자릿수를 더 남겨야 합니다.마지막 수치는 예비용이며 측정이 끝날 때 최종 결과를 올바르게 반올림하는 데 도움이 됩니다. 따라서 우리 자신을 가치로 제한하는 것으로 충분합니다.

표 3에 한 줄을 더 추가해 각 값의 평균과의 편차를 기록해 보겠습니다.

표 4. 자를 사용한 볼 범위 측정.

엑스나, mm
Δ x 나는 =x 나는 – , mm – 26,6 10,4 – 8,6 – 0,6 31,4 2,4 – 28,6 20,4

평균과의 편차는 양수일 수도 있고 음수일 수도 있습니다. 이는 이해할 수 있습니다. 평균 값은 항상 값 집합의 중간 어딘가에 있으므로 일부 값보다 크고 다른 값보다 작습니다. 표준 편차를 계산하려면 편차의 제곱을 더한 다음 결과의 제곱근을 구하는 것을 잊지 말고 나누어야 합니다.

이러한 8개의 샷 시리즈를 여러 개 만들면 각 시리즈에는 자체 평균 비행 범위가 있으며 이러한 평균 값의 표준 편차는 다음보다 훨씬 작을 것입니다. (단순화를 위해 표준을 다음과 같이 가정합니다. 각 계열의 편차는 서로 동일함) 및 같음

측정 오류는 무작위(앞서 논의한 것과 동일한 노이즈)와 체계적 오류로 구분됩니다. 다음 예를 사용하여 체계적 오류가 무엇인지 명확히 할 수 있습니다. 그림 1에 표시된 회로를 약간 변경한다고 가정해 보겠습니다. 13.3 저항 R2의 저항. 동시에 전체 측정 척도는 일정량만큼 이동합니다. 온도계 판독값은 결과 값에 일부 상수를 추가(또는 빼더라도 상관 없음)하는 경우에만 현실과 일치합니다. / = /' + 5 여기서 /는 "올바른" 온도 값입니다(임의의 오류로 인해 여전히 실제 값과 다릅니다). /' - 온도계 판독값; 5 - 스케일 이동으로 인한 체계적인 오류의 크기. 체계적 오류의 더 복잡한 경우는 R2를 그대로 두고 R5를 약간 변경하는 경우, 즉 온도계 특성의 기울기 또는 변환 기울기를 변경하는 경우입니다. 이는 판독값에 특정 상수 계수 k를 곱하고 "올바른" 값이 다음 공식에 의해 결정된다는 사실과 동일합니다. t = ht\ 이러한 유형의 오류를 덧셈 및 곱셈 오류라고 합니다.

수학적 통계는 체계적 오류에 대해 "아무것도 모릅니다". 무작위 오류에만 작동합니다. 체계적인 오류를 제거하는 유일한 방법(정밀 부품 선택 제외)은 이 장의 앞부분에서 이미 논의한 교정 절차를 통해서입니다.

무작위 측정 오류 및 평가

나는 독자가 확률의 개념을 잘 알고 있다고 가정합니다. 그렇지 않다면 1946년 작품을 재발행한 이 책을 강력히 추천합니다. 탁월한 표현의 명확성이 특징인 고전 교과서는 여러분의 시야를 넓히는 데 도움이 될 것입니다(저자이자 유명한 수학자 Elena Sergeevna Ventzel, in 과학 및 교육 활동 외에도 I. Grekova라는 가명으로 소설을 썼습니다. 컴퓨터 사용을 포함하여 계측 문제 및 실험 데이터 처리에 수학적 통계 방법을 적용하는 방법에 대한 보다 구체적인 정보는 다음에서 찾을 수 있습니다. 우리는 가장 중요한 것, 즉 무작위 오류 계산에 초점을 맞출 것입니다.

수학적 통계의 기본은 정규분포의 개념입니다. 이것이 난해한 것이라고 생각해서는 안됩니다. 특히 응용 분야로서 확률 및 수학적 통계의 전체 이론은 다른 어떤 수학 분야보다 상식에 기반을 두고 있습니다.

정규분배법칙도 예외는 아니며, 이는 다음과 같이 명확하게 설명될 수 있다. 버스 정류장에서 버스를 기다리고 있다고 상상해 보세요. 차량이 정직하게 작동하고 "간격 15분"이라는 표시가 현실과 일치한다고 가정해 보겠습니다. 이전 버스가 정확히 10시에 정류장을 떠났다는 것도 알려주세요. 질문 - 다음 버스는 몇 시에 출발하나요?

버스가 아무리 이상적으로 작동하더라도 다음 버스가 정확히 10시 15분에 출발할 가능성이 없다는 것은 분명합니다. 버스가 예정대로 공원을 떠났음에도 교차로에서 사고가 발생해 곧바로 브레이크를 밟을 수밖에 없었다. 그러다가 그는 길을 건너던 남학생에게 구금되었습니다. 그러다가 그는 문에 커다란 체크무늬 가방이 박혀 있는 노부인 때문에 버스 정류장에 섰습니다. 그러면 버스가 항상 늦는다는 뜻인가요? 전혀 그렇지 않습니다. 운전자는 계획이 있고 더 빨리 움직이는 데 관심이 있으므로 일부 장소에서는 일정보다 앞서 나갈 수 있으며 때로는 교통 규칙 위반을 경멸하지 않습니다. 따라서 버스가 10시 15분에 출발하는 경우는 특정 확률만 있을 뿐 더 이상은 없습니다.

생각해 보면 다음 버스가 특정 순간에 정류장을 떠날 확률도 이 순간을 얼마나 정확하게 결정하는지에 달려 있다는 것이 분명해집니다. 10시 10분에서 10시 20분 사이의 출발 확률은 10시 14분에서 10시 16분 사이의 간격보다 훨씬 높으며, 불가항력적인 상황이 발생하지 않는 한 10시에서 11시 사이의 간격에서는 출발 가능성이 가장 높다는 것이 분명합니다. 확실히. 사건의 순간을 정확하게 판단할수록 그 사건이 정확히 그 순간에 일어날 확률은 낮아지고, 한계 내에서 어떤 사건이 특정 시점에 정확히 일어날 확률은 0이 됩니다.

이 명백한 모순(그런데 러시아의 위대한 수학자 콜모고로프가 지적한)은 실제로 수학의 표준 방식으로 해결됩니다. 우리는 특정 작은 시간 간격을 사건의 순간으로 간주합니다 5/. 이 간격에서 사건이 발생할 확률은 더 이상 0이 아니라 특정 유한 값 bL이며, 시간 간격이 0이 되는 경향이 있는 비율 5P/5t는 특정 순간에 특정 값과 동일합니다. /?를 확률 분포 밀도라고 합니다. 이 정의는 육체의 밀도 정의와 완전히 유사합니다(실제로 사라지는 작은 부피의 신체 질량도 0이 되는 경향이 있지만 질량 대 부피의 비율은 유한합니다). 따라서 수학적 통계의 많은 개념 해당 물리학 분야에서 빌린 이름을 가지고 있습니다.

버스에 대해 적절하게 공식화된 질문은 다음과 같습니다. 시간에 따른 버스 출발의 확률 밀도 분포는 무엇입니까? 이 패턴을 알면 버스가 특정 시간 내에 떠날 확률이 얼마인지 항상 말할 수 있습니다.

직관적으로 확률밀도분포곡선의 모양을 결정하는 것은 어렵지 않습니다. 예를 들어 특정 버스가 10시 30분 이후에 출발할 가능성이 있습니까? 아니면 반대로 이전 버스보다 더 일찍 출발할 가능성이 있습니까? 그리고 왜 그렇지 않습니까? 그러한 상황은 실제로 상상하기 매우 쉽습니다. 그러나 그러한 확률은 '10시 15분경'에 도착할 확률보다 훨씬 낮다는 것은 분명합니다. 이 가장 가능성이 높은 이 날짜에서 양방향으로 더 멀리 이동할수록 확률 밀도는 거의 0이 될 때까지 낮아집니다(버스가 하루 지연된다는 사실은 놀라운 사건입니다. 이런 일이 발생하면 아마도 더 이상 시간 버스가 없습니다). 즉 확률밀도의 분포는 일종의 종 모양의 곡선처럼 보여야 한다.

확률 이론에서는 사건의 특정 결과 확률에 관한 특정 가정 하에서 이 곡선이 정규 확률 분포 또는 가우스 분포라고 불리는 매우 특정한 형태를 갖게 된다는 것이 입증되었습니다. 정규분포 밀도곡선의 형태와 그에 따른 공식이 그림 1에 나와 있다. 13.5.

쌀. 13.5. 정규 확률 밀도

다음으로, 이 공식에서 개별 매개변수의 의미를 설명하겠지만 지금은 질문에 답하겠습니다. 실제 이벤트, 특히 관심 있는 측정 오류가 항상 정규 분포를 갖는가? 일반적으로 이 질문에 대한 엄격한 대답은 없으며, 이러한 이유 때문입니다. 수학자들은 우리가 이미 사건에 대한 임의의 큰 개별 실현 세트를 가지고 있다고 믿으며 추상화를 다룹니다(버스의 경우 이는 "확률 밀도-시간" 값 쌍의 무한한 테이블이 됩니다). 실생활에서 그러한 시리즈는 얻기가 불가능합니다. 왜냐하면 무한히 오랜 시간 동안 정류장 근처에 서서 출발 순간을 표시해야 할 뿐만 아니라 하나의 이벤트에 대한 연속적인 일련의 실현에 대한 조화로운 그림이기 때문입니다( 특정 버스의 도착)은 궁극적으로 완전히 중단될 것입니다 관련 사항: 경로가 취소될 수 있고, 정류장이 변경될 수 있으며, 차량이 파산하고 미니버스 택시와의 경쟁을 견딜 수 없게 될 것입니다. 그렇게 되면 사건의 정의 자체가 무의미해질 것입니다.

그러나 버스가 운행되는 동안 이론적이긴 하지만 일종의 분포가 있다는 것은 여전히 ​​직관적으로 분명합니다. 주어진 사건에 대한 이러한 이상적이고 무한한 실현 집합을 일반 인구라고 합니다. 특정 조건 하에서 특히 정규 분포를 가질 수 있는 것은 일반 인구입니다. 실제로 우리는 이 일반 인구의 표본을 다루고 있습니다. 더욱이, 수학적 통계에서 해결되는 가장 중요한 문제 중 하나는 두 개의 서로 다른 표본을 가지고 그들이 동일한 일반 모집단에 속한다는 것을 증명하는 것입니다. 즉, 우리 앞에 동일한 사건이 실현되어 있다는 것입니다. 실습에서 가장 중요한 또 다른 작업은 표본을 통해 분포 곡선의 유형과 해당 매개변수를 결정하는 것입니다.

세상에는 정상과 완전히 다른 분포를 갖는 수많은 무작위 사건과 과정이 있지만, 우리가 관심을 갖는 측정 오류 영역에서 측정 횟수가 많고 무작위 특성이 있으므로 모든 오류 분포는 정상입니다. 많은 수의 측정에 대한 가정은 너무 엄격하지 않습니다. 실제로 모든 이론적 관계를 높은 정확도로 관찰하려면 1.5~20개의 측정이면 충분합니다. 그러나 우리는 상당한 관례를 통해 각 측정에서 오류의 진정한 무작위성에 대해 이야기할 수 있습니다. 작업일을 빨리 끝내려는 실험자의 요구에 의해서만 무작위가 아닌 것으로 만들 수 있습니다. 그러나 여기서 수학은 이미 무력합니다.

실험적으로 얻은 분포 특성을 모수 추정치라고 하며, 당연히 어느 정도 확률로 "실제" 값에 해당합니다. 우리의 임무는 "참" 값에서 추정치의 편차가 발생하는 간격을 결정하는 것입니다. 해당 값은 확률일 수 있습니다. 그러나 이제 설명할 시간이 왔습니다. 이 매개변수는 무엇입니까?

그림의 공식에서 13.5 수량 q와 a라는 두 가지 매개 변수가 있습니다. 이를 정규 분포 모멘트(역학의 질량 분포 모멘트와 유사)라고 합니다. 매개변수 q를 수학적 기대값(또는 1차 분포의 순간)이라고 하며 값 a는 표준편차입니다. 그 사각형은 종종 D로 표시되거나 단순히 분산(또는 2차 중심 모멘트)이라고 불리는 데 사용됩니다.

수학적 기대값은 그림에서 볼 수 있듯이 정규 분포 곡선의 최대값(버스를 사용한 예에서 이번에는 10:15)의 가로좌표와 분산입니다. 13.5는 이 최대값에 비해 곡선이 "흐릿해지는" 특성을 나타냅니다. 분산이 클수록 곡선이 더 평평해집니다. 이러한 순간은 투명한 물리적 의미를 갖습니다(밀도의 물리적 분포와의 유사성을 기억하십시오). 수학적 기대는 특정 물체의 질량 중심에 대한 비유이며 분산은 이 중심에 대한 질량의 분포를 특징으로 합니다(분포는 육체의 물질 밀도는 정규 확률 밀도 분포와는 거리가 멀다.

수학적 기대값 μ의 추정치는 산술 평균이며 학교에서 잘 알려져 있습니다.

여기서 n은 측정 횟수입니다. /- 현재 측정 번호(/= l,…,w); ds/는 i번째 경우에 측정된 양의 값입니다.

분산 추정치는 다음 공식을 사용하여 계산됩니다.

(2)

따라서 표준편차의 추정치는 다음과 같습니다.

여기서 (jc, – gPx)는 이전에 계산된 평균과 특정 측정값의 편차입니다.

언뜻보기에는 편차 제곱의 합을 "-1"로 나누지 않고 "-1"로 나누어야한다는 점에 특히 유의해야합니다. 그렇지 않으면 추정치가 편향됩니다. 두 번째로 주목해야 할 점은 평균 주변의 확산이 일부 학교 참고서에서 권장하는 산술 평균 편차가 아니라 공식 (2) 및 (3)을 사용하여 계산된 표준 편차로 정확하게 특성화된다는 것입니다. 후자는 과소 평가되고 편향된 추정치를 제공합니다 ( 이것은 산술 평균 및 교류 전압의 유효 값과의 유사성을 상기시키지 않습니까?).

여백에 메모

수학적 기대치 외에도 확률 분포의 평균값은 모드(mode)와 중앙값(median)이라는 수량으로 특징지어집니다. 정규 분포의 경우 세 가지 양이 모두 일치하지만 다른 경우에는 유용할 수 있습니다. 모드는 가장 가능성 있는 값의 가로좌표입니다(즉, 일상적인 개념과 완전히 일치하는 분포 곡선의 최대값). 모드), 표본 중앙값은 표본의 절반이 왼쪽에 있고 두 번째 절반이 오른쪽에 있는 지점입니다.

원칙적으로 이러한 무작위 오류 계산 공식은 한 가지 중요한 질문이 아니라면 다음으로 제한될 수 있습니다. 추정치를 받았지만 현실과 어느 정도 일치합니까? 올바르게 공식화된 질문은 다음과 같습니다. 산술 평균이 "실제" 값(즉, 수학적 기대치)에서 8 이하(예: 표준 추정치)만큼 벗어날 확률은 얼마입니까? 편차 s)?

값 5를 신뢰구간이라 하고, 해당 확률을 신뢰확률(또는 신뢰도)이라고 합니다. 일반적으로 공식화 된 것과 반대되는 문제를 해결합니다. 신뢰도 값을 설정하고 신뢰 구간 5를 계산합니다. 기술에서는 매우 심각한 경우 99 %의 신뢰도 값을 95 %로 설정하는 것이 일반적입니다. 이 경우 일반적인 측정에 대한 가장 간단한 규칙은 다음과 같습니다. 충분히 많은 수의 측정값(실질적으로 15-20개 이상)이 있는 경우 95%의 신뢰 확률은 2Sy의 신뢰 구간 및 99%의 신뢰 확률에 해당합니다. 3초의 신뢰 구간에 해당합니다. 이는 측정 결과가 제곱 편차의 3배를 초과하지 않는다는 잘 알려진 "3 시그마" 규칙이지만 실제로는 이는 너무 엄격한 요구 사항입니다. 우리가 dc 값에 대해 최소한 1.5다스의 개별 측정을 수행하기에 너무 게으르지 않다면 명확한 양심을 가지고 결과가 다음과 같다고 기록할 수 있습니다.

체계적 오류는 실제 값에서 연구 결과가 체계적으로(무작위, 단방향으로) 벗어나는 것입니다. 체계적 오류에는 몇 가지 주요 유형이 있습니다.

환자 선정 규칙 위반으로 인한 체계적 오류(선택 편향). 이는 다음과 같은 개인을 연구에 포함시키기로 선택한 결과 연구 그룹 형성 단계에서 가장 자주 발생합니다. 대표성이 없다일반 환자 집단의 경우. 이 체계적인 오류는 비교 대상 그룹이 기본 특성뿐만 아니라 연구 결과에 영향을 미치는 다른 요인, 즉 참가자는 실제로 다른 모집단에서 선택됩니다.

예:이전에 모집된 환자를 대조군으로 사용하고 검사 방법이 시간이 지남에 따라 변경된 경우 연대순 이동이 발생합니다.

예:연구에는 연구 광고에 직접 응답한 자원봉사자가 포함됩니다.

선택 편향으로 인해 ISC에 주요 그룹과 비교하기 어려운 통제 그룹이 형성될 수 있습니다. 예를 들어, 다른 질병을 앓고 있는 환자들로 구성된 대조군을 구성할 때 해당 질병과 관련된 교란 요인이 간섭합니다. 반면, 대조군이 일반 인구로 구성된 경우에는 연령, 성별 등의 측면에서 결과가 주요 집단과 비교되지 않을 수 있습니다. 이러한 오류를 방지하려면 연구 중인 매개변수에 잠재적으로 영향을 미칠 수 있는 여러 특성에 따라 환자를 쌍으로 대조 그룹과 주 그룹으로 선택해야 합니다. 오류를 방지하는 또 다른 옵션은 여러 제어 그룹을 사용하는 것입니다.

예를 들어, 가장 심각한 환자가 대조군에서 제외되는 경우 ASC에서 더 일반적으로 발생하는 선택 편향이 RCT에서도 발생할 수 있습니다.

결과 평가 방법을 잘못 선택하여 측정 중에 발생하는 체계적인 오류 연구.비교된 그룹의 환자를 다르게 검사하거나(다른 진단 방법, 검사 빈도) 표준화되지 않은 데이터 수집 방식과 주관적 평가를 사용하는 경우 유사한 오류가 나타납니다.

대부분의 경우 주관적 평가는 독립적인 전문가 및/또는 객관적인 방법에 의한 평가에 비해 과장된 결과를 제공합니다.

예:환자 그룹과 건강한 사람 그룹의 기억 상실 수집 세부 정도의 차이로 인한 오류.

예:방사선 전문의가 환자에 대한 추가 정보가 포함된 방사선 사진을 평가하는 경우 "적극적으로 치료받은" 환자보다 "대조" 환자를 더 면밀하고 비판적으로 평가할 수 있습니다.

교란 요인으로 인한 체계적 오류연구 중인 요인이 상호 연관되어 있고 그 중 일부가 다른 요인의 효과를 왜곡할 때 나타납니다. 이는 선택 편향, 무작위 확률 또는 요인의 실제 상호 작용으로 인한 것일 수 있으므로 연구 결과를 분석할 때 고려해야 합니다.

예:야채 섭취가 질병 발생에 미치는 영향에 대한 연구를 수행할 때 비교 그룹에서 두 번째 위험 요소(예: 흡연)의 유병률 차이는 고려되지 않았습니다.

위약 편향. "더미 효과"는 치료를 시뮬레이션할 때 환자의 상태가 체계적으로 개선되는 것입니다. 대조군이 중재군의 활성 치료와 명백히 구별할 수 없는 치료를 받은 경우, 이들 그룹 간의 차이로 인해 위약 효과가 제거됩니다.

환자를 관찰하는 동안 상태가 호전되었습니다. 이러한 효과 중 일부는 질병의 자연 경과에 기인하고, 일부는 치료의 비특이적 효과(위약 효과)에 기인하며, 그룹 간의 차이는 적극적인 치료로 인한 추가적인 이점에 해당합니다. RCT는 활성 치료의 실제 효과 이외의 모든 효과를 제어하도록 특별히 설계되었습니다.

그림 1. 위약과 비교한 활성 치료의 효과 검출.

체계적인 오류를 제거하는 방법

임상시험 중 오류의 가장 일반적인 원인은 연구자와 피험자의 기대이며, 그 영향은 병력, 위약 치료를 사용한 표준 관리 방법을 사용하여 줄일 수 있습니다.

통제 그룹에 대한 피험자의 유능한 선택;

"눈가림" 방법(개입을 가리는 것);

다양한 피험자 그룹을 형성할 때 무작위화(계층화 포함 또는 제외);

통계적 모델링 방법.

자체 모니터링 테스트- 실험군과 대조군의 경우 하나의 개체가 사용됩니다. 예를 들어 환자는 어떤 날에는 치료를 받고 다른 날에는 위약을 받습니다.

크로스오버 테스트- 일부 환자는 실험군으로, 다른 환자는 대조군으로 선택됩니다. 새로운 기간에 치료를 중단한 후 치료군은 대조군이 되고 대조군은 치료군이 됩니다. 일반적으로 결과를 살펴보면 각 환자가 자신의 통제력을 갖고 있음이 밝혀졌습니다.


그림 2. 시스템 오류의 원인과 이를 해결하는 방법

일치 대조 테스트- 의심되는 요인이 다르지 않도록 각 사례에 대한 통제를 선택하여 수행됩니다. 이렇게 하면 이 연구에서 관심이 없는 알려진 요인으로 인한 그룹 간의 차이를 피할 수 있습니다. 예를 들어, 질병과 식이 패턴의 연관성을 연구할 때, 대조군을 선택하여 소득과 흡연이 건강에 미치는 영향을 배제할 수 있습니다. 피팅 시 모든 사례와 대조군 간의 차이가 비교되는 것이 아니라 개별 쌍 내 차이의 총합이 비교됩니다.

개입 마스킹 방법(“맹검” 연구, 맹검)

RCT를 수행하는 마스크되지 않은(공개) 방법 - 피험자와 연구자는 피험자가 받고 있는 치료에 대해 알고 있습니다. 예를 들어, 이 경우 통제 그룹의 피험자는 다른 수단으로 치료를 시작할 수 있으며 그룹 간의 차이는 사라질 것입니다.

단순 실명 - 피험자는 자신이 어떤 치료를 받고 있는지 알지 못합니다. 이 방법에는 의사와 기타 의료 전문가가 적극적인 치료와 위약(기존 및 새로운 개입)을 받는 환자를 다르게 치료한다는 사실로 인해 오류가 많습니다.

이중맹검 - 연구자와 환자는 자신이나 그룹이 어떤 치료를 받고 있는지 알지 못합니다.

삼중 맹검 - 연구를 구성하고 결과를 분석하는 연구자, 환자 및 임상시험 관리자는 해당 그룹이 어떤 치료를 받고 있는지 알지 못합니다.

무작위화- 무작위 순서로 피험자를 그룹에 배포하는 방법 - 난수표 또는 다른 올바른 방법을 사용합니다. 무작위화는 임상시험의 올바른 수행을 위한 필수 속성이며, 이 경우 무작위화라고 합니다. 난수를 사용하면 특정 치료 그룹에 할당될 확률이 모든 피험자에 대해 동일하다는 것을 보장합니다. 무작위화는 임상시험뿐만 아니라 실험동물을 대상으로 연구할 때에도 사용됩니다.

RCT는 이제 임상시험의 표준이 되었습니다. 환자를 그룹으로 무작위화, 쌍을 이루는 무작위화, 계승, 적응형 및 기타 여러 방법 등 다양한 무작위화 방법이 개발되었습니다.


그림 3. RCT의 도식적 표현.

무작위화의 적절한 방법은 난수표와 컴퓨터 프로그램을 사용하는 것이며 때로는 동전 던지기 등을 사용하는 것입니다. 그룹에 환자 할당의 무작위 순서를 생성하는 방법.

그러나 보편적인 인식에도 불구하고 무작위 배정의 본질은 종종 오해를 받고 있으며, 무작위 배정 대신 단순화된 방법(알파벳, 생년월일, 요일 등)을 사용하고 심지어 무작위 배정을 허용한다는 점에 유의해야 합니다. 그룹에 무작위 할당. 비슷한 "의사 무작위화"예상한 결과를 제공하지 않습니다.

충화- 나이, 질병 기간 등과 같이 결과에 크게 영향을 미치는 요인을 고려하여 치료 그룹 간에 피험자의 균등한 분포를 보장하는 데 사용됩니다. 즉, 예를 들어 남성 환자는 여성 환자와 독립적으로 무작위로 추출됩니다. 계층화는 이러한 요인이 치료 그룹 전체에 균등하게 분포되도록 보장합니다.

통계 모델링- 많은 변수의 작용을 동시에 고려하면서 연결 강도와 영향 효과를 평가하는 데 사용됩니다. 정성적 사건(입원, 사망)의 확률을 통계적으로 모델링하는 가장 일반적인 방법은 다중 로지스틱 회귀 분석입니다.

측정 오류 결정

측정 중에 발생하는 오류(오류)는 무작위 오류와 체계적 오류라는 두 가지 큰 클래스로 나뉩니다. 이들 사이의 차이점을 이해하기 위해 구체적인 예를 살펴보겠습니다. 레버식 저울로 무게를 측정하여 신체의 질량을 결정한다고 가정해 보겠습니다. 일반적으로 체중계의 왼쪽에 몸체를 놓고 오른쪽에 추를 놓는다. 물론 저울의 어깨 부분이 완전히 동일할 수는 없습니다. 길이의 차이로 인해 측정 결과가 왜곡되며, 더욱이 항상 동일한 방식으로 발생합니다. 실험마다 크기와 부호를 유지하는 오류를 체계적 오류라고 합니다. 체계적 오류에는 불평등한 저울, 잘못된 분동 중량, 측정 장비 저울의 부정확한 분할 등과 관련된 오류가 포함됩니다.

그러나 체계적인 오류가 측정 오류의 유일한 원인은 아닙니다. 동일한 신체 무게 측정 실험에서는 실험마다 오차가 달라질 수 있습니다. 실제로 밸런스 빔은 약간의 마찰로 인해 흔들리게 됩니다. 따라서 스케일의 하중이 일정하더라도 항상 같은 위치에서 멈추지 않고 마찰력에 의해 크기가 결정되는 영역에 있는 다른 위치에서 중지됩니다. 이 경우 오류는 경험에서 경험으로 반복되지 않습니다.

무작위 오류는 실험마다 크기와 부호가 예기치 않게 변경되는 오류입니다.

무작위 오류가 장비 결함과 관련이 없지만 연구 중인 현상의 본질에 있는 경우가 있습니다.

예를 들어, 일부 방사성 원소의 방사성 붕괴를 연구하는 경우 1분 동안 기록된 붕괴 횟수는 일정하게 유지되지 않습니다. 예를 들어 일부 측정에서는 분당 18,15,12,17개의 붕괴를 기록하고 다른 측정에서는 23, 25, 17, 22개의 붕괴를 기록합니다. 평균적으로 분당 20번의 붕괴가 발생합니다. 분당 20번의 붕괴라는 평균값과 측정된 붕괴 횟수의 편차는 순전히 무작위입니다. 그리고 그것은 연구되는 현상의 본질과도 관련이 있습니다.

실험을 여러 번 반복하면 무작위 오류의 영향을 줄일 수 있습니다. 결과가 평균 값을 초과하는 실험은 결과가 평균 값보다 작은 실험만큼 자주 발생합니다.

이런 방식으로 시스템 오류의 기여도를 줄이는 것은 불가능합니다. 이러한 오류의 주요 원인은 측정 장비의 불완전성입니다. 따라서 이를 줄이기 위해서는 오류가 더 적은 고급 측정 장비를 사용할 필요가 있습니다. 측정 장비의 품질은 정확도 등급, 즉 이러한 장치가 측정된 값에 도입할 수 있는 최대 오류입니다. 장치의 정확도 등급이 높을수록 이 오류는 낮아집니다. 장비를 개선해야 할 필요성 외에도 실험 방법론이 변경될 수 있습니다. 예를 들어, 체중 측정 실험에서는 저울의 불평등한 균형을 줄이거나 체중계의 왼쪽 팬에서 한 번, 오른쪽 팬에서 한 번, 몸의 무게를 두 번 측정하고 얻은 결과의 평균을 내야 합니다.

체계적인 오류동일한 양을 반복 측정할 때 일정하게 유지되거나 자연스럽게 변화하는 측정 오류의 구성 요소입니다. 체계적인 오류는 비 무작위 요소의 특정 기능을 나타내는 것으로 가정되며 그 구성은 측정 장비의 물리적, 구조적 및 기술적 특징, 사용 조건 및 관찰자의 개별 특성에 따라 달라집니다. 체계적인 오류가 발생하는 복잡한 결정론적 패턴은 측정 장비를 만들고 측정 장비를 구성하는 동안 또는 측정 실험을 준비하고 수행하는 과정에서 직접 결정됩니다. 고품질 재료 및 첨단 기술을 사용하여 측정 방법을 개선하면 실제로 관찰 결과를 처리할 때 그 존재를 고려할 수 없을 정도로 체계적인 오류를 제거하는 것이 가능해집니다.

체계적인 오류는 일반적으로 발생 이유와 측정 중 나타나는 특성에 따라 분류됩니다.

발생 원인에 따라 네 가지 유형의 체계적 오류가 고려됩니다.

1. 방법 오류 또는 이론적 오류측정 방법 전체에 대한 수용된 이론의 오류 또는 불충분한 개발 또는 측정을 수행할 때 이루어진 단순화로 인해 발생합니다.

물체의 제한된 부분에서 측정된 특성을 전체 물체에 외삽할 때, 후자가 측정되는 특성의 균질성을 갖지 않는 경우에도 방법의 오류가 발생합니다. 따라서 원통형 샤프트의 직경이 한 단면과 한 방향에서 측정하여 얻은 결과와 동일하다는 점을 고려하면 연구 중인 샤프트 모양의 편차에 의해 완전히 결정되는 체계적인 오류가 허용됩니다. 특정 시료의 질량과 부피를 측정하여 물질의 밀도를 결정할 때 시료에 일정량의 불순물이 포함되어 있으면 체계적 오류가 발생하며 측정 결과는 일반적으로 해당 물질의 특성으로 간주됩니다.

방법 오류에는 측정 장비가 물체의 측정된 특성에 미치는 영향으로 인해 발생하는 오류도 포함되어야 합니다. 예를 들어, 길이를 측정할 때, 사용된 기기의 측정력이 상당히 클 때, 속도가 충분하지 않은 장비로 빠른 프로세스를 기록할 때, 액체 또는 기체 온도계로 온도를 측정할 때 등 유사한 현상이 발생합니다.

2. 도구 오류사용된 측정 장비의 오류에 따라 다릅니다. 장비 오류 중에서 측정 장비 제조의 부정확성과 관련이 없고 측정 장비의 구조적 설계 자체에 기인한 회로 오류는 별도의 그룹에 할당됩니다. 기기 오류에 대한 연구는 측정 장치의 정확도 이론이라는 특수 분야의 주제입니다.

3. 잘못된 설치 및 측정 장비의 상대적인 위치로 인해 발생하는 오류,단일 복합체의 일부, 특성의 불일치, 외부 온도, 중력, 방사선 및 기타 분야의 영향, 전원 공급 장치의 불안정성, 장치 전기 회로의 입력 및 출력 매개 변수 불일치 등

4. 개인적인 실수관찰자의 개인적인 특성 때문입니다. 이러한 종류의 오류는 신호 등록의 지연 또는 진행, 눈금 분할의 10분의 1의 잘못된 계산, 두 표시 사이의 중간에 스트로크를 설정할 때 발생하는 비대칭 등으로 인해 발생합니다.

측정 과정 중 동작의 특성에 따라 체계적인 오류는 상수와 변수로 구분됩니다.

지속적인 체계적 오류예를 들어 기준점이 잘못 설정되었거나 측정 장비가 잘못 교정 및 조정된 경우 발생하며 모든 반복 관찰 중에 일정하게 유지됩니다. 따라서 이미 발생했다면 관찰 결과에서 탐지하기가 매우 어렵습니다.

중에 가변적인 체계적 오류진행형과 주기적을 구별하는 것이 일반적입니다.

점진적인 오류예를 들어, 계량할 때 밸런스 암 중 하나가 다른 쪽보다 열원에 더 가까울 때 발생하므로 더 빨리 가열되고

길어진다. 이로 인해 원점의 체계적인 이동과 눈금 판독값의 단조로운 변화가 발생합니다.

주기적 오류포인터의 회전축이 눈금의 축과 일치하지 않는 경우 원형 눈금이 있는 측정 장비에 내재되어 있습니다.

다른 모든 유형의 체계적 오류는 일반적으로 복잡한 법칙에 따라 달라지는 오류라고 합니다.

특정 측정 설치에 필요한 측정 장비를 만들 때 체계적인 오류의 영향을 제거할 수 없는 경우 측정 프로세스를 특별히 구성하고 결과를 수학적 처리해야 합니다. 체계적인 오류를 처리하는 방법은 전체 또는 부분 보상을 통해 오류를 감지하고 제거하는 것으로 구성됩니다. 종종 극복할 수 없는 주요 어려움은 체계적인 오류를 정확하게 탐지하는 데 있으므로 때로는 이에 대한 대략적인 분석에 만족해야 합니다.

체계적 오류를 탐지하는 방법.체계적인 오류가 있는 상태에서 얻은 관찰 결과를 호출합니다. 교정되지 않은수정된 것과는 달리 획으로 지정을 제공합니다(예: X1, X2등.). 또한 이러한 조건에서 계산된 관찰 결과의 산술 평균값과 편차를 수정되지 않은 것으로 부르고 이러한 수량의 기호에 소수를 붙입니다. 따라서,

수정되지 않은 관찰 결과에는 체계적인 오류가 포함되어 있으며 각 i 번째 관찰에 대한 합계는 8로 표시됩니다. 그러면 수학적 기대치는 측정된 수량의 실제 값과 일치하지 않으며 특정 값 0만큼 다릅니다. , 수정되지 않은 산술 평균의 체계적 오류라고 합니다. 정말,

체계적인 오류가 일정한 경우, 즉 0 / = 0, /=1,2, ..., 피,그러면 수정되지 않은 분산을 직접 사용하여 일련의 관측치의 분산을 추정할 수 있습니다. 그렇지 않으면 먼저 개별 측정 결과에 크기의 체계적 오류와 부호의 역수와 같은 소위 수정을 도입하여 수정해야 합니다.

따라서 보정된 산술 평균을 찾고 측정값의 실제 값에 대한 분산을 평가하려면 각 사례에 따라 보정을 도입하거나 측정 자체를 구성하여 체계적인 오류를 감지하고 제거해야 합니다. 체계적 오류를 탐지하는 몇 가지 방법에 대해 자세히 살펴보겠습니다.

일정한 체계적 오류는 산술 평균에서 관찰 결과의 무작위 편차 값에 영향을 미치지 않으므로 관찰 결과를 수학적 처리하여 탐지할 수 없습니다. 이러한 오류의 분석은 예를 들어 측정 장비를 점검할 때 얻은 이러한 오류에 대한 사전 지식을 바탕으로만 가능합니다. 검증 중에 측정된 값은 일반적으로 실제 값이 알려진 표준 측정값으로 재현됩니다. 따라서 관찰 결과의 산술 평균과 측정 인증 오류 및 무작위 측정 오류에 의해 결정되는 정확도를 갖는 측정 값 간의 차이는 원하는 체계적 오류와 같습니다.

여러 관측 결과에서 체계적인 오류를 감지하는 가장 효과적인 방법 중 하나는 산술 평균에서 관측 결과의 무작위 편차에 대한 수정되지 않은 일련의 값을 플롯하는 것입니다.

일정한 체계적 오차를 검출하기 위해 고려된 방법은 다음과 같이 공식화될 수 있습니다. 관측 조건이 변경될 때 관찰 결과의 수정되지 않은 편차가 급격하게 변하면 이러한 결과에는 관찰 조건에 따라 일정한 체계적 오차가 포함됩니다.

체계적 오류는 결정론적 수량이므로 원칙적으로 항상 계산되어 측정 결과에서 제외될 수 있습니다. 체계적인 오류를 제거한 후 관찰 결과의 수정된 산술 평균과 수정된 편차를 구하여 결과의 ​​분산 정도를 평가할 수 있습니다.

관측 결과를 수정하기 위해 체계적 오류 크기와 동일하고 부호가 반대인 수정 사항이 추가됩니다. 교정은 장비를 점검할 때 실험적으로 결정되거나 일반적으로 약간의 정확도가 제한된 특수 연구의 결과로 결정됩니다.

수정 사항은 각 특정 사례에 대해 계산되는 공식 형식으로 지정할 수도 있습니다. 예를 들어 표준 압력 게이지를 사용하여 측정하고 확인할 때 자유 낙하 가속도의 로컬 값에 대한 판독값을 수정해야 합니다.

어디 아르 자형- 측정된 압력.

수정을 도입하면 잘 정의된 하나의 체계적 오류만 제거되므로 측정 결과에 매우 많은 수의 수정을 도입해야 하는 경우가 많습니다. 이 경우 보정 결정의 정확도가 제한되어 랜덤 오류가 누적되고 측정 결과의 분산이 증가합니다.

가장 중요한 구성 요소에 대한 수정을 도입한 후에도 남아 있는 체계적 오류에는 다음과 같은 여러 가지 기본 구성 요소가 포함됩니다. 체계적 오류의 제외되지 않은 잔차.여기에는 오류가 포함됩니다.

개정의 정의

수정 결정을 위한 공식에 포함된 영향량의 측정 정확도에 따라 달라집니다.

영향을 미치는 양(주위 온도, 공급 전압 등)의 변동과 관련됩니다.

나열된 오류는 작으며 이에 대한 수정 사항은 도입되지 않습니다.

편집자의 선택
칼로리 함량: 지정되지 않음 요리 시간: 지정되지 않음 우리 모두는 어린 시절의 맛을 좋아합니다. 어린 시절의 맛이 우리를 "아름답고 먼 곳"으로 데려가기 때문입니다....

통조림 옥수수는 정말 놀라운 맛을 가지고 있습니다. 그것의 도움으로 옥수수를 곁들인 배추 샐러드 요리법을 얻을 수 있습니다...

우리의 꿈은 때때로 특이한 인상을 남기고 그것이 무엇을 의미하는지에 대한 의문이 생깁니다. 해결해야 한다는 사실 때문에...

혹시 꿈에서 도움을 요청하셨나요? 마음 속으로는 자신의 능력이 의심스럽고 현명한 조언과 지원이 필요합니다. 또 왜 꿈을 꾸지...
커피 찌꺼기에 대한 운세는 인기가 많으며 컵 바닥에 운명의 표시와 치명적인 상징이 표시되어 흥미를 자아냅니다. 이런 예측으로...
나이가 어리다. 슬로우 쿠커에 당면을 곁들인 죽 요리를 준비하는 몇 가지 요리법을 설명하겠습니다. 먼저 살펴 보겠습니다.
와인은 모든 행사에서뿐만 아니라 더 강한 것을 원할 때도 마시는 음료입니다. 하지만 테이블 와인은...
이제 다양한 비즈니스 대출이 매우 커졌습니다. 기업가는 종종 진정으로 수익성 있는 대출을 찾을 수 있습니다...
원하는 경우 오븐에 계란을 넣은 미트 로프를 얇은 베이컨 조각으로 감쌀 수 있습니다. 그것은 접시에 놀라운 향기를 줄 것입니다. 그리고 계란 대신...