Dlaczego potrzebne są obliczenia przedziału ufności? Korzystając z przedziału ufności, możemy to zrobić


Każda próbka daje jedynie przybliżone wyobrażenie o populacji ogólnej, a wszystkie charakterystyki statystyczne próbki (średnia, tryb, wariancja...) są pewnym przybliżeniem lub powiedzmy oszacowaniem ogólnych parametrów, których w większości przypadków nie da się obliczyć ze względu na na niedostępność ogółu społeczeństwa (ryc. 20).

Rysunek 20. Błąd próbkowania

Można jednak określić przedział, w którym z pewnym prawdopodobieństwem mieści się prawdziwa (ogólna) wartość cechy statystycznej. Ten przedział nazywa się D przedział ufności (CI).

Zatem ogólna średnia wartość z prawdopodobieństwem 95% mieści się w tym zakresie

od do, (20)

Gdzie T – wartość tabeli testu Studenta dla α =0,05 i F= N-1

W tym przypadku można również znaleźć 99% CI T wybrany dla α =0,01.

Jakie jest praktyczne znaczenie przedziału ufności?

    Szeroki przedział ufności wskazuje, że średnia próbki nie odzwierciedla dokładnie średniej populacji. Dzieje się tak zazwyczaj na skutek niewystarczającej liczebności próby lub jej niejednorodności, tj. duże rozproszenie. Oba dają większy błąd średniej i odpowiednio szerszy CI. I to jest podstawa do powrotu do etapu planowania badań.

    Górna i dolna granica CI pozwalają oszacować, czy wyniki będą istotne klinicznie

Zatrzymajmy się bardziej szczegółowo nad kwestią statystycznego i klinicznego znaczenia wyników badań właściwości grupowych. Pamiętajmy, że zadaniem statystyki jest wykrycie choć części różnic w populacjach ogólnych na podstawie danych próbnych. Wyzwaniem dla klinicystów jest wykrycie różnic (a nie tylko różnic), które pomogą w diagnozie lub leczeniu. A wnioski statystyczne nie zawsze są podstawą wniosków klinicznych. Zatem statystycznie istotny spadek stężenia hemoglobiny o 3 g/l nie jest powodem do niepokoju. I odwrotnie, jeśli jakiś problem w organizmie człowieka nie jest powszechny na poziomie całej populacji, nie jest to powód, aby nie zajmować się tym problemem.

Spójrzmy na tę sytuację przykład.

Naukowcy zastanawiali się, czy chłopcy, którzy cierpieli na jakąś chorobę zakaźną, nie pozostają w tyle za rówieśnikami pod względem wzrostu. W tym celu przeprowadzono badanie reprezentacyjne, w którym wzięło udział 10 chłopców, którzy cierpieli na tę chorobę. Wyniki przedstawiono w tabeli 23.

Tabela 23. Wyniki przetwarzania statystycznego

dolna granica

górna granica

Standardy (cm)

przeciętny

Z obliczeń tych wynika, że ​​średni wzrost 10-letnich chłopców, którzy cierpieli na jakąś chorobę zakaźną, jest zbliżony do normalnego (132,5 cm). Jednakże dolna granica przedziału ufności (126,6 cm) wskazuje, że istnieje 95% prawdopodobieństwo, że rzeczywisty średni wzrost tych dzieci odpowiada pojęciu „niskiego wzrostu”, tj. te dzieci są karłowate.

W tym przykładzie wyniki obliczeń przedziału ufności są istotne klinicznie.

Oszacowanie przedziałów ufności

Cele nauczania

Statystyki uwzględniają następujące kwestie dwa główne zadania:

    Mamy pewne szacunki oparte na przykładowych danych i chcemy sformułować probabilistyczne stwierdzenie na temat tego, gdzie leży prawdziwa wartość szacowanego parametru.

    Mamy konkretną hipotezę, którą należy przetestować na przykładowych danych.

W tym temacie rozważamy pierwsze zadanie. Wprowadźmy jeszcze definicję przedziału ufności.

Przedział ufności to przedział zbudowany wokół szacowanej wartości parametru i pokazujący, gdzie znajduje się prawdziwa wartość szacowanego parametru z określonym z góry prawdopodobieństwem.

Po przestudiowaniu materiału na ten temat:

    dowiedzieć się, jaki jest przedział ufności dla oszacowania;

    nauczyć się klasyfikować problemy statystyczne;

    opanować technikę konstruowania przedziałów ufności, zarówno przy użyciu wzorów statystycznych, jak i przy użyciu narzędzi programowych;

    nauczyć się określać wymaganą liczebność próby, aby osiągnąć określone parametry dokładności szacunków statystycznych.

Rozkłady cech próbek

Rozkład T

Jak omówiono powyżej, rozkład zmiennej losowej jest zbliżony do standaryzowanego rozkładu normalnego o parametrach 0 i 1. Ponieważ nie znamy wartości σ, zastępujemy ją jakąś estymatą s. Ilość ma już inny rozkład, a mianowicie lub Dystrybucja studencka, który jest określony przez parametr n -1 (liczba stopni swobody). Rozkład ten jest zbliżony do rozkładu normalnego (im większe n, tym bliższe rozkłady).

Na ryc. 95
przedstawiono rozkład Studenta z 30 stopniami swobody. Jak widać jest on bardzo zbliżony do rozkładu normalnego.

Podobnie do funkcji pracy z rozkładem normalnym ROZKŁAD NORMALNY i NORMINV, istnieją funkcje do pracy z rozkładem t - ROZKŁAD.T. STUDRASOBR (TINV). Przykład wykorzystania tych funkcji można zobaczyć w pliku STUDRASP.XLS (szablon i rozwiązanie) oraz na rys. 96
.

Rozkłady innych cech

Jak już wiemy, aby określić dokładność oszacowania oczekiwań matematycznych, potrzebujemy rozkładu t. Aby oszacować inne parametry, takie jak wariancja, wymagane są różne rozkłady. Dwa z nich to dystrybucja F i x 2 -dystrybucja.

Przedział ufności dla średniej

Przedział ufności- jest to przedział zbudowany wokół szacowanej wartości parametru i pokazujący, gdzie z określonym a priori prawdopodobieństwem znajduje się prawdziwa wartość szacowanego parametru.

Następuje konstrukcja przedziału ufności dla wartości średniej następująco:

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby oszacować popyt na niego, menadżer planuje losowo wybrać 40 gości spośród tych, którzy już go wypróbowali i poprosić ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwane liczbę punktów, jaką otrzyma nowy produkt i skonstruuj 95% przedział ufności dla tego oszacowania. Jak to zrobić? (patrz plik SANDWICH1.XLS (szablon i rozwiązanie).

Rozwiązanie

Aby rozwiązać ten problem, możesz użyć . Wyniki przedstawiono na ryc. 97
.

Przedział ufności dla wartości całkowitej

Czasami, korzystając z przykładowych danych, konieczne jest oszacowanie nie oczekiwania matematycznego, ale całkowitej sumy wartości. Na przykład w sytuacji audytora interesem może być oszacowanie nie średniej wielkości konta, ale sumy wszystkich rachunków.

Niech N będzie całkowitą liczbą elementów, n będzie wielkością próby, T 3 będzie sumą wartości w próbie, T” będzie oszacowaniem sumy całej populacji, następnie , a przedział ufności oblicza się ze wzoru , gdzie s jest oszacowaniem odchylenia standardowego dla próby, a jest oszacowaniem średniej dla próby.

Przykład

Załóżmy, że agencja podatkowa chce oszacować łączną kwotę zwrotu podatku dla 10 000 podatników. Podatnik albo otrzymuje zwrot podatku, albo płaci dodatkowy podatek. Znajdź 95% przedział ufności dla kwoty zwrotu, zakładając wielkość próby 500 osób (patrz plik KWOTA ZWROTU.XLS (szablon i rozwiązanie).

Rozwiązanie

StatPro nie ma specjalnej procedury w tym przypadku, można jednak zauważyć, że granice można wyznaczyć z granic dla średniej na podstawie powyższych wzorów (ryc. 98
).

Przedział ufności dla proporcji

Niech p będzie matematycznym oczekiwaniem udziału klientów, a p b będzie oszacowaniem tego udziału uzyskanym z próby o wielkości n. Można to wykazać dla wystarczająco dużych rozkład ocen będzie zbliżony do normalnego z oczekiwaniem matematycznym p i odchyleniem standardowym . Standardowy błąd oszacowania w tym przypadku wyraża się jako , a przedział ufności wynosi .

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby ocenić popyt na niego, menadżer wybrał losowo 40 gości spośród tych, którzy już go wypróbowali i poprosił ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwany udział klientów, którzy ocenią nowy produkt na co najmniej 6 punktów (oczekuje, że ci klienci będą konsumentami nowego produktu).

Rozwiązanie

Początkowo tworzymy nową kolumnę na podstawie atrybutu 1 jeśli ocena klienta była większa niż 6 punktów, a w innym przypadku 0 (patrz plik SANDWICH2.XLS (szablon i rozwiązanie).

Metoda 1

Licząc liczbę 1, szacujemy udział, a następnie korzystamy ze wzorów.

Wartość zcr pobierana jest ze specjalnych tablic rozkładu normalnego (na przykład 1,96 dla 95% przedziału ufności).

Stosując to podejście i konkretne dane do skonstruowania przedziału 95%, otrzymujemy następujące wyniki (ryc. 99).
). Wartość krytyczna parametru zcr wynosi 1,96. Błąd standardowy oszacowania wynosi 0,077. Dolna granica przedziału ufności wynosi 0,475. Górna granica przedziału ufności wynosi 0,775. Menedżer ma więc prawo wierzyć z 95% pewnością, że odsetek klientów oceniających nowy produkt na 6 lub więcej punktów będzie się mieścić w przedziale 47,5–77,5.

Metoda 2

Problem ten można rozwiązać za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy zauważyć, że udział w tym przypadku pokrywa się ze średnią wartością kolumny Typ. Następnie aplikujemy StatPro/Wnioskowanie statystyczne/Analiza jednej próbki skonstruować przedział ufności średniej (oszacowanie oczekiwań matematycznych) dla kolumny Typ. Wyniki uzyskane w tym przypadku będą bardzo zbliżone do wyników pierwszej metody (ryc. 99).

Przedział ufności dla odchylenia standardowego

s służy jako estymata odchylenia standardowego (wzór podano w rozdziale 1). Funkcja gęstości oszacowania s jest funkcją chi-kwadrat, która podobnie jak rozkład t ma n-1 stopni swobody. Istnieją specjalne funkcje do pracy z tą dystrybucją CHIDIST i CHIINV.

Przedział ufności w tym przypadku nie będzie już symetryczny. Konwencjonalny diagram graniczny pokazano na ryc. 100.

Przykład

Maszyna musi produkować części o średnicy 10 cm, jednak z różnych powodów pojawiają się błędy. Kontrolera jakości niepokoją dwie okoliczności: po pierwsze, średnia wartość powinna wynosić 10 cm; po drugie, nawet w tym przypadku, jeśli odchylenia są duże, wiele części zostanie odrzuconych. Codziennie wykonuje próbkę 50 części (patrz plik KONTROLA JAKOŚCI.XLS (szablon i rozwiązanie). Jakie wnioski może dać taka próbka?

Rozwiązanie

Skonstruujmy 95% przedziały ufności dla średniej i odchylenia standardowego za pomocą StatPro/Wnioskowanie statystyczne/Analiza jednej próbki(ryc. 101
).

Następnie, korzystając z założenia o normalnym rozkładzie średnic, obliczamy odsetek produktów wadliwych, ustalając maksymalne odchylenie na poziomie 0,065. Korzystając z możliwości tabeli podstawieniowej (w przypadku dwóch parametrów) wykreślamy zależność proporcji defektów od wartości średniej i odchylenia standardowego (ryc. 102
).

Przedział ufności dla różnicy między dwiema średnimi

Jest to jedno z najważniejszych zastosowań metod statystycznych. Przykłady sytuacji.

    Kierownik sklepu odzieżowego chciałby wiedzieć, ile mniej więcej przeciętna klientka wydaje w sklepie, niż przeciętny mężczyzna.

    Obie linie latają na podobnych trasach. Organizacja konsumencka chciałaby porównać różnicę między średnim oczekiwanym czasem opóźnienia lotu w przypadku obu linii lotniczych.

    Firma wysyła kupony na określone rodzaje towarów w jednym mieście, a w innym nie. Menedżerowie chcą porównać średnie wolumeny zakupów tych produktów w ciągu najbliższych dwóch miesięcy.

    Dealer samochodowy często ma do czynienia z małżeństwami podczas prezentacji. Aby zrozumieć ich osobiste reakcje na prezentację, pary często przeprowadzają oddzielne wywiady. Menedżer chce ocenić różnicę w ocenach wystawianych przez mężczyzn i kobiety.

Przypadek próbek niezależnych

Różnica między średnimi będzie miała rozkład t z n 1 + n 2 - 2 stopniami swobody. Przedział ufności dla μ 1 - μ 2 wyraża zależność:

Problem ten można rozwiązać nie tylko za pomocą powyższych formuł, ale także za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy użyć

Przedział ufności dla różnicy proporcji

Niech będzie matematycznym oczekiwaniem udziałów. Niech będą ich przykładowymi szacunkami, skonstruowanymi z próbek o wielkości odpowiednio n 1 i n 2. Następnie następuje oszacowanie różnicy. Dlatego przedział ufności tej różnicy wyraża się jako:

Tutaj z cr jest wartością uzyskaną z rozkładu normalnego przy użyciu specjalnych tabel (na przykład 1,96 dla 95% przedziału ufności).

Błąd standardowy estymacji wyraża się w tym przypadku zależnością:

.

Przykład

Sklep przygotowując się do dużej wyprzedaży przeprowadził następujące badania marketingowe. Wybrano 300 najlepszych nabywców i losowo podzielono ich na dwie grupy po 150 członków każda. Do wszystkich wybranych klientów wysłano zaproszenia do wzięcia udziału w wyprzedaży, jednak jedynie członkowie pierwszej grupy otrzymali kupon uprawniający do 5% rabatu. Podczas sprzedaży rejestrowano zakupy wszystkich 300 wybranych kupujących. Jak menedżer może zinterpretować wyniki i ocenić skuteczność kuponów? (patrz plik COUPONS.XLS (szablon i rozwiązanie)).

Rozwiązanie

W naszym konkretnym przypadku spośród 150 klientów, którzy otrzymali kupon rabatowy, 55 dokonało zakupu w promocji, a spośród 150, którzy nie otrzymali kuponu, jedynie 35 dokonało zakupu (ryc. 103
). Wówczas wartości proporcji próbek wynoszą odpowiednio 0,3667 i 0,2333. A różnica próbek między nimi wynosi odpowiednio 0,1333. Zakładając 95% przedział ufności, z tabeli rozkładu normalnego wynika, że ​​z cr = 1,96. Obliczenie błędu standardowego różnicy próbek wynosi 0,0524. Ostatecznie stwierdzamy, że dolna granica 95% przedziału ufności wynosi odpowiednio 0,0307, ​​a górna granica wynosi odpowiednio 0,2359. Uzyskane wyniki można interpretować w ten sposób, że na każdych 100 klientów, którzy otrzymali kupon rabatowy, możemy spodziewać się od 3 do 23 nowych klientów. Musimy jednak pamiętać, że wniosek ten sam w sobie nie oznacza efektywności wykorzystania kuponów (bo udzielając rabatu tracimy zysk!). Pokażmy to na konkretnych danych. Załóżmy, że średni rozmiar zakupu wynosi 400 rubli, z czego 50 rubli. sklep ma zysk. Wówczas oczekiwany zysk na 100 klientach, którzy nie otrzymali kuponu wynosi:

50 0,2333 100 = 1166,50 rub.

Podobne wyliczenia dla 100 klientów, którzy otrzymali kupon dają:

30 0,3667 100 = 1100,10 rub.

Spadek średniego zysku do 30 tłumaczy się faktem, że korzystając z rabatu klienci, którzy otrzymali kupon, dokonają zakupu średnio za 380 rubli.

Ostateczny wniosek wskazuje zatem na nieefektywność wykorzystania tego typu kuponów w tej konkretnej sytuacji.

Komentarz. Problem ten można rozwiązać za pomocą standardowych narzędzi StatPro. Aby to zrobić, wystarczy sprowadzić ten problem do problemu oszacowania różnicy między dwiema średnimi za pomocą metody, a następnie zastosować StatPro/Wnioskowanie statystyczne/Analiza dwóch próbek skonstruować przedział ufności dla różnicy pomiędzy dwiema wartościami średnimi.

Sterowanie długością przedziału ufności

Długość przedziału ufności zależy od następujące warunki:

    dane bezpośrednio (odchylenie standardowe);

    poziom istotności;

    wielkość próbki.

Wielkość próby do oszacowania średniej

Najpierw rozważmy problem w ogólnym przypadku. Oznaczmy wartość połowy długości podanego nam przedziału ufności jako B (ryc. 104).
). Wiemy, że przedział ufności dla średniej wartości jakiejś zmiennej losowej X wyraża się jako , Gdzie . Wierząc:

i wyrażając n, otrzymujemy .

Niestety nie znamy dokładnej wartości wariancji zmiennej losowej X. Ponadto nie znamy wartości tcr, ponieważ zależy ona od n poprzez liczbę stopni swobody. W tej sytuacji możemy wykonać następujące czynności. Zamiast wariancji s używamy pewnego oszacowania wariancji w oparciu o wszelkie dostępne implementacje badanej zmiennej losowej. Zamiast wartości tcr dla rozkładu normalnego używamy wartości zcr. Jest to całkiem akceptowalne, ponieważ funkcje gęstości rozkładu dla rozkładu normalnego i t są bardzo zbliżone (z wyjątkiem przypadku małego n). Zatem wymagana formuła ma postać:

.

Ponieważ wzór daje, ogólnie rzecz biorąc, wyniki niecałkowite, za pożądaną wielkość próby przyjmuje się zaokrąglenie z nadmiarem wyniku.

Przykład

Restauracja typu fast food planuje poszerzyć swój asortyment o nowy rodzaj kanapki. Aby ocenić popyt na ten produkt, menedżer planuje losowo wybrać liczbę odwiedzających spośród tych, którzy już go wypróbowali, i poprosić ich o ocenę swojego stosunku do nowego produktu w skali od 1 do 10. Menedżer chce oszacować oczekiwaną liczbę punktów, jaką otrzyma nowy produkt i skonstruuj 95% przedział ufności dla tego oszacowania. Jednocześnie chce, aby połowa szerokości przedziału ufności nie przekraczała 0,3. Z iloma gośćmi musi przeprowadzić wywiad?

wygląda tak:

Tutaj ot jest oszacowaniem proporcji p, a B jest daną połową długości przedziału ufności. Zawyżenie wartości n można uzyskać za pomocą tej wartości ot= 0,5. W tym przypadku długość przedziału ufności nie przekroczy określonej wartości B dla żadnej prawdziwej wartości p.

Przykład

Niech menedżer z poprzedniego przykładu zaplanuje oszacowanie udziału klientów, którzy preferowali nowy typ produktu. Chce skonstruować 90% przedział ufności, którego połowa długości nie przekracza 0,05. Ilu klientów należy uwzględnić w próbie losowej?

Rozwiązanie

W naszym przypadku wartość z cr = 1,645. Dlatego wymaganą ilość oblicza się jako .

Jeżeli menedżer miałby podstawy sądzić, że pożądana wartość p wynosi na przykład około 0,3, to podstawiając tę ​​wartość do powyższego wzoru otrzymalibyśmy mniejszą wartość próbki losowej, a mianowicie 228.

Wzór do ustalenia losowa wielkość próby w przypadku różnicy między dwiema średnimi napisane jako:

.

Przykład

Niektóre firmy komputerowe mają centrum obsługi klienta. W ostatnim czasie wzrosła liczba skarg klientów na złą jakość obsługi. Centrum usług zatrudnia głównie dwa typy pracowników: tych, którzy nie mają dużego doświadczenia, ale ukończyli specjalne kursy przygotowawcze, oraz tych, którzy mają duże doświadczenie praktyczne, ale nie ukończyli specjalnych kursów. Firma chce przeanalizować reklamacje klientów na przestrzeni ostatnich sześciu miesięcy i porównać średnią liczbę reklamacji dla każdej z dwóch grup pracowników. Zakłada się, że liczebność próbek w obu grupach będzie taka sama. Ilu pracowników należy uwzględnić w próbie, aby uzyskać przedział 95% z połową długości nie większą niż 2?

Rozwiązanie

Tutaj σ ots jest oszacowaniem odchylenia standardowego obu zmiennych losowych przy założeniu, że są one bliskie. Zatem w naszym problemie musimy w jakiś sposób uzyskać to oszacowanie. Można to zrobić na przykład w następujący sposób. Analizując dane dotyczące skarg klientów w ciągu ostatnich sześciu miesięcy, menedżer może zauważyć, że na jednego pracownika przypada zazwyczaj od 6 do 36 skarg. Wiedząc, że w przypadku rozkładu normalnego prawie wszystkie wartości różnią się od średniej o więcej niż trzy odchylenia standardowe, może zasadnie wierzyć, że:

, skąd σ ots = 5.

Podstawiając tę ​​wartość do wzoru, otrzymujemy .

Wzór do ustalenia wielkość próby losowej w przypadku szacowania różnicy proporcji ma postać:

Przykład

Niektóre firmy mają dwie fabryki produkujące podobne produkty. Menedżer firmy chce porównać odsetek wadliwych produktów w obu fabrykach. Według dostępnych informacji, wskaźnik defektów w obu fabrykach waha się od 3 do 5%. Ma on na celu skonstruowanie 99% przedziału ufności z połową długości nie większą niż 0,005 (lub 0,5%). Ile produktów należy wybrać z każdej fabryki?

Rozwiązanie

Tutaj p 1ots i p 2ots to szacunki dwóch nieznanych udziałów wad w pierwszej i drugiej fabryce. Jeśli wstawimy p 1ots = p 2ots = 0,5, wówczas otrzymamy zawyżoną wartość dla n. Ponieważ jednak w naszym przypadku mamy informację aprioryczną o tych udziałach, przyjmujemy górne oszacowanie tych udziałów, czyli 0,05. Dostajemy

Podczas szacowania niektórych parametrów populacji na podstawie przykładowych danych przydatne jest nie tylko oszacowanie punktowe parametru, ale także podanie przedziału ufności, który pokazuje, gdzie może znajdować się dokładna wartość szacowanego parametru.

W tym rozdziale zapoznaliśmy się także z zależnościami ilościowymi, które pozwalają nam konstruować takie przedziały dla różnych parametrów; nauczyli się sposobów kontrolowania długości przedziału ufności.

Należy również zauważyć, że problem szacowania wielkości próby (problem planowania eksperymentu) można rozwiązać za pomocą standardowych narzędzi StatPro, a mianowicie StatPro/wnioskowanie statystyczne/wybór wielkości próbki.

Przedział ufności(CI; w języku angielskim przedział ufności – CI) uzyskany w badaniu na próbie daje miarę dokładności (lub niepewności) wyników badania w celu wyciągnięcia wniosków na temat populacji wszystkich takich pacjentów (populacja ogólna). Prawidłową definicję 95% CI można sformułować następująco: 95% takich przedziałów będzie zawierało wartość prawdziwą w populacji. Ta interpretacja jest nieco mniej dokładna: CI to zakres wartości, w ramach którego można mieć 95% pewności, że zawiera on wartość prawdziwą. Stosując CI, nacisk kładzie się na określenie efektu ilościowego, a nie na wartość P, którą uzyskuje się poprzez testowanie istotności statystycznej. Wartość P nie szacuje żadnej wielkości, lecz służy raczej jako miara siły dowodu przeciwko hipotezie zerowej o „braku efektu”. Sama wartość P nie mówi nam nic o wielkości różnicy ani nawet o jej kierunku. Dlatego niezależne wartości P są całkowicie pozbawione informacji w artykułach lub abstraktach. Natomiast CI wskazuje zarówno wielkość efektu będącego przedmiotem bezpośredniego zainteresowania, takiego jak korzyść z leczenia, jak i siłę dowodów. Dlatego DI jest bezpośrednio powiązany z praktyką EBM.

Podejście estymacyjne do analizy statystycznej, na przykładzie CI, ma na celu zmierzenie wielkości interesującego efektu (czułość testu diagnostycznego, odsetek przewidywanych przypadków, względne zmniejszenie ryzyka dzięki leczeniu itp.), a także zmierzenie niepewności w tym przypadku. efekt. Najczęściej CI to zakres wartości po obu stronach oszacowania, w którym prawdopodobnie będzie znajdować się prawdziwa wartość, i możesz być tego pewien na 95%. Zgoda na użycie prawdopodobieństwa 95% jest dowolna, podobnie jak wartość P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI opiera się na założeniu, że to samo badanie przeprowadzone na różnych próbach pacjentów nie da identycznych wyników, ale ich wyniki zostaną rozłożone wokół prawdziwej, ale nieznanej wartości. Innymi słowy, CI opisuje to jako „zmienność zależną od próbki”. CI nie odzwierciedla dodatkowej niepewności wynikającej z innych przyczyn; w szczególności nie obejmuje wpływu selektywnej utraty wyników w zakresie działań następczych, słabej zgodności lub niedokładnego pomiaru wyników, braku zaślepienia itp. Dlatego CI zawsze zaniża całkowitą ilość niepewności.

Obliczanie przedziału ufności

Tabela A1.1. Błędy standardowe i przedziały ufności dla wybranych pomiarów klinicznych

Zwykle współczynnik CI oblicza się na podstawie zaobserwowanego oszacowania wielkości, takiego jak różnica (d) między dwiema proporcjami, oraz błędu standardowego (SE) oszacowania tej różnicy. Przybliżony 95% CI uzyskany w ten sposób wynosi d ± 1,96 SE. Formuła zmienia się w zależności od charakteru miary wyniku i zakresu CI. Na przykład w randomizowanym, kontrolowanym placebo badaniu bezkomórkowej szczepionki przeciw krztuścowi u 72 z 1670 (4,3%) niemowląt, które otrzymały szczepionkę, rozwinęło się krztusiec, a u 240 z 1665 (14,4%) w grupie kontrolnej. Różnica procentowa, zwana bezwzględną redukcją ryzyka, wynosi 10,1%. SE tej różnicy wynosi 0,99%. W związku z tym 95% CI wynosi 10,1% + 1,96 x 0,99%, tj. od 8,2 do 12,0.

Pomimo różnych podejść filozoficznych, CI i testy istotności statystycznej są ze sobą ściśle powiązane matematycznie.

Zatem wartość P jest „znacząca”, tj. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Niepewność (niedokładność) oszacowania wyrażona w CI jest w dużej mierze związana z pierwiastkiem kwadratowym wielkości próby. Małe próbki dostarczają mniej informacji niż duże, a CI jest odpowiednio szerszy w mniejszej próbie. Na przykład w artykule porównującym skuteczność trzech testów stosowanych do diagnozowania zakażenia Helicobacter pylori podano, że czułość mocznikowego testu oddechowego wynosi 95,8% (95% CI 75–100). Chociaż liczba 95,8% jest imponująca, mała próba 24 dorosłych pacjentów z J. pylori oznacza, że ​​szacunki te są obarczone znaczną niepewnością, co pokazuje szeroki przedział CI. Rzeczywiście dolna granica wynosząca 75% jest znacznie niższa niż szacunkowa wartość 95,8%. Gdyby taką samą czułość zaobserwowano w próbie 240 osób, 95% CI wyniósłby 92,5–98,0, co daje większą pewność, że test jest bardzo czuły.

W randomizowanych badaniach kontrolowanych (RCT) wyniki nieistotne (tj. te, dla których P > 0,05) są szczególnie podatne na błędną interpretację. CI jest tutaj szczególnie przydatny, ponieważ pokazuje, jak spójne są wyniki z klinicznie użytecznym rzeczywistym efektem. Na przykład w RCT porównującym szwy okrężnicy i zespolenie zszywkami zakażenie rany rozwinęło się odpowiednio u 10,9% i 13,5% pacjentów (p = 0,30). 95% CI dla tej różnicy wynosi 2,6% (od -2 do +8). Nawet w tym badaniu z udziałem 652 pacjentów możliwe jest, że istnieje niewielka różnica w częstości występowania infekcji wynikających z obu procedur. Im mniej badań, tym większa niepewność. Sung i in. przeprowadzili RCT w celu porównania wlewu oktreotydu z ostrą skleroterapią w leczeniu ostrego krwawienia z żylaków u 100 pacjentów. W grupie oktreotydu stopień opanowania krwawienia wyniósł 84%; w grupie skleroterapii – 90%, co daje P = 0,56. Należy pamiętać, że we wspomnianym badaniu częstość występowania ciągłego krwawienia jest podobna jak w przypadku zakażenia rany. Jednakże w tym przypadku 95% CI dla różnicy między interwencjami wynosi 6% (od -7 do +19). Zakres ten jest dość szeroki w porównaniu z różnicą 5%, która byłaby interesująca klinicznie. Oczywiście badanie nie wyklucza istotnej różnicy w skuteczności. Dlatego teza autorów, że wlew oktreotydu i skleroterapia są równie skuteczne w leczeniu krwawień z żylaków, jest zdecydowanie błędna. W takich przypadkach, jak w tym przypadku, 95% CI dla bezwzględnej redukcji ryzyka (ARR) obejmuje zero, CI dla NNT (liczba potrzebna do leczenia) jest dość trudna do interpretacji. NPL i jej CI oblicza się z odwrotności ACP (mnożąc przez 100, jeśli wartości te podane są w procentach). Tutaj otrzymujemy NPL = 100: 6 = 16,6 z 95% CI wynoszącym -14,3 do 5,3. Jak wynika z przypisu „d” w tabeli. A1.1, ten CI obejmuje wartości NPL od 5,3 do nieskończoności i NPL od 14,3 do nieskończoności.

Współczynniki CI można konstruować dla najczęściej używanych szacunków lub porównań statystycznych. W przypadku RCT obejmuje różnicę między średnimi proporcjami, względnym ryzykiem, ilorazami szans i NLR. Podobnie współczynniki wiarygodności można uzyskać dla wszystkich głównych szacunków dokonanych w badaniach dokładności testów diagnostycznych – czułości, swoistości, dodatniej wartości predykcyjnej (z których wszystkie są prostymi proporcjami) i współczynników wiarygodności – szacunków uzyskanych w metaanalizach i porównaniu z grupą kontrolną. studia. Program komputera osobistego obejmujący wiele z tych zastosowań MDI jest dostępny w drugim wydaniu Statistics with Confidence. Makra do obliczania współczynników CI dla proporcji są dostępne bezpłatnie dla programu Excel oraz programów statystycznych SPSS i Minitab pod adresem http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Wiele szacunków efektu leczenia

Chociaż CI są pożądane w przypadku podstawowych wyników badań, nie są one konieczne w przypadku wszystkich wyników. CI dotyczy porównań istotnych klinicznie. Na przykład podczas porównywania dwóch grup prawidłowy CI to ten skonstruowany dla różnicy między grupami, jak pokazano w powyższych przykładach, a nie CI, który można skonstruować dla oszacowania w każdej grupie. Podawanie oddzielnych CI dla szacunków w każdej grupie nie tylko nie jest pomocne, ale taka prezentacja może wprowadzać w błąd. Podobnie właściwym podejściem przy porównywaniu skuteczności leczenia w różnych podgrupach jest bezpośrednie porównanie dwóch (lub więcej) podgrup. Błędem jest założenie, że leczenie jest skuteczne tylko w jednej podgrupie, jeśli jego CI wyklucza wartość odpowiadającą brakowi efektu, a pozostałe nie. CI są również przydatne przy porównywaniu wyników w wielu podgrupach. Na ryc. Wartość 1,1 pokazuje względne ryzyko rzucawki u kobiet ze stanem przedrzucawkowym w podgrupach kobiet z kontrolowanego placebo RCT z zastosowaniem siarczanu magnezu.

Ryż. A1.2. Działka leśna przedstawia wyniki 11 randomizowanych badań klinicznych szczepionki przeciwko rotawirusowi bydła w zapobieganiu biegunce w porównaniu z placebo. Do oszacowania względnego ryzyka biegunki zastosowano 95% przedział ufności. Rozmiar czarnego kwadratu jest proporcjonalny do ilości informacji. Dodatkowo przedstawiono sumaryczne oszacowanie skuteczności leczenia oraz 95% przedział ufności (oznaczony rombem). W metaanalizie wykorzystano model efektów losowych większy niż niektóre wcześniej określone; na przykład może to być wielkość zastosowana do obliczenia wielkości próbki. Bardziej rygorystyczne kryterium wymaga, aby cały zakres CI wykazywał korzyść większą niż określone wcześniej minimum.

Omówiliśmy już błąd polegający na przyjmowaniu braku istotności statystycznej jako wskazówki, że dwa sposoby leczenia są równie skuteczne. Równie ważne jest, aby nie utożsamiać znaczenia statystycznego ze znaczeniem klinicznym. Znaczenie kliniczne można przyjąć wówczas, gdy wynik jest istotny statystycznie i wielkość oceny skuteczności leczenia

Badania mogą wykazać, czy wyniki są istotne statystycznie i które są istotne klinicznie, a które nie. Na ryc. A1.2 pokazuje wyniki czterech testów, dla których cały CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Inteligencja to nie tylko wiedza, ale także umiejętność zastosowania wiedzy w praktyce. (Arystoteles)

Przedziały ufności

Przegląd ogólny

Pobierając próbę z populacji, uzyskujemy punktową estymację interesującego nas parametru i obliczamy błąd standardowy, aby wskazać precyzję estymacji.

Jednak w większości przypadków błąd standardowy jako taki jest nie do przyjęcia. O wiele bardziej przydatne jest połączenie tej miary dokładności z oszacowaniem przedziału dla parametru populacji.

Można tego dokonać wykorzystując wiedzę o teoretycznym rozkładzie prawdopodobieństwa statystyki próbki (parametru) w celu obliczenia przedziału ufności (CI – przedział ufności, CI – przedział ufności) dla parametru.

Ogólnie rzecz biorąc, przedział ufności rozszerza oszacowania w obu kierunkach o pewną wielokrotność błędu standardowego (danego parametru); dwie wartości (granice ufności) określające przedział są zwykle oddzielone przecinkiem i ujęte w nawiasy.

Przedział ufności dla średniej

Korzystanie z rozkładu normalnego

Średnia próbki ma rozkład normalny, jeśli wielkość próby jest duża, dlatego przy rozpatrywaniu średniej próbki można zastosować wiedzę o rozkładzie normalnym.

W szczególności 95% rozkładu średnich z próby mieści się w granicach 1,96 odchylenia standardowego (SD) średniej populacji.

Kiedy mamy tylko jedną próbkę, nazywamy ją błędem standardowym średniej (SEM) i obliczamy 95% przedział ufności dla średniej w następujący sposób:

Jeśli powtórzymy ten eksperyment kilka razy, przedział będzie zawierał rzeczywistą średnią populacji w 95% przypadków.

Zwykle jest to przedział ufności, taki jak przedział wartości, w którym mieści się prawdziwa średnia populacji (średnia ogólna) z poziomem ufności 95%.

Chociaż interpretacja przedziału ufności w ten sposób nie jest całkowicie rygorystyczna (średnia populacji jest wartością stałą i dlatego nie można do niej przypisać prawdopodobieństwa), jest ona koncepcyjnie łatwiejsza do zrozumienia.

Stosowanie T- dystrybucja

Możesz użyć rozkładu normalnego, jeśli znasz wartość wariancji w populacji. Ponadto, gdy wielkość próby jest mała, średnia próbki ma rozkład normalny, jeśli podstawowe dane populacji mają rozkład normalny.

Jeśli dane leżące u podstaw populacji nie mają rozkładu normalnego i/lub wariancja populacji jest nieznana, średnia z próby spełnia wymagania Rozkład t-Studenta.

Obliczamy 95% przedział ufności dla średniej populacji ogólnej w następujący sposób:

Gdzie jest punkt procentowy (percentyl) T- Rozkład t-Studenta z (n-1) stopniami swobody, co daje dwustronne prawdopodobieństwo 0,05.

Generalnie zapewnia szerszy zakres niż przy zastosowaniu rozkładu normalnego, ponieważ uwzględnia dodatkową niepewność wprowadzoną przez oszacowanie odchylenia standardowego populacji i/lub wynikającą z małej liczebności próby.

Gdy wielkość próby jest duża (rzędu 100 lub więcej), różnica między dwoma rozkładami ( t-Student i normalne) jest nieistotne. Zawsze jednak korzystają T- rozkład przy obliczaniu przedziałów ufności, nawet jeśli wielkość próby jest duża.

Zwykle podaje się 95% CI. Można obliczyć inne przedziały ufności, takie jak 99% CI dla średniej.

Zamiast iloczynu błędu standardowego i wartości tabeli T- rozkład, który odpowiada dwustronnemu prawdopodobieństwu 0,05, pomnóż go (błąd standardowy) przez wartość odpowiadającą dwustronnemu prawdopodobieństwu 0,01. Jest to szerszy przedział ufności niż 95% przedział ufności, ponieważ odzwierciedla zwiększoną pewność, że przedział ten faktycznie obejmuje średnią populacji.

Przedział ufności dla proporcji

Rozkład próbkowania proporcji ma rozkład dwumianowy. Jeśli jednak wielkość próbki N jest dostatecznie duży, wówczas rozkład proporcji w próbce jest w przybliżeniu normalny ze średnią .

Oceniamy w sposób wybiórczy p=r/n(Gdzie R- liczba osobników w próbie o interesujących nas cechach charakterystycznych) i szacuje się błąd standardowy:

Oszacowuje się 95% przedział ufności dla tej proporcji:

Jeśli wielkość próbki jest mała (zwykle gdy n.p. Lub n(1-p) mniej 5 ), wówczas w celu obliczenia dokładnych przedziałów ufności konieczne jest skorzystanie z rozkładu dwumianowego.

Zauważ, że jeśli P wyrażona wówczas w procentach (1-p) zastąpiony przez (100-s).

Interpretacja przedziałów ufności

Interpretując przedział ufności interesują nas następujące pytania:

Jak szeroki jest przedział ufności?

Szeroki przedział ufności wskazuje, że oszacowanie jest nieprecyzyjne; wąski oznacza dokładne oszacowanie.

Szerokość przedziału ufności zależy od wielkości błędu standardowego, który z kolei zależy od wielkości próby, a w przypadku zmiennej numerycznej zmienność danych daje szersze przedziały ufności niż badania dużego zbioru danych składającego się z kilku zmiennych .

Czy CI zawiera jakieś wartości szczególnie interesujące?

Można sprawdzić, czy prawdopodobna wartość parametru populacji mieści się w przedziale ufności. Jeśli tak, wyniki są zgodne z tą prawdopodobną wartością. Jeśli nie, to jest mało prawdopodobne (dla 95% przedziału ufności szansa wynosi prawie 5%), że parametr ma tę wartość.

Często rzeczoznawca musi dokonać analizy rynku nieruchomości segmentu, w którym zlokalizowana jest wyceniana nieruchomość. Jeśli rynek jest rozwinięty, analiza całego zestawu prezentowanych obiektów może być trudna, dlatego do analizy wykorzystuje się próbkę obiektów. Próbka ta nie zawsze okazuje się jednorodna; czasami konieczne jest oczyszczenie jej ze skrajnych punktów – zbyt wysokich lub zbyt niskich ofert rynkowych. W tym celu się go używa przedział ufności. Celem niniejszego badania jest przeprowadzenie analizy porównawczej dwóch metod obliczania przedziału ufności i wybranie optymalnej opcji obliczeń przy pracy z różnymi próbkami w systemie estimatica.pro.

Przedział ufności to przedział wartości atrybutów obliczony na podstawie próby, która ze znanym prawdopodobieństwem zawiera oszacowany parametr populacji ogólnej.

Celem obliczenia przedziału ufności jest takie skonstruowanie takiego przedziału na podstawie przykładowych danych, aby z zadanym prawdopodobieństwem można było stwierdzić, że wartość szacowanego parametru mieści się w tym przedziale. Innymi słowy, przedział ufności zawiera nieznaną wartość oszacowanej wartości z pewnym prawdopodobieństwem. Im szerszy przedział, tym większa niedokładność.

Istnieją różne metody wyznaczania przedziału ufności. W tym artykule przyjrzymy się 2 metodom:

  • poprzez medianę i odchylenie standardowe;
  • poprzez wartość krytyczną statystyki t (współczynnik Studenta).

Etapy analizy porównawczej różnych metod obliczania CI:

1. utworzyć próbkę danych;

2. przetwarzamy to metodami statystycznymi: obliczamy wartość średnią, medianę, wariancję itp.;

3. obliczyć przedział ufności na dwa sposoby;

4. analizować oczyszczone próbki i wynikające z nich przedziały ufności.

Etap 1. Próbkowanie danych

Próbkę utworzono przy użyciu systemu estimatica.pro. Próba obejmowała 91 ofert sprzedaży mieszkań 1-pokojowych w III strefie cenowej w układzie typu „Chruszczow”.

Tabela 1. Próbka wyjściowa

Cena 1 m2, sztuka

Ryc.1. Próbka wstępna



Etap 2. Przetwarzanie próbki wstępnej

Przetwarzanie próbki metodami statystycznymi wymaga obliczenia następujących wartości:

1. Średnia arytmetyczna

2. Mediana - liczba charakteryzująca próbę: dokładnie połowa elementów próbki jest większa od mediany, druga połowa jest mniejsza od mediany

(dla próbki o nieparzystej liczbie wartości)

3. Zakres – różnica pomiędzy wartościami maksymalnymi i minimalnymi w próbce

4. Wariancja – służy do dokładniejszego oszacowania zmienności danych

5. Odchylenie standardowe próbki (dalej - SD) jest najczęstszym wskaźnikiem rozproszenia wartości korekty wokół średniej arytmetycznej.

6. Współczynnik zmienności – odzwierciedla stopień rozproszenia wartości korekty

7. współczynnik oscylacji – odzwierciedla względne wahania skrajnych wartości cen w próbie wokół średniej

Tabela 2. Wskaźniki statystyczne próby pierwotnej

Współczynnik zmienności charakteryzujący jednorodność danych wynosi 12,29%, ale współczynnik oscylacji jest zbyt wysoki. Można zatem powiedzieć, że próbka pierwotna nie jest jednorodna, zatem przejdźmy do obliczania przedziału ufności.

Etap 3. Obliczanie przedziału ufności

Metoda 1. Obliczenia z wykorzystaniem mediany i odchylenia standardowego.

Przedział ufności wyznacza się w następujący sposób: wartość minimalna – od mediany odejmuje się odchylenie standardowe; wartość maksymalna - do mediany dodawane jest odchylenie standardowe.

Zatem przedział ufności (47179 CU; 60689 CU)

Ryż. 2. Wartości mieszczące się w przedziale ufności 1.



Metoda 2. Konstruowanie przedziału ufności przy użyciu wartości krytycznej statystyki t (współczynnik Studenta)

S.V. Gribovsky w swojej książce „Matematyczne metody szacowania wartości nieruchomości” opisuje metodę obliczania przedziału ufności za pomocą współczynnika Studenta. Obliczając tą metodą estymator musi sam ustalić poziom istotności ∝, który określa prawdopodobieństwo, z jakim zostanie skonstruowany przedział ufności. Zazwyczaj stosuje się poziomy istotności 0,1; 0,05 i 0,01. Odpowiadają one prawdopodobieństwu ufności 0,9; 0,95 i 0,99. W przypadku tej metody zakłada się, że prawdziwe wartości matematycznego oczekiwania i wariancji są praktycznie nieznane (co prawie zawsze jest prawdą przy rozwiązywaniu praktycznych problemów estymacji).

Wzór na przedział ufności:

n - wielkość próbki;

Wartość krytyczna statystyki t (rozkład Studenta) o poziomie istotności ∝, liczbie stopni swobody n-1, która jest wyznaczana ze specjalnych tablic statystycznych lub za pomocą programu MS Excel (→„Statystyka” → STUDIST);

∝ - poziom istotności, przyjmij ∝=0,01.

Ryż. 2. Wartości mieszczące się w przedziale ufności 2.

Etap 4. Analiza różnych metod obliczania przedziału ufności

Dwie metody obliczania przedziału ufności – poprzez medianę i współczynnik Studenta – prowadziły do ​​różnych wartości przedziałów. W związku z tym otrzymaliśmy dwie różne oczyszczone próbki.

Tabela 3. Statystyki dla trzech próbek.

Wskaźnik

Próbka wstępna

1 opcja

Opcja 2

Wartość średnia

Dyspersja

Współczynnik. odmiany

Współczynnik. oscylacje

Liczba wycofanych obiektów, szt.

Na podstawie przeprowadzonych obliczeń można stwierdzić, że wartości przedziału ufności uzyskane różnymi metodami przecinają się, zatem można zastosować dowolną z metod obliczeniowych według uznania rzeczoznawcy.

Uważamy jednak, że pracując w systemie estimatica.pro warto wybrać metodę obliczania przedziału ufności w zależności od stopnia rozwoju rynku:

  • jeżeli rynek jest niezabudowany, należy zastosować metodę obliczeń wykorzystując medianę i odchylenie standardowe, ponieważ liczba obiektów wycofanych w tym przypadku jest niewielka;
  • jeżeli rynek jest rozwinięty, należy zastosować obliczenia poprzez wartość krytyczną statystyki t (współczynnik Studenta), ponieważ możliwe jest utworzenie dużej próby początkowej.

Przygotowując artykuł wykorzystano:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematyczne metody oceny wartości nieruchomości. Moskwa, 2014

2. Dane systemowe estimatica.pro

Wybór redaktora
Przepis na gotowanie jagnięciny z kuskusem Wielu słyszało słowo „Kuskus”, ale niewielu nawet sobie wyobraża, co to jest....

Przepis ze zdjęciami znajdziesz poniżej. Oferuję przepis na proste i łatwe w przygotowaniu danie, ten pyszny gulasz z...

Zawartość kalorii: brak danych Czas przyrządzania: brak danych Wszyscy kochamy smaki dzieciństwa, bo przenoszą nas w „piękne odległe”...

Kukurydza konserwowa ma po prostu niesamowity smak. Z jego pomocą uzyskuje się przepisy na sałatki z kapusty pekińskiej z kukurydzą...
Zdarza się, że nasze sny czasami pozostawiają niezwykłe wrażenie i wówczas pojawia się pytanie, co one oznaczają. W związku z tym, że do rozwiązania...
Czy zdarzyło Ci się prosić o pomoc we śnie? W głębi duszy wątpisz w swoje możliwości i potrzebujesz mądrej rady i wsparcia. Dlaczego jeszcze marzysz...
Popularne jest wróżenie na fusach kawy, intrygujące znakami losu i fatalnymi symbolami na dnie filiżanki. W ten sposób przewidywania...
Młodszy wiek. Opiszemy kilka przepisów na przygotowanie takiego dania Owsianka z wermiszelem w powolnej kuchence. Najpierw przyjrzyjmy się...
Wino to trunek, który pija się nie tylko na każdej imprezie, ale także po prostu wtedy, gdy mamy ochotę na coś mocniejszego. Jednak wino stołowe jest...