Odchylenie standardowe dla szeregu przedziałowego. Co to jest odchylenie standardowe


Dyspersja. Odchylenie standardowe

Dyspersja jest średnią arytmetyczną kwadratów odchyleń każdej wartości atrybutu od średniej ogólnej. W zależności od danych źródłowych wariancja może być nieważona (prosta) lub ważona.

Wariancję oblicza się za pomocą następujących wzorów:

· dla danych niezgrupowanych

· dla danych grupowanych

Procedura obliczania wariancji ważonej:

1. wyznaczyć średnią arytmetyczną ważoną

2. Określa się odchylenia wariantu od średniej

3. Podnieś do kwadratu odchylenie każdej opcji od średniej

4. pomnóż kwadraty odchyleń przez wagi (częstotliwości)

5. podsumować otrzymane produkty

6. Otrzymaną kwotę dzieli się przez sumę wag

Wzór na określenie wariancji można przekształcić do następującego wzoru:

- prosty

Procedura obliczania wariancji jest prosta:

1. wyznaczyć średnią arytmetyczną

2. podnieś średnią arytmetyczną do kwadratu

3. Wyrównaj każdą opcję w rzędzie

4. znajdź opcję sumy kwadratów

5. podzielić sumę kwadratów przez ich liczbę, tj. określić średni kwadrat

6. wyznaczać różnicę pomiędzy średnim kwadratem cechy a kwadratem średniej

Ponadto wzór na określenie wariancji ważonej można przekształcić do następującego wzoru:

te. wariancja jest równa różnicy między średnią kwadratów wartości atrybutu a kwadratem średniej arytmetycznej. Przy zastosowaniu przekształconego wzoru eliminowana jest dodatkowa procedura obliczania odchyleń poszczególnych wartości cechy od x oraz eliminowany jest błąd w obliczeniach związany z zaokrąglaniem odchyleń

Dyspersja ma wiele właściwości, z których niektóre ułatwiają obliczenia:

1) rozproszenie wartości stałej wynosi zero;

2) jeśli wszystkie warianty wartości atrybutów zostaną zmniejszone o tę samą liczbę, wówczas wariancja nie zmniejszy się;

3) jeśli wszystkie warianty wartości atrybutów zostaną zmniejszone o tę samą liczbę razy (krotność), wówczas wariancja zmniejszy się o współczynnik

Odchylenie standardowe S- reprezentuje pierwiastek kwadratowy wariancji:

· dla danych niezgrupowanych:

;

· dla serii zmian:

Zakres zmienności, średnia liniowa i odchylenie standardowe to wielkości nazwane. Mają te same jednostki miary, co poszczególne wartości charakterystyczne.

Wariancja i odchylenie standardowe są najczęściej stosowanymi miarami zmienności. Wyjaśnia to fakt, że są one zawarte w większości twierdzeń teorii prawdopodobieństwa, która służy jako podstawa statystyki matematycznej. Dodatkowo wariancję można rozłożyć na elementy składowe, co pozwala ocenić wpływ różnych czynników determinujących zmienność cechy.

Obliczenie wskaźników zmienności dla banków pogrupowanych według marży przedstawiono w tabeli.

Kwota zysku, miliony rubli. Liczba banków obliczone wskaźniki
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Całkowity: 121,70 17,640 23,126

Średnie odchylenie liniowe i standardowe pokazuje, jak bardzo wartość cechy waha się średnio pomiędzy jednostkami i badaną populacją. Zatem w tym przypadku średnia fluktuacja zysku wynosi: według średniego odchylenia liniowego 0,882 miliona rubli; według odchylenia standardowego - 1,075 miliona rubli. Odchylenie standardowe jest zawsze większe niż średnie odchylenie liniowe. Jeżeli rozkład cechy jest zbliżony do normalnego, to pomiędzy S i d zachodzi zależność: S=1,25d, czyli d=0,8S. Odchylenie standardowe pokazuje, w jaki sposób większość jednostek populacji jest zlokalizowana w stosunku do średniej arytmetycznej. Niezależnie od kształtu rozkładu, 75 wartości atrybutu mieści się w przedziale x 2S, a co najmniej 89 wszystkich wartości mieści się w przedziale x 3S (twierdzenie P.L. Czebyszewa).

Wartości uzyskane z doświadczenia nieuchronnie zawierają błędy z wielu różnych powodów. Wśród nich należy rozróżnić błędy systematyczne i przypadkowe. Błędy systematyczne powstają z przyczyn działających w bardzo specyficzny sposób i zawsze można je w miarę trafnie wyeliminować lub uwzględnić. Błędy losowe są spowodowane bardzo dużą liczbą indywidualnych przyczyn, których nie można dokładnie wyjaśnić i które działają na różne sposoby w każdym indywidualnym pomiarze. Nie można całkowicie wykluczyć tych błędów; można je brać pod uwagę jedynie uśredniając, dla czego konieczna jest znajomość praw rządzących błędami przypadkowymi.

Zmierzoną wielkość oznaczymy przez A, a błąd losowy pomiaru przez x. Ponieważ błąd x może przyjmować dowolną wartość, jest to ciągła zmienna losowa, którą w pełni charakteryzuje prawo rozkładu.

Najprostszą i najdokładniej oddającą rzeczywistość (w zdecydowanej większości przypadków) jest tzw normalne prawo rozkładu błędów:

To prawo podziału można wyprowadzić z różnych przesłanek teoretycznych, w szczególności z wymogu, że najbardziej prawdopodobną wartością nieznanej wielkości, dla której w drodze bezpośredniego pomiaru uzyskuje się szereg wartości z tym samym stopniem dokładności, jest średnia arytmetyczna te wartości. Ilość 2 nazywa się dyspersja tego normalnego prawa.

Średnia arytmetyczna

Wyznaczanie dyspersji na podstawie danych doświadczalnych. Jeśli dla dowolnej wartości A n wartości a i zostaną uzyskane przez bezpośredni pomiar z tą samą dokładnością i jeśli błędy wartości A podlegają prawu rozkładu normalnego, to najbardziej prawdopodobna wartość A będzie średnia arytmetyczna:

a - średnia arytmetyczna,

a i - wartość zmierzona w i-tym kroku.

Odchylenie obserwowanej wartości (dla każdej obserwacji) a i wartości A od średnia arytmetyczna: a ja - a.

Aby wyznaczyć wariancję prawa rozkładu błędu normalnego w tym przypadku, należy skorzystać ze wzoru:

2 - dyspersja,
a - średnia arytmetyczna,
n - liczba pomiarów parametrów,

Odchylenie standardowe

Odchylenie standardowe pokazuje bezwzględne odchylenie zmierzonych wartości od średnia arytmetyczna. Zgodnie ze wzorem na miarę dokładności kombinacji liniowej średni błąd kwadratowyŚrednią arytmetyczną określa się według wzoru:

, Gdzie


a - średnia arytmetyczna,
n - liczba pomiarów parametrów,
a i - wartość zmierzona w i-tym kroku.

Współczynnik zmienności

Współczynnik zmienności charakteryzuje względną miarę odchylenia zmierzonych wartości od średnia arytmetyczna:

, Gdzie

V - współczynnik zmienności,
- odchylenie standardowe,
a - średnia arytmetyczna.

Im wyższa wartość współczynnik zmienności, tym relatywnie większy jest rozrzut i mniejsza jednorodność badanych wartości. Jeśli współczynnik zmienności mniejsza niż 10%, wówczas zmienność szeregu zmian uważa się za nieistotną, od 10% do 20% za średnią, powyżej 20% i mniej niż 33% za znaczącą i jeżeli współczynnik zmienności przekracza 33%, wskazuje to na niejednorodność informacji i konieczność wykluczenia wartości największych i najmniejszych.

Średnie odchylenie liniowe

Jednym ze wskaźników zakresu i intensywności zmienności jest średnie odchylenie liniowe(moduł odchylenia średniego) od średniej arytmetycznej. Średnie odchylenie liniowe obliczane według wzoru:

, Gdzie

_
a - średnie odchylenie liniowe,
a - średnia arytmetyczna,
n - liczba pomiarów parametrów,
a i - wartość zmierzona w i-tym kroku.

Aby sprawdzić zgodność badanych wartości z prawem rozkładu normalnego, stosuje się zależność wskaźnik asymetrii na jego błąd i postawę wskaźnik kurtozy do swego błędu.

Wskaźnik asymetrii

Wskaźnik asymetrii(A) i jego błąd (m a) oblicza się za pomocą następujących wzorów:

, Gdzie

A - wskaźnik asymetrii,
- odchylenie standardowe,
a - średnia arytmetyczna,
n - liczba pomiarów parametrów,
a i - wartość zmierzona w i-tym kroku.

Wskaźnik kurtozy

Wskaźnik kurtozy(E) i jego błąd (m e) oblicza się za pomocą następujących wzorów:

, Gdzie

Materiał z Wikipedii – wolnej encyklopedii

Odchylenie standardowe(synonimy: odchylenie standardowe, odchylenie standardowe, odchylenie kwadratowe; powiązane terminy: odchylenie standardowe, standardowy spread) - w teorii prawdopodobieństwa i statystyce najczęstszym wskaźnikiem rozproszenia wartości zmiennej losowej w stosunku do jej oczekiwań matematycznych. W przypadku ograniczonych tablic próbek wartości zamiast oczekiwań matematycznych używana jest średnia arytmetyczna zbioru próbek.

Podstawy

Odchylenie standardowe mierzone jest w jednostkach samej zmiennej losowej i wykorzystywane przy obliczaniu błędu standardowego średniej arytmetycznej, przy konstruowaniu przedziałów ufności, przy statystycznym testowaniu hipotez, przy pomiarze liniowej zależności pomiędzy zmiennymi losowymi. Zdefiniowany jako pierwiastek kwadratowy wariancji zmiennej losowej.

Odchylenie standardowe:

\sigma=\sqrt(\frac(1)(n)\sum_(i=1)^n\left(x_i-\bar(x)\right)^2).

Odchylenie standardowe(oszacowanie odchylenia standardowego zmiennej losowej X w stosunku do oczekiwań matematycznych opartych na bezstronnym oszacowaniu wariancji) S:

s=\sqrt(\frac(n)(n-1)\sigma^2)=\sqrt(\frac(1)(n-1)\sum_(i=1)^n\left(x_i-\bar (x)\prawo)^2);

Reguła trzech sigm

Reguła trzech sigm (3\sigma) - prawie wszystkie wartości zmiennej losowej o rozkładzie normalnym leżą w przedziale \left(\bar(x)-3\sigma;\bar(x)+3\sigma\right). Ściślej – z prawdopodobieństwem w przybliżeniu 0,9973 wartość zmiennej losowej o rozkładzie normalnym mieści się w określonym przedziale (pod warunkiem, że wartość \bar(x) prawdziwe, a nie uzyskane w wyniku przetwarzania próbki).

Jeśli prawdziwa wartość \bar(x) jest nieznany, to nie powinieneś go używać \sigma, A S. W ten sposób reguła trzech sigma zostaje przekształcona w regułę trzech S .

Interpretacja wartości odchylenia standardowego

Większa wartość odchylenia standardowego oznacza większy rozrzut wartości w prezentowanym zbiorze przy średniej wartości zbioru; odpowiednio mniejsza wartość pokazuje, że wartości w zestawie są zgrupowane wokół wartości średniej.

Na przykład mamy trzy zestawy liczb: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Wszystkie trzy zestawy mają średnie wartości równe 7, a odchylenia standardowe odpowiednio równe 7, 5 i 1. Ostatni zestaw ma małe odchylenie standardowe, ponieważ wartości w zestawie są zgrupowane wokół wartości średniej; pierwszy zbiór ma największą wartość odchylenia standardowego – wartości w obrębie zbioru znacznie odbiegają od wartości średniej.

W sensie ogólnym odchylenie standardowe można uznać za miarę niepewności. Na przykład w fizyce odchylenie standardowe służy do określenia błędu serii kolejnych pomiarów pewnej wielkości. Wartość ta jest bardzo istotna dla określenia prawdopodobieństwa badanego zjawiska w porównaniu z wartością przewidywaną przez teorię: jeżeli średnia wartość pomiarów znacznie różni się od wartości przewidywanych przez teorię (duże odchylenie standardowe), wówczas należy ponownie sprawdzić uzyskane wartości lub sposób ich uzyskania.

Praktyczne zastosowanie

W praktyce odchylenie standardowe pozwala oszacować, jak bardzo wartości ze zbioru mogą różnić się od wartości średniej.

Ekonomia i finanse

Odchylenie standardowe stopy zwrotu z portfela \sigma =\sqrt(D[X]) utożsamiane z ryzykiem portfelowym.

Klimat

Załóżmy, że istnieją dwa miasta o tej samej średniej maksymalnej temperaturze dziennej, ale jedno położone jest na wybrzeżu, a drugie na równinie. Wiadomo, że w miastach położonych na wybrzeżu występuje wiele różnych maksymalnych temperatur w ciągu dnia, które są niższe niż w miastach położonych w głębi lądu. Zatem odchylenie standardowe maksymalnych dobowych temperatur dla miasta nadmorskiego będzie mniejsze niż dla drugiego miasta, mimo że średnia wartość tej wartości jest taka sama, co w praktyce oznacza, że ​​prawdopodobieństwo, że maksymalna temperatura powietrza na dowolny dzień w roku będzie wyższy od wartości średniej, wyższy dla miasta położonego w głębi lądu.

Sport

Załóżmy, że istnieje kilka drużyn piłkarskich, które oceniane są na podstawie pewnego zestawu parametrów, np. liczby strzelonych i straconych bramek, szans na zdobycie gola itp. Najprawdopodobniej najlepszy zespół w tej grupie będzie miał lepsze wartości na większej liczbie parametrów. Im mniejsze odchylenie standardowe zespołu dla każdego z prezentowanych parametrów, tym bardziej przewidywalny jest wynik takiego zespołu; Z drugiej strony, drużynie o dużym odchyleniu standardowym trudno przewidzieć wynik, co z kolei tłumaczy się brakiem równowagi, np. mocną obroną, ale słabym atakiem.

Stosowanie odchylenia standardowego parametrów drużyn pozwala w mniejszym lub większym stopniu przewidzieć wynik meczu pomiędzy dwoma drużynami, ocenić mocne i słabe strony drużyn, a co za tym idzie wybrane metody walki.

Zobacz także

Napisz recenzję na temat artykułu „Odchylenie średniokwadratowe”

Literatura

  • Borovikov W. STATYSTYKA. Sztuka analizy danych na komputerze: Dla profesjonalistów / V. Borovikov. - Petersburgu. : Piotr, 2003. - 688 s. - ISBN 5-272-00078-1..

Fragment charakteryzujący odchylenie standardowe

I szybko otwierając drzwi, zdecydowanymi krokami wyszedł na balkon. Rozmowa nagle ucichła, zdjęto kapelusze i czapki, a oczy wszystkich skierowały się na wychodzącego hrabiego.
- Cześć chłopaki! - powiedział hrabia szybko i głośno. - Dziękuję, że przyszedłeś. Wyjdę teraz do ciebie, ale najpierw musimy uporać się ze złoczyńcą. Musimy ukarać złoczyńcę, który zabił Moskwę. Poczekaj na mnie! „I hrabia równie szybko wrócił do swoich komnat, mocno zatrzaskując drzwi.
Przez tłum przebiegł szmer zadowolenia. „Oznacza to, że będzie kontrolował wszystkich złoczyńców! A ty powiesz po francusku... on da ci cały dystans!” – mówili ludzie, jakby wyrzucając sobie nawzajem brak wiary.
Kilka minut później przez frontowe drzwi pospiesznie wyszedł oficer, coś zamówił, a smoki wstali. Tłum z balkonu z zapałem ruszył w stronę werandy. Wychodząc na ganek gniewnymi, szybkimi krokami, Rostopchin pospiesznie rozejrzał się wokół, jakby kogoś szukał.
-Gdzie on jest? - powiedział hrabia i w tej samej chwili, gdy to mówił, ujrzał zza rogu domu wychodzącego pomiędzy dwoma smokami młodego człowieka z długą, cienką szyją, z głową na wpół ogoloną i zarośniętą. Ten młody człowiek miał na sobie coś, co kiedyś wyglądało jak dandys, pokryty niebieskim materiałem, wytarty płaszcz z owczej skóry lisa i brudne więźniarskie spodnie z haremu, wepchnięte w nieczyszczone, zniszczone, cienkie buty. Kajdany wisiały ciężko na jego chudych, słabych nogach, utrudniając młodemu człowiekowi niezdecydowane chodzenie.
- A! - powiedział Rastopchin, pospiesznie odwracając wzrok od młodzieńca w kożuchu z lisa i wskazując na dolny stopień ganku. - Połóż to tutaj! „Młody człowiek brzęcząc kajdanami wszedł ciężko na wskazany stopień, trzymając zaciśnięty w palcu kołnierz kożucha, dwukrotnie obrócił długą szyję i wzdychając, złożył przed sobą chude, niepracujące ręce. brzuch w uległym geście.
Cisza trwała przez kilka sekund, podczas gdy młody człowiek ustawił się na stopniu. Dopiero w tylnych rzędach ludzi stłoczonych w jednym miejscu słychać było jęki, jęki, wstrząsy i tupot poruszających się stóp.
Rastopchin, czekając, aż zatrzyma się we wskazanym miejscu, zmarszczył brwi i przetarł twarz dłonią.
- Chłopaki! - powiedział Rastopchin metalicznym, dźwięcznym głosem - ten człowiek, Wierieszczagin, to ten sam łotr, przez którego zginęła Moskwa.
Młody mężczyzna w kożuchu z lisa stał w pozie uległej, splatając dłonie na brzuchu i lekko pochylając się. Jego wychudzona, młoda twarz o wyrazie beznadziejności, zniekształcona przez ogoloną głowę, była przygnębiona. Na pierwsze słowa hrabiego powoli podniósł głowę i spojrzał na hrabiego, jakby chciał mu coś powiedzieć lub chociaż spotkać jego wzrok. Ale Rastopchin nie patrzył na niego. Na długiej, cienkiej szyi młodzieńca, niczym lina, żyła za uchem napięła się i zrobiła się sina, a twarz nagle zaczerwieniła się.
Wszystkie oczy były skierowane na niego. Spojrzał na tłum i jakby zachęcony wyrazem, który wyczytał na twarzach ludzi, uśmiechnął się smutno i nieśmiało i ponownie spuszczając głowę, poprawił stopy na stopniu.
„Zdradził swego cara i ojczyznę, oddał się Bonapartemu, on jeden ze wszystkich Rosjan zhańbił imię Rosjanina i Moskwa ginie od niego” – powiedział Rastopchin równym, ostrym głosem; ale nagle szybko spojrzał na Wiereszchagina, który nadal stał w tej samej uległej pozie. Jakby to spojrzenie go eksplodowało, podnosząc rękę, prawie krzyknął, zwracając się do ludzi: „Postępuj z nim swoim sądem!” Daję ci to!
Ludzie milczeli i tylko ściskali się coraz bliżej. Trzymanie się nawzajem, wdychanie tej zakażonej duszności, brak siły na poruszenie się i czekanie na coś nieznanego, niezrozumiałego i strasznego stało się nie do zniesienia. Ludzie stojący w pierwszych rzędach, którzy widzieli i słyszeli wszystko, co działo się przed nimi, wszyscy z przerażająco szeroko otwartymi oczami i otwartymi ustami, wytężając wszystkie siły, powstrzymywali ucisk na plecach tych, którzy byli za nimi.
- Bij go!.. Niech zdrajca umrze i nie hańbi imienia Rosjanina! - krzyknął Rastopchin. - Rubin! Rozkazuję! „Słysząc nie słowa, ale wściekłe dźwięki głosu Rastopchina, tłum jęknął i ruszył do przodu, ale znów się zatrzymał.
„Hrabia!...” zawołał nieśmiały, a zarazem teatralny głos Wierieszczagina wśród znów zapadłej chwilowej ciszy. „Hrabio, jeden bóg jest nad nami…” – powiedział Wierieszczagin, podnosząc głowę, i znowu gruba żyła na jego cienkiej szyi wypełniła się krwią, a kolor szybko pojawił się i zniknął z jego twarzy. Nie dokończył tego, co chciał powiedzieć.
- Posiekaj go! Rozkazuję!.. – krzyknął Rastopchin, blednąc nagle zupełnie jak Wierieszczagin.
- Szable wychodzą! - krzyknął oficer do smoków, sam dobywając szabli.
Kolejna, jeszcze silniejsza fala, przepłynęła przez ludzi i docierając do pierwszych rzędów, fala ta poruszyła pierwsze rzędy, zataczając się, i zaprowadziła ich na same stopnie ganku. Obok Wierieszczagina stał wysoki facet ze skamieniałym wyrazem twarzy i zatrzymaną podniesioną ręką.
- Rubin! - Prawie oficer szepnął do smoków, a jeden z żołnierzy nagle, z twarzą wykrzywioną ze złości, uderzył Wierieszczagina w głowę tępym pałaszem.
"A!" - Vereshchagin krzyknął krótko i ze zdziwienia, rozglądając się ze strachem i jakby nie rozumiejąc, dlaczego mu to zrobiono. Ten sam jęk zaskoczenia i przerażenia przebiegł przez tłum.
"O mój Boże!" – rozległ się czyjś smutny okrzyk.
Ale po okrzyku zaskoczenia, który wymknął się Wiereszchaginowi, krzyknął żałośnie z bólu i ten krzyk go zniszczył. Ta bariera ludzkich uczuć, napięta do najwyższego stopnia, która wciąż trzymała tłum, przełamała się natychmiast. Zbrodnia została rozpoczęta, należało ją dokończyć. Żałosny jęk wyrzutu został zagłuszony przez groźny i wściekły ryk tłumu. Podobnie jak ostatnia siódma fala, niszcząca statki, ta ostatnia niepowstrzymana fala wzniosła się z tylnych szeregów, dotarła do przednich, powaliła je i pochłonęła wszystko. Dragon, który uderzył, chciał powtórzyć cios. Wierieszczagin z okrzykiem przerażenia, zasłaniając się rękami, rzucił się na lud. Wysoki facet, na którego wpadł, chwycił rękami za chudą szyję Wiereszchagina i z dzikim krzykiem upadli pod nogi ryczącego tłumu.
Niektórzy bili i szarpali Vereshchagina, inni byli wysocy i mali. A krzyki zmiażdżonych ludzi i tych, którzy próbowali ratować wysokiego mężczyznę, tylko wzbudziły wściekłość tłumu. Dragoni przez długi czas nie mogli uwolnić zakrwawionego, pobitego na śmierć pracownika fabryki. I przez długi czas, pomimo całego gorączkowego pośpiechu, z jakim tłum próbował dokończyć rozpoczęte dzieło, ci, którzy bili, dusili i szarpali Wierieszczagina, nie mogli go zabić; lecz tłum napierał na nich ze wszystkich stron, z nimi w środku, jak jedna masa, kołysząc się z boku na bok i nie dając im możliwości ani dobicia, ani rzucenia.

Lekcja nr 4

Temat: „Statystyka opisowa. Wskaźniki różnorodności cech w sumie”

Głównymi kryteriami różnorodności cechy w populacji statystycznej są: granica, amplituda, odchylenie standardowe, współczynnik oscylacji i współczynnik zmienności. Na poprzedniej lekcji omówiono, że wartości średnie stanowią jedynie uogólnioną charakterystykę badanej cechy w sumie i nie uwzględniają wartości jej poszczególnych wariantów: wartości minimalne i maksymalne, powyżej średniej, poniżej średnia itp.

Przykład. Średnie wartości dwóch różnych ciągów liczbowych: -100; -20; 100; 20 i 0,1; -0,2; 0,1 są absolutnie identyczne i równeO.Jednakże zakresy rozproszenia tych względnych średnich danych sekwencji są bardzo różne.

Określenie wymienionych kryteriów różnorodności cechy odbywa się przede wszystkim z uwzględnieniem jej wartości w poszczególnych elementach populacji statystycznej.

Wskaźnikami pomiaru zmienności cechy są absolutny I względny. Bezwzględnymi wskaźnikami zmienności są: zakres zmienności, granica, odchylenie standardowe, dyspersja. Współczynnik zmienności i współczynnik oscylacji odnoszą się do względnych miar zmienności.

Limit (lim)– Jest to kryterium, które wyznaczają skrajne wartości wariantu w szeregu zmian. Innymi słowy, kryterium to ogranicza się do minimalnych i maksymalnych wartości atrybutu:

Amplituda (Am) Lub zakres zmienności – Na tym polega różnica między skrajnymi opcjami. Obliczenie tego kryterium odbywa się poprzez odjęcie jego minimalnej wartości od maksymalnej wartości atrybutu, co pozwala oszacować stopień rozproszenia opcji:

Wadą granicy i amplitudy jako kryteriów zmienności jest to, że całkowicie zależą one od ekstremalnych wartości cechy w szeregu zmian. W takim przypadku nie są brane pod uwagę wahania wartości atrybutów w obrębie serii.

Najbardziej kompletnego opisu różnorodności cechy w populacji statystycznej dostarcza: odchylenie standardowe(sigma), która jest ogólną miarą odchylenia opcji od jej średniej wartości. Często nazywane jest odchyleniem standardowym odchylenie standardowe.

Odchylenie standardowe opiera się na porównaniu każdej opcji ze średnią arytmetyczną danej populacji. Ponieważ w agregacie zawsze będą opcje zarówno mniejsze, jak i większe, wówczas suma odchyleń ze znakiem „” zostanie anulowana przez sumę odchyleń ze znakiem „”, tj. suma wszystkich odchyleń wynosi zero. Aby uniknąć wpływu znaków różnic, przyjmuje się odchylenia od średniej arytmetycznej do kwadratu, tj. . Suma kwadratów odchyleń nie jest równa zeru. Aby uzyskać współczynnik mierzący zmienność, należy przyjąć średnią z sumy kwadratów - wartość ta nazywa się odchylenia:

W istocie dyspersja to średni kwadrat odchyleń poszczególnych wartości cechy od jej wartości średniej. Dyspersja kwadrat odchylenia standardowego.

Wariancja jest wielkością wymiarową (nazwaną). Jeśli więc warianty szeregu liczbowego są wyrażone w metrach, wówczas wariancja daje metry kwadratowe; jeśli opcje są wyrażone w kilogramach, wówczas wariancja daje kwadrat tej miary (kg 2) itd.

Odchylenie standardowe– pierwiastek kwadratowy wariancji:

, a następnie przy obliczaniu rozproszenia i odchylenia standardowego w mianowniku ułamka zamiasttrzeba położyć.

Obliczanie odchylenia standardowego można podzielić na sześć etapów, które należy przeprowadzić w określonej kolejności:

Zastosowanie odchylenia standardowego:

a) do oceny zmienności szeregów zmienności i porównawczej oceny typowości (reprezentatywności) średnich arytmetycznych. Jest to konieczne w diagnostyce różnicowej przy ustalaniu stabilności objawów.

b) zrekonstruować szereg zmian, tj. przywrócenie jego charakterystyki częstotliwościowej w oparciu o zasady trzech sigm. W przerwie (±3σ) 99,7% wszystkich wariantów serii mieści się w przedziale (±2σ) - 95,5% i w zakresie (±1σ) - Opcja rzędu 68,3%.(ryc. 1).

c) w celu zidentyfikowania opcji „wyskakujących”.

d) wyznaczanie parametrów normy i patologii za pomocą szacunków sigma

e) obliczyć współczynnik zmienności

f) obliczyć średni błąd średniej arytmetycznej.

Aby scharakteryzować każdą populację, która matyp rozkładu normalnego , wystarczy znać dwa parametry: średnią arytmetyczną i odchylenie standardowe.

Rysunek 1. Reguła trzech sigma

Przykład.

W pediatrii odchylenie standardowe służy do oceny rozwoju fizycznego dzieci poprzez porównanie danych konkretnego dziecka z odpowiednimi wskaźnikami standardowymi. Za standard przyjmuje się średnią arytmetyczną rozwoju fizycznego zdrowych dzieci. Porównanie wskaźników ze standardami odbywa się za pomocą specjalnych tabel, w których podane są standardy wraz z odpowiadającymi im skalami sigma. Uważa się, że jeśli wskaźnik rozwoju fizycznego dziecka mieści się w normie (średnia arytmetyczna) ±σ, to rozwój fizyczny dziecka (według tego wskaźnika) odpowiada normie. Jeżeli wskaźnik mieści się w normie ±2σ, wówczas występuje niewielkie odchylenie od normy. Jeśli wskaźnik przekroczy te granice, wówczas rozwój fizyczny dziecka znacznie odbiega od normy (możliwa jest patologia).

Oprócz wskaźników zmienności wyrażonych w wartościach bezwzględnych, w badaniach statystycznych wykorzystuje się wskaźniki zmienności wyrażone w wartościach względnych. Współczynnik oscylacji - jest to stosunek zakresu zmienności do średniej wartości cechy. Współczynnik zmienności - Jest to stosunek odchylenia standardowego do średniej wartości cechy. Zazwyczaj wartości te wyrażane są w procentach.

Wzory do obliczania wskaźników zmienności względnej:

Z powyższych wzorów jasno wynika, że ​​im większy współczynnik V jest bliższa zeru, tym mniejsze jest zróżnicowanie wartości charakterystycznych. Tym bardziej V, tym bardziej zmienny jest znak.

W praktyce statystycznej najczęściej wykorzystuje się współczynnik zmienności. Służy nie tylko do porównawczej oceny zmienności, ale także do charakteryzowania jednorodności populacji. Populację uważa się za jednorodną, ​​jeżeli współczynnik zmienności nie przekracza 33% (dla rozkładów zbliżonych do normalnego). Arytmetycznie stosunek σ do średniej arytmetycznej neutralizuje wpływ wartości bezwzględnej tych cech, a stosunek procentowy sprawia, że ​​współczynnik zmienności jest wartością bezwymiarową (nienazwaną).

Otrzymaną wartość współczynnika zmienności szacuje się na podstawie przybliżonych stopni zróżnicowania cechy:

Słabe - do 10%

Średnia - 10 - 20%

Silny - ponad 20%

Stosowanie współczynnika zmienności jest wskazane w przypadkach, gdy konieczne jest porównanie cech różniących się wielkością i wymiarem.

Wyraźnie ukazano różnicę między współczynnikiem zmienności a innymi kryteriami rozproszenia przykład.

Tabela 1

Skład pracowników przedsiębiorstw przemysłowych

Na podstawie charakterystyk statystycznych podanych w przykładzie można wyciągnąć wniosek o względnej jednorodności struktury wiekowej i poziomu wykształcenia pracowników przedsiębiorstwa, biorąc pod uwagę niską stabilność zawodową badanej kontyngentu. Łatwo zauważyć, że próba oceny tych tendencji społecznych na podstawie odchylenia standardowego doprowadziłaby do błędnego wniosku, a próba porównania cech księgowych „doświadczenie zawodowe” i „wiek” ze wskaźnikiem księgowym „wykształcenie” byłaby w zasadzie nieprawidłowe ze względu na niejednorodność tych cech.

Mediana i percentyle

W przypadku rozkładów porządkowych (rangowych), gdzie kryterium środka szeregu jest mediana, odchylenie standardowe i rozproszenie nie mogą służyć jako charakterystyki rozproszenia wariantu.

To samo dotyczy serii otwartych zmian. Okoliczność ta wynika z faktu, że odchylenia, z których obliczana jest wariancja i σ, mierzone są od średniej arytmetycznej, której nie oblicza się w otwartych szeregach zmienności i szeregach rozkładów cech jakościowych. Dlatego do skompresowanego opisu rozkładów używany jest inny parametr rozproszenia - kwantyl(synonim - „percentyl”), odpowiedni do opisu cech jakościowych i ilościowych w dowolnej formie ich rozkładu. Parametr ten można również wykorzystać do przekształcenia cech ilościowych na jakościowe. W tym przypadku oceny te przydzielane są w zależności od rzędu kwantyla, któremu odpowiada dana opcja.

W praktyce badań biomedycznych najczęściej wykorzystuje się następujące kwantyle:

– mediana;

, – kwartyle (ćwiartki), gdzie – kwartyl dolny, górny kwartyl.

Kwantyle dzielą obszar możliwych zmian szeregu zmian na określone przedziały. Mediana (kwantyl) to opcja znajdująca się w środku szeregu wariacyjnego i dzieląca ten szereg na pół na dwie równe części ( 0,5 I 0,5 ). Kwartyl dzieli szereg na cztery części: pierwsza część (kwartyl dolny) to opcja oddzielająca opcje, których wartości liczbowe nie przekraczają 25% wartości maksymalnej możliwej w danym szeregu; do 50% maksymalnej możliwej kwoty. Górny kwartyl () oddziela opcje do 75% maksymalnych możliwych wartości.

W przypadku rozkładu asymetrycznego zmienna w stosunku do średniej arytmetycznej, do jej scharakteryzowania stosuje się medianę i kwartyle. W tym przypadku stosowana jest następująca forma wyświetlania wartości średniej - Meh (;). Na przykład, badana cecha – „okres, w którym dziecko zaczęło samodzielnie chodzić” – ma w badanej grupie rozkład asymetryczny. Jednocześnie dolny kwartyl () odpowiada początkowi chodzenia - 9,5 miesiąca, mediana - 11 miesięcy, górny kwartyl () - 12 miesięcy. W związku z tym charakterystyka średniego trendu określonego atrybutu zostanie przedstawiona jako 11 (9,5; 12) miesięcy.

Ocena istotności statystycznej wyników badań

Przez istotność statystyczną danych rozumie się stopień ich zgodności z przedstawioną rzeczywistością, tj. dane istotne statystycznie to takie, które nie zniekształcają i prawidłowo odzwierciedlają obiektywną rzeczywistość.

Ocena istotności statystycznej wyników badań oznacza określenie, z jakim prawdopodobieństwem możliwe jest przeniesienie wyników uzyskanych z populacji próbnej na całą populację. Ocena istotności statystycznej jest konieczna, aby zrozumieć, jaką część zjawiska można wykorzystać do oceny zjawiska jako całości i jego wzorców.

Ocena istotności statystycznej wyników badań polega na:

1. błędy reprezentatywności (błędy wartości średnich i względnych) - M;

2. granice ufności wartości średnich lub względnych;

3. wiarygodność różnicy wartości średnich lub względnych według kryterium T.

Błąd standardowy średniej arytmetycznej Lub błąd reprezentatywności charakteryzuje wahania średniej. Należy zauważyć, że im większa liczebność próby, tym mniejszy rozrzut wartości średnich. Błąd standardowy średniej oblicza się ze wzoru:

We współczesnej literaturze naukowej średnią arytmetyczną zapisuje się razem z błędem reprezentatywności:

lub razem z odchyleniem standardowym:

Jako przykład rozważmy dane dotyczące 1500 przychodni miejskich w kraju (populacja ogólna). Średnia liczba pacjentów obsługiwanych w przychodni wynosi 18 150 osób. Losowy wybór 10% placówek (150 przychodni) daje średnią liczbę pacjentów równą 20 051 osób. Błąd próby, wynikający oczywiście z faktu, że nie wszystkie 1500 klinik zostało objętych próbą, jest równy różnicy pomiędzy tymi średnimi – średniej ogólnej ( M gen) i średnia próbki ( M wybrany). Jeśli utworzymy kolejną próbkę tej samej wielkości z naszej populacji, otrzymamy inną wartość błędu. Wszystkie te średnie z próby, przy wystarczająco dużych próbach, rozkładają się normalnie wokół średniej ogólnej przy wystarczająco dużej liczbie powtórzeń próbki tej samej liczby obiektów z populacji ogólnej. Błąd standardowy średniej M- jest to nieuniknione rozproszenie średnich z próby wokół średniej ogólnej.

W przypadku, gdy wyniki badań prezentowane są w ilościach względnych (np. procentach) – obliczonych błąd standardowy ułamka:

gdzie P jest wskaźnikiem w %, n jest liczbą obserwacji.

Wynik jest wyświetlany jako (P ± m)%. Na przykład, odsetek wyzdrowień wśród pacjentów wyniósł (95,2±2,5)%.

W przypadku, gdy liczba elementów populacji, a następnie przy obliczaniu błędów standardowych średniej i ułamka w mianowniku ułamka, zamiasttrzeba położyć.

W przypadku rozkładu normalnego (rozkład średnich z próby jest normalny) wiemy, jaka część populacji mieści się w dowolnym przedziale wokół średniej. Zwłaszcza:

W praktyce problem polega na tym, że cechy populacji ogólnej nie są nam znane, a próba jest dobierana właśnie po to, by je oszacować. Oznacza to, że jeśli wykonamy próbki tej samej wielkości N z populacji ogólnej, to w 68,3% przypadków przedział będzie zawierał wartość M(w 95,5% przypadków będzie to na interwale, a w 99,7% przypadków – na interwale).

Ponieważ faktycznie pobierana jest tylko jedna próba, stwierdzenie to formułuje się w kategoriach prawdopodobieństwa: z prawdopodobieństwem 68,3% średnia wartość atrybutu w populacji mieści się w przedziale z prawdopodobieństwem 95,5% - w przerwie itp.

W praktyce wokół wartości próbki budowany jest przedział taki, że przy danym (wystarczająco wysokim) prawdopodobieństwie: prawdopodobieństwo ufności –„pokryłoby” rzeczywistą wartość tego parametru w populacji ogólnej. Ten przedział nazywa się przedział ufności.

Prawdopodobieństwo ufnościP jest to stopień pewności, że przedział ufności będzie faktycznie zawierał prawdziwą (nieznaną) wartość parametru w populacji.

Na przykład, jeśli prawdopodobieństwo zaufania R wynosi 90%, oznacza to, że 90 próbek na 100 da prawidłowe oszacowanie parametru w populacji. W związku z tym prawdopodobieństwo błędu, tj. błędne oszacowanie średniej ogólnej dla próby jest równe procentowo: . W tym przykładzie oznacza to, że 10 próbek na 100 da nieprawidłowe oszacowanie.

Oczywiście stopień ufności (prawdopodobieństwo ufności) zależy od wielkości przedziału: im szerszy przedział, tym większa pewność, że wpadnie w niego nieznana wartość dla populacji. W praktyce do skonstruowania przedziału ufności zapewniającego pewność co najmniej 95,5% stosuje się błąd co najmniej dwukrotnie większy od błędu próbkowania.

Wyznaczenie granic ufności średnich i wartości względnych pozwala znaleźć ich dwie skrajne wartości – możliwie minimalną i maksymalną, w obrębie których badany wskaźnik może występować w całej populacji. Na tej podstawie granice ufności (lub przedział ufności)- są to granice wartości średnich lub względnych, poza którymi z powodu przypadkowych wahań istnieje niewielkie prawdopodobieństwo.

Przedział ufności można przepisać jako: , gdzie T– kryterium ufności.

Granice ufności średniej arytmetycznej w populacji wyznacza wzór:

M gen = M wybierać + t m M

dla wartości względnej:

R gen = P wybierać + t m R

Gdzie M gen I R gen- wartości wartości średnich i względnych dla populacji ogólnej; M wybierać I R wybierać- wartości wartości średnich i względnych uzyskanych z populacji próbnej; M M I M P- błędy wartości średnich i względnych; T- kryterium ufności (kryterium trafności, które ustala się przy planowaniu badania i może wynosić 2 lub 3); t m- jest to przedział ufności lub Δ - maksymalny błąd wskaźnika uzyskany w badaniu reprezentacyjnym.

Należy zauważyć, że wartość kryterium T w pewnym stopniu związane z prawdopodobieństwem bezbłędnym prognozy (p), wyrażonym w %. Wybiera go sam badacz, kierując się koniecznością uzyskania wyniku o wymaganym stopniu dokładności. Zatem dla prawdopodobieństwa bezbłędnej prognozy wynoszącego 95,5% wartość kryterium T wynosi 2, dla 99,7% - 3.

Podane oszacowania przedziałów ufności są dopuszczalne jedynie dla populacji statystycznych liczących powyżej 30 obserwacji. Przy mniejszej liczebności populacji (małe próby) do ustalenia kryterium t stosuje się specjalne tablice. W tych tabelach pożądana wartość znajduje się na przecięciu linii odpowiadającej wielkości populacji (n-1) oraz kolumnę odpowiadającą wybranemu przez badacza poziomowi prawdopodobieństwa wolnej od błędów prognozy (95,5%; 99,7%). W badaniach medycznych przy ustalaniu granic ufności dla dowolnego wskaźnika prawdopodobieństwo bezbłędnej prognozy wynosi 95,5% lub więcej. Oznacza to, że wartość wskaźnika uzyskana z populacji próbnej musi znajdować się w populacji ogólnej w co najmniej 95,5% przypadków.

    Pytania na temat lekcji:

    Znaczenie wskaźników różnorodności cech w populacji statystycznej.

    Ogólna charakterystyka wskaźników zmienności bezwzględnej.

    Odchylenie standardowe, obliczenia, zastosowanie.

    Względne miary zmienności.

    Mediana, wynik kwartylowy.

    Ocena istotności statystycznej wyników badań.

    Błąd standardowy średniej arytmetycznej, wzór obliczeniowy, przykład zastosowania.

    Obliczanie proporcji i jej błędu standardowego.

    Pojęcie prawdopodobieństwa ufności, przykład zastosowania.

10. Pojęcie przedziału ufności, jego zastosowanie.

    Zadania testowe na ten temat ze standardowymi odpowiedziami:

1. BEZWZGLĘDNE WSKAŹNIKI ZMIANY DOTYCZĄ

1) współczynnik zmienności

2) współczynnik oscylacji

4) mediana

2. WSKAŹNIKI WZGLĘDNE ZMIANY

1) dyspersja

4) współczynnik zmienności

3. KRYTERIUM OKREŚLONE PRZEZ EKSTREMALNE WARTOŚCI OPCJI W SERII ZMIAN

2) amplituda

3) dyspersja

4) współczynnik zmienności

4. RÓŻNICA OPCJI EKSTREMALNYCH JEST

2) amplituda

3) odchylenie standardowe

4) współczynnik zmienności

5. ŚREDNI KWADRAT ODCHYLEŃ POSZCZEGÓLNYCH WARTOŚCI CHARAKTERYSTYKI OD JEJ WARTOŚCI ŚREDNICH WYNOSI

1) współczynnik oscylacji

2) mediana

3) dyspersja

6. STOSUNEK SKALI ZMIANY DO ŚREDNIEJ WARTOŚCI CHARAKTERU WYNOSI

1) współczynnik zmienności

2) odchylenie standardowe

4) współczynnik oscylacji

7. STOSUNEK ŚREDNIEGO ODCHYLENIA KWADRATOWEGO DO ŚREDNIEJ WARTOŚCI CHARAKTERYSTYKI WYNOSI

1) dyspersja

2) współczynnik zmienności

3) współczynnik oscylacji

4) amplituda

8. OPCJA ZNAJDUJĄCA SIĘ W ŚRODKU SERII ZMIAN I DZIELĄCA JĄ NA DWIE RÓWNE CZĘŚCI JEST

1) mediana

3) amplituda

9. W BADANIACH MEDYCZNYCH PRZY USTALANIU GRANIC UFNOŚCI DLA KAŻDEGO WSKAŹNIKA PRZYJMUJE SIĘ PRAWdopodobieństwo BEZBŁĘDNEJ PRZEWIDYWANIA

10. JEŚLI 90 PRÓBEK NA 100 PODA PRAWIDŁOWE OSZACOWANIE PARAMETRA W POPULACJI, OZNACZA TO, ŻE PRAWdopodobieństwo UFNOŚCI P RÓWNY

11. JEŚLI 10 PRÓBEK NA 100 PODA NIEPRAWIDŁOWE OSZACOWANIE, PRAWdopodobieństwo błędu jest równe

12. GRANICE WARTOŚCI ŚREDNICH LUB WZGLĘDNYCH, POWYŻEJ KTÓRYCH Wskutek losowych oscylacji ma małe prawdopodobieństwo – TO JEST

1) przedział ufności

2) amplituda

4) współczynnik zmienności

13. ZA MAŁA PRÓBĘ UZNAJE SIĘ TĘ POpulację, W KTÓREJ

1) n jest mniejsze lub równe 100

2) n jest mniejsze lub równe 30

3) n jest mniejsze lub równe 40

4) n jest bliskie 0

14. DLA PRAWIDŁOWOŚCI BEZBŁĘDNEJ PROGNOZY WARTOŚĆ KRYTERIA 95% T JEST

15. DLA PRAWIDŁOWOŚCI BEZBŁĘDNEJ PROGNOZY WARTOŚĆ KRYTERIA 99% T JEST

16. DLA ROZKŁADÓW BLISKO NORMALNEJ LUDNOŚĆ UZNAJE SIĘ ZA HOMOGENICZNĄ, JEŚLI WSPÓŁCZYNNIK ZMIANY NIE PRZEKRACZA

17. OPCJA, OPCJE WYDZIELAJĄCE, KTÓRYCH WARTOŚCI LICZBOWE NIE PRZEKRACZAJĄ 25% MAKSYMALNEJ MOŻLIWEJ W DANEJ SERII – JEST TO

2) dolny kwartyl

3) górny kwartyl

4) kwartyl

18. DANE, KTÓRE NIE ZAKSZTUCAJĄ I PRAWIDŁOWO ODzwierciedlają OBIEKTYWNĄ RZECZYWISTOŚĆ, NAZYWAJĄ SIĘ

1) niemożliwe

2) równie możliwe

3) niezawodny

4) losowe

19. ZGODNIE Z ZASADĄ „TRZECH SIGMA”, Z NORMALNYM ROZKŁADEM CHARAKTERYSTYKI WEWNĄTRZ
BĘDZIE LOKALIZOWANY

1) Opcja 68,3%.

W tym artykule opowiem o jak znaleźć odchylenie standardowe. Materiał ten jest niezwykle ważny dla pełnego zrozumienia matematyki, dlatego korepetytor matematyki powinien poświęcić mu osobną lekcję lub nawet kilka. W tym artykule znajdziesz link do szczegółowego i zrozumiałego samouczka wideo, który wyjaśnia, czym jest odchylenie standardowe i jak je znaleźć.

Odchylenie standardowe umożliwia ocenę rozrzutu wartości uzyskanych w wyniku pomiaru określonego parametru. Oznaczone symbolem (grecka litera „sigma”).

Wzór na obliczenia jest dość prosty. Aby znaleźć odchylenie standardowe, należy wziąć pierwiastek kwadratowy z wariancji. Zatem teraz musisz zadać sobie pytanie: „Co to jest wariancja?”

Co to jest wariancja

Definicja wariancji wygląda następująco. Dyspersja to średnia arytmetyczna kwadratów odchyleń wartości od średniej.

Aby znaleźć wariancję, wykonaj kolejno następujące obliczenia:

  • Określ średnią (prostą średnią arytmetyczną szeregu wartości).
  • Następnie odejmij średnią od każdej wartości i podnieś uzyskaną różnicę do kwadratu (otrzymujesz kwadratowa różnica).
  • Następnym krokiem jest obliczenie średniej arytmetycznej powstałych kwadratów różnic (dlaczego dokładnie podano kwadraty, dowiesz się poniżej).

Spójrzmy na przykład. Załóżmy, że ty i twoi przyjaciele decydujecie się zmierzyć wzrost swoich psów (w milimetrach). W wyniku pomiarów otrzymałeś następujące wymiary wysokości (w kłębie): 600 mm, 470 mm, 170 mm, 430 mm i 300 mm.

Obliczmy średnią, wariancję i odchylenie standardowe.

Najpierw znajdźmy średnią wartość. Jak już wiesz, aby to zrobić, musisz dodać wszystkie zmierzone wartości i podzielić przez liczbę pomiarów. Postęp obliczeń:

Średnia mm.

Zatem średnia (średnia arytmetyczna) wynosi 394 mm.

Teraz musimy ustalić odchylenie wzrostu każdego psa od średniej:

Wreszcie, do obliczenia wariancji, podrównujemy każdą z powstałych różnic, a następnie znajdujemy średnią arytmetyczną uzyskanych wyników:

Dyspersja mm 2 .

Zatem dyspersja wynosi 21704 mm2.

Jak znaleźć odchylenie standardowe

Jak więc możemy teraz obliczyć odchylenie standardowe, znając wariancję? Jak pamiętamy, weź pierwiastek kwadratowy z tego. Oznacza to, że odchylenie standardowe jest równe:

Mm (w zaokrągleniu do najbliższej liczby całkowitej w mm).

Korzystając z tej metody, odkryliśmy, że niektóre psy (na przykład rottweilery) są bardzo dużymi psami. Ale są też bardzo małe psy (na przykład jamniki, ale nie należy im tego mówić).

Najciekawsze jest to, że odchylenie standardowe niesie ze sobą przydatne informacje. Teraz możemy pokazać, które z uzyskanych wyników pomiarów wzrostu mieszczą się w przedziale, który otrzymamy, jeśli wykreślimy odchylenie standardowe od średniej (po obu jej stronach).

Oznacza to, że korzystając z odchylenia standardowego, otrzymujemy metodę „standardową”, która pozwala nam dowiedzieć się, która z wartości jest normalna (statystycznie średnia), a która wyjątkowo duża lub odwrotnie mała.

Co to jest odchylenie standardowe

Ale... wszystko będzie trochę inne, jeśli to przeanalizujemy próbka dane. W naszym przykładzie rozważaliśmy ogólna populacja. Oznacza to, że nasze 5 psów było jedynymi psami na świecie, które nas zainteresowały.

Ale jeśli dane są próbą (wartości wybrane z dużej populacji), wówczas obliczenia należy wykonać inaczej.

Jeśli istnieją wartości, to:

Wszystkie pozostałe obliczenia przeprowadza się podobnie, łącznie z określeniem średniej.

Na przykład, jeśli pięć naszych psów to tylko próbka populacji psów (wszystkich psów na planecie), musimy dokonać podziału przez 4, nie 5, mianowicie:

Wariancja próbki = mm2.

W tym przypadku odchylenie standardowe dla próbki jest równe mm (w zaokrągleniu do najbliższej liczby całkowitej).

Można powiedzieć, że dokonaliśmy pewnej „korekty” w przypadku, gdy nasze wartości są tylko małą próbką.

Notatka. Dlaczego dokładnie kwadratowe różnice?

Ale dlaczego przy obliczaniu wariancji bierzemy dokładnie kwadraty różnic? Załóżmy, że mierząc jakiś parametr, otrzymałeś następujący zestaw wartości: 4; 4; -4; -4. Jeśli po prostu dodamy do siebie bezwzględne odchylenia od średniej (różnice),... wartości ujemne znoszą się z wartościami dodatnimi:

.

Okazuje się, że ta opcja jest bezużyteczna. Może więc warto spróbować wartości bezwzględnych odchyleń (czyli modułów tych wartości)?

Na pierwszy rzut oka okazuje się to dobre (nawiasem mówiąc, wynikową wartość nazywa się średnim odchyleniem bezwzględnym), ale nie we wszystkich przypadkach. Spróbujmy innego przykładu. Niech wynik pomiaru przyjmie następujący zestaw wartości: 7; 1; -6; -2. Następnie średnie odchylenie bezwzględne wynosi:

Wow! Ponownie otrzymaliśmy wynik 4, choć różnice mają znacznie większy rozrzut.

Zobaczmy teraz, co się stanie, jeśli podniesiemy różnice do kwadratu (a następnie wyciągniemy pierwiastek kwadratowy z ich sumy).

Dla pierwszego przykładu będzie to:

.

Dla drugiego przykładu będzie to:

Teraz to zupełnie inna sprawa! Im większy rozrzut różnic, tym większe odchylenie standardowe... do czego właśnie dążyliśmy.

W rzeczywistości metoda ta wykorzystuje tę samą ideę, co przy obliczaniu odległości między punktami, tyle że zastosowana jest w inny sposób.

Z matematycznego punktu widzenia używanie kwadratów i pierwiastków kwadratowych zapewnia więcej korzyści, niż można by uzyskać z wartości odchylenia bezwzględnego, dzięki czemu odchylenie standardowe można zastosować do innych problemów matematycznych.

Siergiej Waleriewicz powiedział ci, jak znaleźć odchylenie standardowe

Wybór redaktora
Popularne jest wróżenie na fusach kawy, intrygujące znakami losu i fatalnymi symbolami na dnie filiżanki. W ten sposób przewidywania...

Młodszy wiek. Opiszemy kilka przepisów na przygotowanie takiego dania Owsianka z wermiszelem w powolnej kuchence. Najpierw przyjrzyjmy się...

Wino to trunek, który pija się nie tylko na każdej imprezie, ale także po prostu wtedy, gdy mamy ochotę na coś mocniejszego. Jednak wino stołowe jest...

Różnorodność kredytów dla firm jest obecnie bardzo duża. Przedsiębiorca często może znaleźć naprawdę opłacalną pożyczkę tylko...
W razie potrzeby klops z jajkiem w piekarniku można owinąć cienkimi paskami boczku. Nada potrawie niesamowity aromat. Poza tym zamiast jajek...
Dżem morelowy ma szczególne miejsce. Oczywiście, kto jak to postrzega. Nie lubię świeżych moreli; to inna sprawa. Ale ja...
Celem pracy jest określenie czasu reakcji człowieka. Zapoznanie z obróbką statystyczną wyników pomiarów i...
Wyniki jednolitego egzaminu państwowego. Kiedy publikowane są wyniki Jednolitego Egzaminu Państwowego, Jednolitego Egzaminu Państwowego i Egzaminu Państwowego oraz jak je znaleźć. Jak długo utrzymują się rezultaty...
OGE 2018. Język rosyjski. Część ustna. 10 opcji. Dergileva Zh.I.