deviație standard
Abaterea standard - un număr care descrie modul în care valorile de date sunt de obicei diferite de media. Conceptul de deviație standard este foarte importantă în statistici, deoarece acestea sunt principalul instrument pentru a determina gradul de dezordine în studiul situației. În special, această cifră este o măsură de dezordine a abaterilor valorilor individuale de la media lor.
În cazul în care toate valorile sunt aceleași ca, de exemplu, următorul set simplu de date
media va avea o valoare = 5,5, iar abaterea standard va fi S = 0. Aceasta din urmă reflectă faptul că acest set de date nu este un subiect banal variabilității.
În viața reală, cea mai mare parte a datelor se caracterizează printr-un grad mai mare sau mai mic de variabilitate. Valorile individuale de date CCD este situat la o oarecare distanță față de media și abaterea standard caracterizează gradul de variabilitate. Să luăm acum în considerare un alt set de date, care este inerentă în unele variabilitate:
Distanțele descrise mai sus din valoarea medie se numește o abatere. sau o diferență. Ele arată cât de mult peste valoarea medie (în cazul unei diferențe pozitive) sau sub medie (în cazul în care diferența este negativă) este fiecare valoare de date. Abateri la rândul lor, formează un set de date situate în jurul valorii de zero, care este similar cu setul original de valori de date, care sunt situate în jurul mediei.
Ca o deviație caracteristici de generalizare se utilizează deviația standard. Doar abaterea medie nu poate fi, deoarece unele dintre ele va fi negativ, iar unele - pozitive, astfel încât rezultatul este întotdeauna mediei egal cu zero și nu va conține informații suplimentare. In schimb, folosind metoda standard care constă în aceea că fiecare valoare este mai întâi la pătrat, pentru a scapa de „minus“ semn, apoi se adaugă, împărțit la n-1 și rădăcina pătrată extrasă (aceasta este operația inversă cu privire la executat anterior Cuadratura ).
Prin calcule algebrice se poate demonstra că suma abaterilor de la medie pentru orice set de date va fi întotdeauna zero. S-ar părea, pur și simplu înlocuiți „minus“ la „plus“ și apoi să ia o medie. Dar, de asemenea, ușor de a arăta că această metodă simplă nu asigură utilizarea eficientă a tuturor informațiilor conținute în datele, în cazul în care acesta este o distribuție normală.
Împărțind de n-1 în loc de n (așa cum se face de obicei în calculul valorii medii) este asociată cu o corecție datorită faptului că atunci când se lucrează cu o valoare reală a eșantionului media populației generale necunoscute. Putem presupune, de asemenea, că această modificare ca urmare a pierderii în calcularea abaterii de o bucată de informații (sau, cum se spune în statistici, un grad de libertate). Pierdut este informații cu privire la valorile de date reale (ca și acum, atunci când este vorba de abateri, datele nu sunt situate în jurul valorii de mijloc, și în jurul valorii de zero).