Valorile medii și variații ale indicatorilor

Conceptul și tipurile de medii

Valoarea medie - o măsură sumară a unei populații statistice, care rasplateste diferențele individuale de valori statistice ale valorilor, care să permită să compare diferite combinații unele cu altele.







Mediul structural includ modul și mediana. dar cel mai frecvent mediu de diferite tipuri de putere utilizate.

Valorile medii de putere

Puterea medie poate fi simplu sau ponderat.

Valoarea medie este calculată simplu atunci când există două sau mai multe negrupate valori statistice aranjate într-o ordine arbitrară, în următoarea formulă generală:

Valoarea medie ponderată calculată de valorile statistice grupate utilizând următoarea formulă generală:

în care X - valori distincte sau valori statistice ale mijloacelor de grupare a intervalelor;
m - exponent, a căror valoare depinde de următoarele tipuri de putere de medii:
când m = -1 medie armonică;
când m = 0 medie geometrică;
când m = 1, media aritmetică;
când m = 2 medie pătrată;
când m = 3, medie cubi.

Folosind formula generală și un simplu medii ponderate cu diferite exponenți m, obținem formula privată a fiecărei specii, care vor fi discutate în continuare în detaliu.

media aritmetică

Media aritmetică - acesta este cel mai des folosit de valoarea medie, care se obține prin substituirea în formula generală m = 1. medie aritmetică simplă este după cum urmează:

în care X - valorile, pentru care este necesar să se calculeze valoarea medie; N - numărul total de valori X (numărul de unități din populația țintă). De exemplu, studentul a trecut examenul și 4 au primit următoarea evaluare: 3, 4, 4 și 5. Se calculează punctajul mediu pentru o formulă medie aritmetică simplă: (3 + 4 + 4 + 5) / 4 = 16/4 = 4.

medie aritmetică ponderată este următoarea:

unde f - numărul de valori la aceeași valoare X (frecvență). De exemplu, studentul a trecut examenul și 4 au primit următoarea evaluare: 3, 4, 4 și 5. Se calculează media scorului pentru aritmetică medie ponderată cu formula: (3 * 1 + 4 * 2 + 5 * 1) / 4 = 16/4 = 4.

Dacă valoarea X dată sub formă de intervale de timp, atunci calculele sunt utilizate pentru medii sloturi X, care sunt definite ca jumătate din suma limitelor superioare și inferioare ale intervalului. Slotul X în cazul în care nu există nici o limită superioară sau inferioară (interval deschis) este apoi se aplică gamei locație (diferența dintre partea superioară și limita inferioară) a unui interval adiacent X.

De exemplu, în compania a 10 angajați cu experiență de până la 3 ani, 20 - cu experiența de la 3 la 5 ani, 5 angajați - cu experienta de mai mult de 5 ani. Apoi se calculează vechimea medie a angajaților formula medie aritmetică ponderată luând X ca și intervalele de timp de mijloc (2, 4 si 6 ani):
(2 * 10 + 4 * + 20 6 * 5) / (10 + 20 + 5) = 3,71 ani.

Media aritmetică este folosită cel mai des, dar sunt momente când este necesar să se utilizeze alte tipuri de medii. Luați în considerare astfel de cazuri suplimentare.

media armonică

Armonica medie este utilizat atunci când datele sursă nu conține frecvența f a individului valorile X, iar produsul lor este prezentat ca Xf. Notând Xf = w, exprimăm f = w / X, și înlocuind aceste denumiri în formula medie aritmetică ponderată, obținem formula medie armonică ponderată:

Astfel, armonică medie ponderată se aplică atunci când necunoscută frecvența f și cunoscută w = Xf. În cazul în care toate w = 1, adică, valorile individuale ale X se găsesc la 1 dată, utilizați formula medie armonică simplă:

De exemplu, mașina mergând de la punctul A la punctul B, la o viteză de 90 km / h și înapoi - la o viteză de 110 km / h. Pentru a determina viteza medie aplică formula secundară simplă armonică, ca în exemplul dat distanța w1 = w2 (distanța de la punctul A la punctul B, cum ar fi de la B la A), care este produsul ratei (X) în timp (f) . Rata medie = (1 + 1) / (1/90 + 1/110) = 99 km / h.

Media geometrică

Media geometrică este utilizată pentru determinarea modificărilor relative medii, după cum se menționează în seriile de timp subiect. Valoarea medie geometrică oferă cele mai precise rezultate de calculare a mediei, în cazul în care sarcina este de a găsi astfel de valori ale lui X, care ar fi echidistant față de atât valorile minime și maxime ale X.

rădăcină medie pătrată

Rms este aplicată în cazul în care valorile inițiale ale X pot fi atât pozitive, cât și negative, de exemplu, atunci când se calculează abaterea medie.

Principalul domeniu de aplicare este măsurarea valorilor medii-pătrat de variație X, care vor fi discutate mai târziu în acest capitol.

medie cubic

Media Cubic rar folosit, de exemplu, în calculul indicelui sărăciei umane pentru țările în curs de dezvoltare (HPI-1) și a dezvoltat (HPI-2) propuse și calculat de Organizația Națiunilor Unite.

mediile structurale

moda statistică

moda statistica - aceasta este valoarea cea mai frecventă a valorilor X în populația statistică.

În cazul în care X este un set discret. modul este determinată fără a calcula valoarea caracteristică ca cea mai mare frecvență. Populația statistică este de 2 și mai mult de moda, atunci este considerată a fi un bimodală (două în cazul în care moda) sau multimodale (în cazul în care mai mult de două moduri), iar acest lucru dovedește eterogenitatea populației.

De exemplu, compania are 16 persoane: 4 dintre ele - cu experienta de 1 an, 3 persoane - cu experienta de 2 ani, 5 - cu experienta de 3 ani și 4 persoane - cu experienta de 4 ani. Astfel, lungimea modal Mo = 3 ani, deoarece frecvența valorii maxime (f = 5).

În cazul în care X este setat intervale egale. primul interval modal determinată ca fiind intervalul cu cea mai mare frecvență f. In cadrul acestui interval sunt un mod convențional bazat pe formula:







în cazul în care Mo - moda;
HNMo - limita inferioară a intervalului modal;
HMO - intervalul modal (diferența dintre limita superioară și inferioară);
FMO - intervalul de frecvență modal;
FMO-1 - intervalul de frecvență precedent modal;
FMO + 1 - interval de frecvență în urma modal. De exemplu, în compania a 10 angajați cu experiență de până la 3 ani, 20 - cu experiența de la 3 la 5 ani, 5 angajați - cu experienta de mai mult de 5 ani. Se calculează o vechime modal în intervalul modal de 3 până la 5 ani: Mo = 3 + 2 * (20-10) / (2 * 20-10-5) = 3,8 (ani).

Dacă o diferite intervale de scală h, în loc de frecvența f trebuie să utilizeze o densitate intervale de timp, calculat prin împărțirea frecvenței f pentru a mătura h interval.

mediană statistică

mediana statistică - o valoare de X, care împarte un ascendent sau descendent ordonat agregat statistic în 2 părți egale în număr. Ca urmare, o jumătate din valoarea este mai mare decât mediana, iar celălalt - mai puțin decât mediana.

În cazul în care X este un set discret. pentru a determina mediana toate valorile sunt numerotate de la 0 la N, în ordine crescătoare. atunci mediana unui număr par N se vor afla la jumatatea distantei dintre numerele X c 0,5N și (0,5N + 1), și cu un număr impar N este egal cu valoarea X cu numărul 0,5 (N + 1).

De exemplu, există dovezi cu privire la vârsta de studenții part-time într-un grup de 10 persoane - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 de ani. Aceste date sunt deja în ordine crescătoare, iar numărul N = 10 - chiar, deci va fi mediana între numerele X * 10 = 0,5 5 (0,5 * 10 + 1) = 6, care corespunde valoarea X5 = 21 și X6 = 23, atunci mediana: Me = (21 + 23) / 2 = 22 (ani).

Dacă X este setat ca intervale egale. Acesta este mai întâi determinată de intervalul median (interval în care se încheie o jumătate din frecvențele start f și cealaltă jumătate), care sunt valoarea medie condiționată de formula:

în cazul în care Me - mediană;
HNMe - limita inferioară a intervalului median;
HME - intervalul de baleiere median (diferența dintre limita superioară și inferioară);
FME - intervalul de frecvență medie;
FME-1 - intervale de frecvență sumei precedente mediana. În exemplul considerat anterior în calcularea timpului modal (plantelor de 10 muncitori care au lucrat până la 3 ani, 20 - cu experiența de la 3 la 5 ani, 5 angajați - cu experienta de peste 5 ani) se calculează lungimea mediana. Jumătate din numărul total de angajați este (10 + 20 + 5) / 2 = 17,5 și stocat în intervalul de la 3 la 5 ani, iar în primul interval de până la 3 ani - numai 10 oameni, la fel ca în primele două - (10 + 20) = 30, că mai mult de 17,5, apoi un interval de 3 până la 5 ani - mediana. În interiorul acestuia definește valoarea medie condiționată: Me = 3 + 2 * (0,5 * 30-10) / 20 = 3,5 (ani).

Ca și în cazul modei, în determinarea dacă mediana baleiere h intervale diferite, în loc de frecvența f trebuie să utilizeze intervalele de densitate calculată prin împărțirea frecvenței f pentru a mătura h interval.

indicatori de variație

Scala de variație

Scara de variație - diferența dintre valorile maxime și minime ale X disponibile în populația statistică studiată:

Dezavantajul exponent H este că arată doar diferența maximă între valorile X și nu se poate măsura efectul variației în întregime.

abatere liniară MEDIE

MEDIE liniară deviația - X reprezintă valorile medii ale modulului de abateri de la valoarea medie aritmetică. Acesta poate fi calculat prin formula medie aritmetică simplă - se obține o abatere liniară medie simplă:

De exemplu, un elev nu a promovat examenul și 4 au primit următoarea evaluare: 3, 4, 4 și 5. Acesta a fost deja calculat media aritmetică = 4. Se calculează deviația medie liniară este simplu: A = (| 3-4 | + | 4-4 | + | 4-4 | + | 5-4 |) / 4 = 0,5.

În cazul în care datele originale sunt grupate X (frecvențele disponibile f), calculul abaterii medii se realizează printr-o formulă liniară ponderată medie aritmetică - se obține o abatere liniară medie ponderată:

Revenind la exemplul despre un student care a trecut examenul, iar 4 au primit următoarea evaluare: 3, aritmetica 4, 4 și 5. Acesta a fost deja calculată înseamnă = 4 abaterea medie liniară simplă = 0.5. Se calculează abaterea liniară medie ponderată: R = (| 3-4 | * 1 + | 4-4 | * 2 + | 5-4 | * 1) / 4 = 0,5.

Coeficientul de variație liniară

Coeficientul de variație liniară - raportul dintre abaterea medie liniară la media aritmetică:

Cu coeficientul liniar de variație poate fi comparată cu variația diferitelor populații, deoarece, în contrast cu o deviație liniară a valorii sale medii nu depinde de X. unități

În acest exemplu, despre un student care a trecut examenul, iar 4 au primit următoarea evaluare: 3, 4, 4 și 5, coeficientul liniar de variație este de 0,5 / 4 = 0,125 sau 12,5%.

Dispersia - reprezintă media valorilor pătrate de abateri X de la media aritmetică. Dispersia poate fi calculată prin formula medie aritmetică simplă - se obține o simpla dispersie a:

După cum știm deja despre exemplul unui student care a trecut examenul și a primit un 4 Scor: 3, 4, 4 și 5, au fost anterior calculat media aritmetică = 4. Apoi varianța unui simplu D = ((3-4) 2 + (4-4 ) 2 + (4-4) 2 + (5-4) 2) / 4 = 0,5.

În cazul în care datele originale sunt grupate X (frecvențele disponibile f), calculul varianței se realizează în conformitate cu formula ponderată medie aritmetică - obține o variație ponderată:

În acest exemplu, despre un student care a trecut examenul, iar 4 au primit următoarea evaluare: 3, 4, 4 și 5, se calculează varianța ponderată a: E = ((3-4) 2 * 1 + (4-4) 2 * 2 + (5 -4) 2 * 1) / 4 = 0,5.

Dacă convertiți formula de dispersie (pentru a deschide parantezele pe termen numărătorul termen împărțit la numitorul și plumb ca), puteți obține o altă formulă pentru a calcula ca diferența dintre media pătratelor și pătratul mediei:

In exemplul de mai sus ne-am cunoscut despre studentul care a promovat examenul, iar 4 au primit următoarea evaluare: 3, 4, 4 și 5, se calculează metoda medie variație a diferenței de pătrate și o medie pătrat:
D = (3 2 * 1 + 4 2 * 2 + 5 2 * 1) / 2 = 16,5-16 devine 4-4 = 0,5.

În cazul în care valoarea X - este proporția populației. dispersiile sunt utilizate pentru a calcula proporția formulei privat de dispersie:

Devierea medie

Am vorbit deja despre formula medie pătrată. care este utilizat pentru a evalua variația prin calcularea abaterii standard. notate cu mici Sigma literă greacă:

Chiar și mai ușor, puteți găsi deviația standard. dacă variația în precalculate, rădăcina pătrată din care:

In exemplul despre student, în care se calculează dispersia de mai sus. găsi deviația standard ca rădăcina pătrată din care :.

Coeficientul de variație pătratică

Coeficientul de variație pătratică - este cea mai populară variație a unei măsuri relative:

Valoarea criterială a coeficientului pătratic de variație V este 0.333 sau 33,3%, adică, în cazul în care V este mai mic sau egal cu 0,333 - variația consideră slabi, și dacă mai mult de 0333 - puternic. În cazul unor variații puternice ale populației statistice studiate este considerată a fi non-uniform. iar valoarea medie - atipică și nu poate fi folosit ca un indicator general al acestei populații.

În exemplul despre elev, în care deviația medie calculată mai sus. găsi coeficientul pătratic de variație V = 0707/4 = 0,177, care este mai mică decât valoarea criterială a 0,333, atunci variația este slabă și este egală cu 17,7%.
prelegerea anterioară. Următoarea curs.

  • Valorile medii și variații ale indicatorilor
  • Valorile medii și variații ale indicatorilor
  • Valorile medii și variații ale indicatorilor