t7o18on
Cuvinte cheie:
- cercetarea selectiva
- sondajul
- selectia simpla repetata (urna cu bila revenita).
- selectia simpla nerepetata (urna cu bila nerevenita),
- reprezentativitatea esantionului
- eroare de reprezentativitate
- eroare medie de reprezentativitate
- eroarea limita admisa
In societatea contemporana, cea mai mare parte a informatiilor despre mediul
de afaceri este obtinuta nu prin inregistrari exhaustive, ci prin investigatii
partiale, cunoscute sub numele de anchete statistice. Ele sunt preferate ca urmare a faptului ca ofera
informatii suficient de corecte intr-un timp relativ scurt, astfel incat
managerul unei
intreprinderi sau omul de afaceri poate valorifica in timp real o
oportunitate sau poate evita, elimina sau macar reduce o parte din riscurile implicarii in circuitul
economic.
In prezentul capitol sunt prezentate fundamentele sondajului statistic ca
instrument metodologic de realizare a anchetelor in randul intreprinderilor,
al menajelor, al consumatorilor, al privitorilor la emisiunile TV, al ascultatorilor de radio
etc.
Parcurgand acest capitol, economistul are posibilitatea de a intelege
avantajele si inconvenientele sondajului statistic, etapele acestei forme de cercetare a realitatii
economice, principalele procedee de esantionare, precum si modul de calcul al
indicatorilor specifici celor mai frecvent utilizate tipuri de selectie. Sunt
aratate, de asemenea, modalitatile de extindere a rezultatelor sondajului asupra intregii
colectivitati supuse cercetarii, precum si caile de determinare a volumului necesar al es antionului
intr un sondaj statistic.
Nu intotdeauna este posibil sau rentabil (cost, durata) sa facem o cercetare
exsuasiva. In aceste conditii folosim cercetarea selectiva.
Cercetarea selectiva presupune culegerea s i prelucrarea datelor referitoare la
o parte a colectivitatii generale, iar rezultatele obtinute se extind asupra intregului
obiect al cunoasterii pentru a obtine o caracterizare satisfacatoare. Este necesar ca partea
observata
(esantion, mostra, proba, selectie) sa fie reprezentativa adica sa reproduca la
scara redusa trasaturile esentiale ale colectivitatii intregi.
Sondajul este o forma a cercetarii statistice realizata pe baza unei parti reprezentative din populatia (colectivitatea generala) studiata. El presupune
urmatoarele etape consecutive:
1) extragerea unui esantion reprezentativ din colectivitatea generala (esantionarea)
si culegerea de date despre despre elementele extrase (obserarea esantionului);
2) descrierea statistica a esantionului prin indicatori specifici fiecarei caracteristici
inregistrate in cadrul programului de observare (obtinerea estimatorilor);
3) extinderea rezultatelor obtinute la nivel de esantion asupra colectivitatii
generale
(estimarea parametrilor colectivitatii generale = inferenta statistica).
Statistica teoretica si economica
Dupa scopul urmarit, sondajul statistic poate fi:
• sondaj descriptiv intreprins in vederea estimarii parametrilor
ce caracterizeaza o populatie;
• sondaj analitic realizat pentru verificarea (testarea) unor ipoteze
statistice.
Realizarea sondajului are rost numai daca volumul esantionului (n) este mult
mai mic decat volumul colectivitatii generale (N) din care a fost extras.
Esantionul (mostra, proba, colectivitatea de selectie) este o submultime a populatiei statistice, astfel extrasa (obtinuta) incat sa reprezinte
principalele trasaturi ale colectivitatii generale.
Colectivitatea generala (populatia) este alcatuita din totalitatea unitatilor
(a elementelor simple sau complexe) a caror multime formeaza fenomenul/procesul
supus analizei. Deoarece din intreaga populatie se extrage un numar de elemente,
ea se mai numeste si baza de sondaj.
Atat colectivitatea generala, cat s i esantionul se caracterizeaza
prin indicatori statistici. Daca cercetarea este exhaustiva, indicatorii se mai numesc s i parametrii
colectivitatii generale. In cadrul sondajului statistic, parametrii se
estimeaza cu ajutorul indicatorilor specifici esantionului, numiti din acest motiv si estimatori.
In Tabelul nr. 5.1 se prezinta sistemul uzual de notatii pentru parametrii colectivitatii generale
si estimatorii lor in cadrul unui esantion.
Avantaje cercetarii selective:
• mai ieftina, mai operativa, mai exacta pentru ca se face pe un numar
redus de elemente;
• poate fi mai bogata, completa fata de cercetarea totala;
• rezultatele cercetarii selective pot fi verificate daca este necesar
prin alta cercetare selectiva sau printr-o cercetare totala (invers nu);
• se foloseste cand se presupune distrugerea elementelor in
cazul cercetarii.
Not iuni fundamentale flosite in cercetarea selectiva
Sunt de fapt notiuni perechi care vizeaza colectivitatea generala pe de o parte
si esantionul pe de alta parte. colectivitate esantion generala
N (volumul) n (volumul) x (media) x (media)
0 s2 (dispersia)
2 s (dispersia)
0
w = m/n p2 = M/N (pt. car.
2 w alternativ)
) 1 ( s
w s
2 p
) 1 ( p In general nu se cunosc aspecte legate de colectivitatea generala. Cercetartea
selectiva este folosita pentru a estima pe baza esantionului parametrii colectivitatii
generale.
Statistica teoretica si economica
5.1.Procedee de select ie
Se recomanda alegerea procedeului de selectie in functie de marimea (N)
a colectivitatii generale si in functie de omogenitatea sau eterogenitatea
acesteia.
Daca colectivitatea generala este omogena putem folosi:
• procedeul loteriei
• procedeul tabelului cu numere intamplatoare sau un program
pe calculator de generare de numere intamplatoare;
• procedeul mecanic sau al pasului de numarare.
Daca colectivitatea generala este eterogena se recomanda folosirea selecttiei
dirijate pentru a asigura reprezentativitatea es antionului (procedeul selectiei
stratificate, selectie tipica).
Daca colectivitatea generala este alcatuita din unitati complexe numite si serii
(de ex. populatia alcatuita pe familii, locurile de marfuri grupate pe paleti etc.)
se recomanda procedeul selectiei de serie.
Procedeul loteriei.
Se aplica in cazul colectivitatii generale de volum mic, relativ omogena.
Aplicablitatea consta in numerotarea de la 1 la N a tuturor elementelor
din colectivitatea generala (ceea ce uneori este incomod) confectionand jetoane sau bile
absolut de aceleasi dimensiuni, care se introduc intr-o urna si se amesteca inainte
de fiecare extragere.
Extragerea poate fi efectuata in doua variante: selectia simpla repetata (urna cu bila revenita).
In acest caz, la fiecare extragere exista o aplicabilitate de 1/N de a
intra in alcatuirea es antionului. Folosind aceasta varianta se pot forma foarte multe
esantioane diferite avand acelasi volum, dar posibilitatea includerii a unui acelasi
element face ca reprezentativitatea includerii a unui acelasi element face ca reprezentativitatea
esantionului sa fie redusa. selectia simpla nerepetata (urna cu bila nerevenita), prin care probabilitatea
includerii in esantion creste, treptat pe masura extragerii elementelor.
La extragerea I, probalilitatea extrageriiv este 1/N; la extragerea a II-a probalilitatea extragerii
este de
1/(N-1) si asa mai departe; la ultima extragere, probalilitatea va fi: 1/aN
-; (n+1)i.
Aceste es antioane se bucura de o mai mare reprezentativitate, iar numarul lor
este
N (mult mai mic decat la selectia repetata Nn).
Cn
Pentru a evita constituirea urnelor cu bile se poate folosi fie tabele cu numere
intamplatoare, fie un program de calculator care sa genereze numere
intamplatoare.
Procedeul mecanic sau al pasului de numarare.
Acest procedeu este foarte operativ dar nu asigura o selectie strict aleatoare,
doar primul element din esantion se extrage la intamplare, restul intrand
in componenta esantionului ca urmare a pozitiei ocupate.
Stiind ca exista N elemente in colectivitatea generala s i ca esenationul
trebuie sa fie de n elemente, se calculeaza k; k = N/n, adica pasul de numarare.
Din primele k elemente se extrage, la intamplare, unul, acesta devenind
primul element al esantionului. Numarul de ordine al celorlate elemente se afla adunand
succesiv k.
Daca elementele colectivitatii generale sunt eterogene, constatandu-se
o anumita stratificare a colectivitatii generale se recomanda sa fie folosita o selectie
dirijata
Statistica teoretica si economica
(nealeatoare) pentru a asigura patrunderea in esantion a unor elemente
din toate straturile tipice. O asemenea selectie dirijata este selectia stratificata sau selectia
tipica: dupa stabilirea volumului n al esantionului se stabileste componenta pe straturi
(numar de elemente din fiecare strat), astfel incat structura esantionului
sa corespunda structurii colectivitatii generale. Pentru extragerea separata din fiecare strat a numarului
corespunzator de elemente, se utilizeaza unul din procedeele aleatoare de mai
sus.
Selectia de serii (sau de unitati complexe) reprezinta un alt procedeu de selectie.
Pentru colectivitatea organizata pe unitati complexe (populatia organizata pe
familii) se recomanda sa nu distrugem aceste structuri pentru a extrage unitati simple,
ci sa preferam extragerea de unitati complexe sau extragerea de serii.
5.2.Reprezentativitatea es antionului.
Reprezentativitatea esantionului inseamna capacitatea acestuia de a reda trasaturile esentiale ale colectivitatii generale din care s-a extras chiar
daca volumul esenationului este mult mai mic decat volumul colectivitatii din cade
s-a extras.
Dintre metodele de exprimare a reprezentativitatii esantionului cele mai frecvente
se refera la compararea structurii esantionului cu structura colectivitatii
generale sau la compararea mediei esantionului x cu media colectivitatii generale x 0, la una
sau mai multe caracteristici cunoscute, inregistrarea atat pe esantion cat
si la colectivitatea generala. De exemplu compararea mediei de varsta a esantionului cu media
de varsta a
intregii tari.
Se intampla, in unele cazuri, sa nu se cunoasca nimic despre
colectivitatea generala. In acest caz cand nu este posibila compararea cu parametrii
colectivitatii generale, se recomanda extragerea a cel putin doua esantioane diferite din aceeasi
colectivitate generala si compararea mediilor sau structurilor acestor esantioane.
Daca ele nu difera semnificativ, atunci oricare dintre esantioane poate fi folosit pentru
a estima parametrii colectivitatii generale.
5.3.Calculul indicatorilor de selectie si extinderea rezultatelor pentru principalele
tipuri de selectie.
Diferenta dintre media esantionului si media colectivitatii generale se numeste
eroare de reprezentativitate. In domeniul social economic se considera
ca esantionul este
• - 100 x x fata de reprezentativ cat timp aceasta diferenta este mai mica de ± 5%
0 x
0 media colectivitatii generale.
Eroarea de reprezentativitate este determinata fie de cauze sistematice (voite
sau
intamplatoare) care duc la alcatuirea unui esantion dupa criterii
subiective, fie de abateri
(erori) aleatoare.
Daca se iau in considerare toate esantioanele de un anumit volum n, obtinute
prin acelasi procedeu de extragere, se constata mediile acestor esantioane ( x i)
se distribuie normal fata de valoarea pe care o inregistreaza media colectivitatii generale
( x 0).
Esantioanele avand media identic egala cu x 0 sunt cele mai frecvente.
Se numeste eroare medie de reprezentativitate abaterea medie patratica a mediilor de esantionare fata de x 0 . Pentru a putea calcula aceasta valoare
medie de
Statistica teoretica si economica
reprezentativitate (µx pentru variabila numerica s i µw pentru
variabila alternativa) ar trebui sa avem toate mediile de esantioane posibile si frecventele lor de aparitie.
• f x ( x 2
= µ i i 0 x f i
De obicei nu se cunoaste decat un singur esantion. Se poate face insa
calcul
0), anticipat al lui µx pornind de la relatia dintre dispersia colectivitatii
generale (s2
2 si volumul esantionului. patratul erorii medii de reprezentativitate µ x
In cazul selectiei simple repetate aceasta relatie este: s n
= 2
2 x • 0 µ s
2
µ = , adica eroarea medie de reprezentativitate este direct ceea ce inseamna ca n
0 x proportionala cu dispersia colevtivitatii generale si invers proportionala cu
volumul esantionului.
Daca nu se cunoaste s2
0 se accepta ca dispersia unicului esantion cunoscut s2 ofera o marja satisfacatoare a imprastierii elementelor colectivitatii
daca esantionul este convenabil de mare. Totusi se face o corectie cu 1, adica: s
2
= n µ .
1 x
Daca se foloseste o variabila alternativa, eroarea medie de reprezentativitate
se stabileste potrivit aceloras i relatii, adica atunci cand se cunoaste
dispersia colectivitatii generale: p p ) 1 ( µ
= n
w iar, daca nu se cunoaste decat esantionul, atunci:
) 1 ( - w w
µ
= n
1
w
Aceste relatii sunt pentru selectia simpla repetata (mecanica)
Daca se practica selectia simpla nerepetata, es antioanele sunt mai reprezentative
decat la selectia repetata, se introduce un coeficient de corectie pentru
a estima eroarea medie de reprezentativitate:
- pentru selectia nerepetata, variabila numerica: s s n n
- 2 2
= N µ = N µ
0 0 x 1 x 1
- n 1 n
Statistica teoretica si economica
- pentru o caracteristica alternativa:
- n w w ) 1 (
µ
• = N
w 1 n 1
In practica economica nu intereseaza eroarea medie de reprezentativitate,
ci eroarea maxima (abaterea maxima) sau eroarea limita ce poate apare la estimare
pentru o anumita probabilitate.
Deoarece aceasta eroare este diferenta dintre x s i x 0 ne folosim de proprietatile
repatitiei normale pentru a asocia diverse marimi ale erorii cu probalilitatile
aferente.
Eroare limita se calculeaza:
• pentru variabila numerica:
• = x z µ x
• pentru variabila alternativa:
• =
w z µ
w
Exista tabele ale repartitiei normale care ne arata relatia dintre coeficientul
de multiplicare z sau t sau probabilitatea f (z) sau f (t) corespunzatoare.
Eroarea limita arata diferenta maxima in plus sau in minus care
poate surveni la o anumita probabilitate f (z), z fiind utilizat in calculul erorii limita.
Necunoscand parametrii colectivitatii generale, rezulta ca pentru o variabila
numerica ( )
± ± cu x x 0 , iar pentru o variabila alternativa avem () w p x w
± probabilitatea corespunzatoare. f (z) = functia de probabilitate cu care se genereaza rezultatele z = coeficientul functiei de probabilitate.
Eroarea limita se poate mari sau micsora fie prin modificarea volumului esantionului (n), fie prin modificarea probabilitatii cu care se garanteaza
rezultatele, deoarece dispersia colectivitatii totale ramane aceeas i.
Dupa modul in care se combina sistemul de organizare, felul unitatilor
de selectie s i procedeul de selectie folosit, in cercetarea activitatii economice
si sociale, se disting urmatoarele tipuri de selectie:
- selectie intamplatoare simpla;
- selectie mecanica;
- selectie tipica (stratificata);
- selectia de serii.
Pentru fiecare tip de selectie se calculeaza trei indicatori: eroarea de medie
de reprezentativitate, eroarea limita si volumul es antionului.
Selectia intamplatoare simpla este utilizata in special pentru
colectivitati formate dintr-un numar de unitati simple si care se caracterizeaza printr-un anumit
grad de omogenitate. Erorile de reprezentativitate sunt mari in raport cu alte
tipuri de selectie,
Statistica teoretica si economica
deoarece dispersia folosita masoara variatia totala a caracteristicii datorata
cauzelor care influenteaza.
Deoarece, in practica, se lucreaza cu o eroare limitata, calculul volumului
esantionului (n) se face flosind formula erorii limita.
- selectia intamplatoare simpla repetata: s
2
µ • = • = z
0 z x n x
• • s s s z z
2 2 2 2 2
˜ = • = n z
2 2
0 0 i n x
2 2 x x
- selectia intamplatoare simpla nerepetata:
• • z z s s s n 2 2 2 2 2
0 1 n z z µ ˜ = • = • = i 0
• z z N n s s • x x
2 2 2 2
+ + i 2 0 2
N N x x
In mod similar se procedeaza si in cazul caracteristicii alternative.
Urmatorul tabel sintetizeaza eroarea medie de reprezentativitate, eroarea limita
s i volumul esantionului pentru caracteristica numerica si pentru cea alternativa
in cazul selectiei repetate si a selectiei nerepetate:
Caracteristica nealternativa (numerica) Indicatorul selectia repetata selectia nerepetata err. medie de
2
2
2
2 s s s reprezentativitate n n
0 i i 0 s
˜ = µ µ
˜ - = 1 1 x x
1 n n
N n N n 1
• = • = err. limita z x z µ x z µ x volumul z z • • 2 2
0 2 s
2 2 2 2 s • z z s • n ˜ = s i 0
0 i esantionului n ˜ =
2 2
2 2 2 s s • • z z x x i 2 2 0 2
+ + x x
N N
Caracteristica alternativa Indicatorul selectia repetata selectia nerepetata err. medie de
•
- - n w w n p p ) 1 ( ) 1 (
2 ) - ) 1 ( 1 ( w w p p s
µ reprezentativitate ˜ - • = µ
˜ = n
1 1
w
1 - n w
- N n N n 1
• = • = err. limita w
w z µ w z µ
w volumul
2 2 2 2
) 1 ( ) 1 ( w w z p p z - • - • w w z p p z ) 1 ( ) 1 ( - •
- • esantionului
˜ = ˜ = n n
2 2 2 p p z ) 1 ( - •
w w z ) 1 ( - •
2
2 2
w w
+
+
w
w
N
N
Statistica teoretica si economica
Selectia mecanica se foloseste atunci cand se combina cu alte tipuri
de selectie.
Pentru calculul erorilor de selectie se folosesc for mulele de la seletia intamplatoare
simpla repetata. Acest tip de selectie se aplica la cercetarile de laborator
si la estimarea recoltei medii la hectar a productiei agricole inainte de recoltare.
Selectia tipica (stratificata) se aplica cel mai frecvent in studiul fenomenelor
economico-sociale care au fost, in prealabil, impartasite in
grupe omogene (straturi sau tipuri) dupa o caracteristica esentiala.
• selectia tipica simpla caracterizata prin faptul ca extragerea unitatilor
din fiecare grupa se face la intamplare fara a se tine seama de ponderea unitatilor
din fiecare grupa a colectivitatii generale.
• selectia tipica proportionala este selectia la care volumul subesantioanelor
difera
in raport cu ponderea pe care o are fiecare grupa in colectivitatea
generala si se respecta proportia de selectie.
• selectia tipica optima se caracterizeaza prin faptul ca la formara es
antionului se ia
in considerare ponderea pe care o au grupele in colectivitatea generala
si marimea variatiei din interiorul grupelor masurata prin abaterea medie patratica.
In general, se poate spune ca selectia tipica da cele mai mici erori in
activitatea practica dar este greu de aplicat.
Selectia de serii se foloses te cand colectivitatea generala este formata
din unitati complexe numite si serii (echipe, brigazi, magazine etc.). Aceste unitati sunt
formate din unitati simple care prezinta caracteristici ce le deosebesc una de alta, adica
au un caracter eterogen, in raport cu unitatile componente ale grupelor tipice care se
caracterizeaza prin omogenitate.
Caracteristic pentru acest tip de selectie este faptul ca in locul variantelor
concrete ale caracteristicilor de la sondajele bazate pe unitati simple se vor
folosi indicatori de selectie calculati la nivelul seriei. Cerinta reprezentativitatii
se va asigura prin apropierea mediilor din seriile de unitati selectate de mediile din seriile
colectivitatii generale.
Pentru extinderea rezultatelor asupra intregii colectivitati se folosesc
doua procedee:
• procedeul coeficientului de corectie se foloses te de obicei la verificarea
autenticitatii datelor culese dintr-o observare, totala.
• procedeul extinderii directe se utilizeaza la caracterizarea fenomenelor
pentru care nu dispunem de informatii prin observarea totala. In esenta acest
procedeu consta in estimarea parametrilor colectivitatii generale pe baza rezultatelor selectiei
statistice. x x + < <
- 0 x x x
Pentru a ilustra valentele cognitive ale indicatorilor prezentati mai sus, sa
acceptam ca responsabilul departamentului de resurse umane dintr-o corporatie
multinationala avand N = 4000 de angajati direct operativi a decis realizarea
unui studiu cu privire la nevoile de for mare profesionala continua ale acestei categorii
de salariati s i disponibilitatea lor de a participa la astfel de programe.
Pentru a raspunde acestei decizii, consiliul director al corporatiei aproba
organizarea unui sondaj statistic in randul salariatilor, volumul
esantionului fiind de n =
100 de persoane. Asigurarea reprezentativitatii es antionului de numai 2,5%
din totalul
Statistica teoretica si economica
n s-a facut prin luarea in considerare a
= salariatilor direct operativi • % 5 , 2 100
N varstei, precum s i a structurii socio-profesionale a intregului
personal operativ.
In cadrul programului de observare selectiva, intre alte caracteristici
urmarite, se
inregistreaza varsta salariatilor (exprimata in ani de viata
impliniti), precum si interesul
(disponibilitatea) acestora de a participa la un program de formare profesionala
continua.
In tabelul de mai jos se prezinta rezultatul gruparii in functie
de varsta a celor 100 de persoane din esantionul extras aleator s i nerepetat.
Repartitia personalului cuprins in esantion in functie de varsta
Grupe de varsta Numar personal
(ani impliniti)
17
Sub 25*)
25 -; 35 30
35 -; 45 25
45 -; 55 18 peste 55 10
Total 100
*) Limita superioara nu este cuprinsa in interval.
Prelucrarea datelor referitoare la aceasta caracteristica numerica (varsta
personalului), permite constatarea ca la nivelul esantionului, varsta medie este de:
n x
3740
=
= i i x = 37,4 ani,
100 n i iar dispersia in jurul mediei esantionului este:
() 24
2
- n x x
14924
=
. i n
= = s , 149 i
2
100 i
Observatii:
1) Esantionul este destul de omogen (v = 32,7%) pentru a putea considera ca
media de 37,4 ani caracterizeaza corect varsta tuturor celor 100 de persoane
inregistrate.
2) Daca media nu este reprezentativa la nivelul esantionului (v>>35%),
nu are sens sa se mai continue cercetarea printr-o eventuala tentativa de extindere a acestui
indicator
(deja nereprezentativ la nivel restrans) asupra colectivitatii generale.
Intre raspunsurile inregistrate de la cele 100 de persoane cuprinse
in sondaj se mai constata ca 82 sunt dornice sa participe la un program de formare continua,
in timp ce restul de 18 persoane resping oportunitatea oferita de angajator. Aceasta caracteristica
alternativa, prezinta o medie de:
82 = m
= = n
82 , 0 w
100 si o dispersie de:
() 1476 = • = - = w s , 0 18 , 0 82 , 0 1 w
2
w
Daca s-ar fi utilizat procedeul extragerii mecanice sau procedeul extragerii
repetate, atunci pentru calculul erorii medii de reprezentativitate a unui (oricarui)
esantion de volum n=100 s-ar fi aplicat relatiile a5.4i pentru caracteristica numerica
s i a5.6i pentru cea alternativa. Cum sondajul a avut in vedere extragerea nerepetata (pentru
a spori
Statistica teoretica si economica
reprezentativitatea esantionului), se aplica relatiile a5.4’i si, respectiv
a5.6’i, obtinandu se: pentru caracteristica numerica: s
100 24 , 149 2 - - n
µ ani,
21 , 1 1 1 ± = = = N
- - x
4000 1 100 1 n ceea ce inseamna ca media unui esantion de volum n = 100 obtinut prin
extragere x ) a aleatoare nerepetata se abate in medie cu 1,2 ani (+) fata de varsta
medie reala ( 0 celor 4000 de persoane angajate de corporatie; pentru caracteristica alternativa:
100 1476 , 0 ) 1 ( - - n w w
µ
038 , 0 1 1 ± = = = N
- - w
4000 1 100 1 n
Rezultatul indica o abatere medie cu +3,8% a proportiei personalului dornic
de a participa la formarea profesionala continua cuprins in esantion, fata
de proportia reala
M
= N p in randul intregului personal al corporatiei.
In practica economica nu intereseaza, de obicei, eroarea medie de reprezentativitate a esantionului, ci abaterea maxima sau eroarea limita ce
poate apare ca diferenta intre media unui esantion (estimator) si media colectivitatii
generale
(parametru) la estimarea acestuia cu o anumita probabilitate.
Deoarece eroarea limita este diferenta dintre x si x 0, ne folosim de proprietatile
repatitiei normale pentru a asocia diverse marimi ale erorii cu probalilitatile
aferente x . masurate ca (sub) multipli ai abaterii standard a mediilor de esantionare fata
de 0
Eroarea limita se calculeaza astfel:
• pentru variabila numerica:
• = a5.7i x z µ x
• pentru variabila alternativa:
• = a5.8i
w z µ
w
Exista tabele ale repartitiei normale care exprima relatia dintre argumentul
z sau t s i functia de probabilitatea f(z) sau f(t) corespunzatoare.
In exemplul considerat, eroarea limita pentru o probabilitate F (z) =
0,95 (z = 1,96) este: pentru caracteristica numerica, de aproximativ 2,4 ani:
37 , 2 21 , 1 96 , 1 = • = • = ani 2,4 ani, x x z µ
Statistica teoretica si economica
Semnificatia rezultatului: distanta maxima ce poate exista intre media
esantionului x ) este de +2,4 ani, aceasta afirmatie fiind valabila cu o probabilitate de
0,95 (se
( 0 accepta un prag de eroare a=0,05); pentru caracteristica alternativa:
07448 , 0 038 , 0 96 , 1 = • = • = sau 7,4%.
w
w z µ
Interpretarea este asemanatoare celei prezentate la x. Diferenta maxima intre
w si p
(proportia celor inclinati sa faca un program de formare contiuna in
cadrul esantionului -;
w si, respectiv in colectivitatea generala - p) este, cu aceeas i probabilitate
F(z) = 0,95 de
7,4%.
Observatii:
1. Un tabel cu valorile functiei Gauss -; Laplace corespunzand diferitelor
valori ale lui z se gaseste in volumul Bazele statisticii pentru economisti. Aplicatii.
Bucuresti, Editura
Tribuna Economica, 2002, p. 259-260.
2. Daca s-ar fi folosit extragerea mecanica, sau extragerea repetata, eroarea
limita era ceva mai mare: x = 2,41 ani (fata de 2,37 ani); w = 7,6% (fata de 7,4%).
Coeficientul de corectie aplicat in cazul sondajului nerepetat este intotdeauna
o marime subunitara care restrange marimea erorii medii de reprezentativitate
si, respectiv, a erorii limita, oferind o estimare mai exacta a parametrilor colectivitatii
generale.
3. Nu este obligatoriu ca probabilitatea cu care se estimeaza divers i parametrii
ai colectivitatii generale sa fie aceeasi la toate variabilele cerectate.
Statistica teoretica si economica
Probleme si aplicatii.
5.1. Un echipament de ambalare este astfel reglat incat sa impacheteze
cate 20 de bomboane cu o toleranta de ± 1 bucata.
Pentru a aprecia calitatea reglajului, din productia unei zile s-a prelevat
prin extragere mecanica un esantion de 150 pachete care cont ineau in total
3015 bomboane in loc de 3000 bomboane. Din cercetarea es antionului rezulta
ca in jurul mediei de 20,1 bomboane/pachet, intensitatea imprastierii era de 7,2%,
in condit iile
in care 129 pachete contineau exact 20 bomboane, 12 pachete aveau 21 sau
mai multe bomboane, iar 9 pachete erau cu 19 sau mai putine bomboane.
Se cere:
Sa se estimeze cu o probabilitate F(z) = 0,9973 (z = 3) numarul total de bomboane ambalate in lotul de N = 3000 pachete realizate in cursul
zilei si sa se observe daca echipamentul se incadreaza in toleranta admisa.
Rezolvare:
Din enuntul problemei rezulta ca esantionul se caracterizeaza prin:
• Volumul n = 150 pachete;
• Media x = 20,1 bomboane/pachet; s 1,4472 bomboane/pachet (din relatia coeficientului de
• Abaterea standard = variatie % 2 , 7 100 = • = x v s )
Pe baza acestor date, se poate estima eroarea medie de reprezentativitate, stiind
ca in cazul extragerii mecanice se aplica relatia de la sondajul simplu,
aleator, repetat:
2 =
0944 , 2
= = s µ bucati 118 , 0 n 150 x
Un es antion de 150 produse prelevate mecanic din productia zilei, prezinta,
in x ) ce caracterizeaza medie, o abatere cu 0,118 bomboane/pachet fata de numarul mediu ( 0
intrega productie.
Eroarea limita pentru F(z) = 0,9973:
• = • = µ bucati 35 , 0 118 , 0 3 = z x x
Numarul mediu de bomboane/pachet in productia zilei se situeaza, cu probabilitatea de 0,9973 in intervalul:
± ±
) 35 , 0 1 , 20 ( , ), ( x adica x x x
0 0
= x , ceea ce, aplicat intregii productii a zilei conduce
Prin urmare: 45 , 20 75 ,
19 0 =
(prin multiplicarea cu N = 3000) la un numar total (T) de bomboane ambalate
de:
= T , cu F(z) = 0,9973, in conditiile in care reglajul trebuia sa
61350 59250 =
incadreze acest numar intre (20-1)•3000 = 57.000 bucati si
(20+1)•3000 = 63.000 bucati.
Statistica teoretica si economica
Intrucat intervalul de estimare (59.250, 61.350) este mult mai
mic decat toleranta admisa (57.000, 63.000), rezulta ca reglajul este corespunzator.
Raspuns: Numarul total de bomboane ambalate este situat, cu F(z) = 0,9973 intre
59.250 si 61.350 bucati. Echipamentul se incadreaza in tolerenta
admisa.
Cat de mare ar trebui sa fie un esantion, daca numarul mediu de bomboane/pachet
ar trebui estimat cu F(z) = 0,9545 (z = 2) in limitele unui interval de
± 0,5 bucati?
Rezolvare: z 0944 , 2 4 • •
2 2 pachete n 34 5104 , 33 = = = s .
5 , 0
2 2 x
Raspuns: Pentru a raspunde unei astfel de exigente, ar fi suficient sa se preleve
prin extragere mecanica doar 34 pachete, ceea ce la o productie totala de 3000
pachete
N .
inseamna un pas de numarare 88 ˜ n
Sa se observe in esantionul de 150 pachete, cota de produse care nu indeplinesc
cerinta de 20 bomboane/pachet si sa se estimeze cu F(z) = 0,90 (z = 1,65) cota
minima s i maxima, precum si numarul minim s i maxim de pachete necorespunzatoare din punct
de vedere al continutului in productia unei zile.
Rezolvare:
Din 150 pachete prelevate, 12+9 = 21 pachete contin fie mai multe, fie mai putine
produse decat numarul standard de 20 bomboane/pachet. s ) caracteristicii alternative
In cadrul es antionului, media (w) si dispersia ( 2
w sunt:
21 = m
= = n
14 , 0 w , ceea ce inseamna ca 14% din esantion nu corespunde
150 standardului de ambalare.
1204 , 0 86 , 0 14 , 0 ) 1 ( = • = - = w w s
2
w
Eroarea medie de reprezentativitate a unui esantion de volum 150 obtinut prin
prelevare mecanica este de:
1204 , 0
2
% 83 , 2 0283 , 0 sau = = = s µ
150
w nw
Un es antion de volum 150 prelevat mecanic se caracterizeaza, in medie,
printr-o cota de produse necorespunzatoare cu 2,83% mai mare sau mai mica decat
cota parte specifica intregii productii a unei zile.
Eroarea limita pentru o probabilitate de 0,90 este de:
Statistica teoretica si economica
% 7 , 4 0467 , 0 0283 , 0 65 , 1 sau = • = • = µ . z w
w
La probabilitatea mentionata, abaterea maxima a unui esantion de volum 150 prelevat mecanic fata de cota reala de produse necorespunzatoare din productia
unei zile este 4,7%.
In aceste conditii, la F(z) = 0,90, cota minima si maxima de defecte in
productia zilei este cuprinsa in intervalul:
± ±
) 047 , 0 14 , 0 ( : ), ( p adica w sau: p w
= p , cu F(z) = 0,90.
187 , 0 093 , 0 =
Numarul minim si maxim de pachete necorespunzatoare (M) in productia unei
zile se obtine inmultind cu N = 3000 limitele intervalului in care se
incadreaza cota de defecte:
= M pachete, cu F(z) = 0,90.
561 279 =
Cel putin 279 pachete si cel mult 561 pachete din lotul fabricat de 3000, cuprinde
mai mult sau mai putin de 20 bomboane/pachet, cu o probabilitate de 0,90 (sau
cu o marja de eroare acceptata de 1-0,90 = 0,10 sau 10%).
Avand in vedere ca un client nu va reclama decat in
situatia in care obtine mai putine bomboane decat numarul de 20 (care apare inscris pe pachet),
se cere refacerea calculelor, considerand ca m = 9 pachete din 150 verificate.
= = = = µ
Raspuns: w = 0,06; w(1-w) = 0,0564; 09 , 0 03 , 0 ; 03 , 0 ; 02 , 0 p ;
w w
F z , 0 ) ( = cu .
= M pachete, 9
270 90 =
5.2. Dintr-o comanda de 1000 piese, se preleva un esantion de 65 piese prin
extragere aleatoare, simpla, nerepetata. Potrivit comenzii, fiecare piesa ar trebui sa
cantareasca
85 grame. Dupa examinarea esantionului, se constata ca greutatea medie a pieselor
este de 87,2g, dispersia esantionului fiind de 70,6746, abaterea standard de
8,4g, coeficientul de variatie 9,6%. Intre piesele esantionului se afla 26 piese
cu greutatea mai mare decat cea prevazuta de comanda.
Se cere:
Estimarea cu F(z) = 0,9545 (z = 2) limitele intervalului in care se inscrie
greutatea medie a celor 1000 piese din lot.
Rezolvare:
Eroarea medie de reprezentativitate in cazul sondajului aleator, simplu,
nerepetat, se estimeaza astfel: n 65 6746 , 70 - 2
µ g 0083 , 1 1 1 = = = s x
N n 1000 65
Statistica teoretica si economica
Eroarea limita:
• = • = µ g 02 , 2 0083 , 1 2 ˜ , pentru F(z) = 0,9545 z x x
Intervalul in care se inscrie greutatea medie a tuturor pieselor
cu probabilitatea mentionata este: g x x 22 , 89 18 , 85 ) 02 , 2 2 , 87 ( = = ±
0 0
Estimarea cu F(z) = 0,90 (z = 1,65) a cotei maxime de produse cu greutatea depasita.
Rezolvare: s
- n
2
µ , unde 24 , 0 6 , 0 4 , 0 ) 1 ( = • = - = w w s
= N
2
w 1
w nw
= µ sau 5,9%
059 , 0
w
= • = • = µ
% 7 , 9 097 , 0 059 , 0 65 , 1 sau z w
w
Cota maxima este, de fapt, limita superioara a intervalului in care se
inscrie p, respectiv w + w = 0,4 + 0,097 = 0,497, ceea ce, in marime absoluta, inseamna
497 piese.
Cat de mare ar trebui sa fie esantionul extras prin acelas i procedeu
pentru o noua cercetare, daca ar trebui sa se estimeze cota minima si maxima cu probabilitatea
F(z) =
0,9545 (z = 2) in limitele unui interval de ±5%, respective ±0,05.
Raspuns: s
• • z 24 , 0 4
2 2
= = = s piese n 975 62 , 974
w
• z 00096 , 0 05 , 0 +
2 2
2
+
2
w
N
w
Cu acest rezultat, locul cercetarii selective este luat de examinarea integrala
a lotului comandat.
5.2.In randul personalului operativ al unui centru de librarii se
efectueaza un sondaj stratificat cu extragere nerepetata. Intre caracteristicile observate
pe cele n = 80 de persoane din esantion, se numara vanzarile medii saptamanale
(milioane lei) si felul raionului de marfuri. Rezultatele inregistrarii es antionului
se prezinta astfel:
Statistica teoretica si economica
Felul raionului de marfuri Total
Anticariat Jucarii Librarie Papetarie
Vanzari medii (mil lei)
Pana la 3 3 --- --- 2 5
3 -; 5 5 3 12 8 28
5 -; 7 2 5 12 10 29
7 s i peste --- 12 6 --- 18
Total 10 20 30 20 80
Se cere:
Sa se caracterizeze acest es antion.
Rezolvare:
=
Vanzarea medie saptamanala realizata de cele 80 persoane este 5
, 5 x mil lei.
Amplitudinea variatiei este de 6 mil lei, adica 109,09% fata de medie. Acest
indicator permite aprecierea ca cele 80 de elemente ale esantionului prezinta o imprastiere
relativ mare (peste 100%). s .
2 =
Dispersia esantionului: 05 , 3
Abaterea standard: s = 1,7464 mil lei.
Coeficientul de variatie: v = 31,75%.
In pofida intinderii relativ mari a imprastierii, colectivitatea
este destul de omogena (intensitatea imprastierii este sub 35%).
Analiza variatiei vanzarilor medii saptamanale in cadrul celor
4 grupe constituite dupa felul marfurilor comercializate si elementele de calcul pentru verificarea
regulii de adunare a dispersiilor sunt prezentate in tabelul 53.2. Pe baza acestei
identitati se stabileste in ce masura influenteaza felul marfurilor variatiei volumului
vanzarilor saptamanale. s s x x x • ) •
2
Raionul j nj j x 2 x j - j
- 2 ( j j n j n j
Anticariat 1 10 3,8 1,96 -1,7 28,9 19,6
Jucarii 2 20 6,9 2,19 +1,4 39,2 43,8
Librarie 3 30 5,6 2,24 +0,1 0,3 67,2
Papetarie 4 20 4,8 1,76 -0,7 9,8 35,2
Total --- 80 --- --- --- 78,2 165,8
2 s d s + = , in care:
2
Regula de adunare a dispersiilor: 2 s .
2 =
Dispersia generala a esantionului este deja calculata: 05 , 3
Dispersia indusa (explicata) de felul marfurilor vandute:
) • - S n x x
2 , 78
( 2 j n
= = = d
9775 , 0 . j
2
S
80 j s
• S n
8 , 165
2 s
Dispersia reziduala: 0725 , 2 = = = j
2
S
80 n j
Statistica teoretica si economica
Regula se verifica: 3,05 = 0,9775 + 2,0725, iar pe baza ei se calculeaza coeficientul de determinatie: d
9775 , 0
2
% 32 100 100 = • = • = s D
05 , 3
2
Varietatea marfurilor comercializate in diferitele raioane ale centrului
de librarii explica in proportie de 32% variatia vanzarilor medii saptamanale
realizate de cele 80 de persoane din esantion.
Sa se estimeze cu F(z) = 0,9545 (z = 2) volumul mediu saptamanal al vanzarilor
realizate de intregul personal operativ al centrului de librarii (N =
760 persoane).
Rezolvare:
Eroarea medie de reprezentativitate in cazul sondajului stratificat cu
extragere nerepetata se determina astfel: n 80 0725 , 2 - 2
µ lei mil 15 , 0 1 1 = = = s
N n 760 80 x
Eroarea limita:
• = • = µ lei mil . 3 , 0 15 , 0 2 = z x x
Prin urmare, ) 3 , 0 5 , 5 ( x cu o probabilitate de 95,45%.
0 ±
Limitele intervalului in care se incadreaza vanzarea medie
saptamanala a celor
760 angajati direct in procesul vanzarii sunt: 5,2 mil lei si, respectiv,
5,8 mil lei.
Pe acest temei, managementul acestei firme poate conta saptamanal,
cu F(z) =
0,9545, pe incasari situate intre 3952 s i 4408 milioane lei.
Cat de mare ar trebui sa fie esantionul intr-o noua cercetare selectiva
bazata pe extractia stratificata nerepetata a elementelor componente, daca estimarea ar
trebui facuta cu aceeasi probabilitate F(z) = 0,9545 (z = 2), dar in limitele unui interval
de estimare de
± 0,5 milioane lei?
Raspuns: s z •
0725 , 2 4 •
2 2 persoane n 32 74 , 31 = = = s
28 , 8 z •
2 2
+
5 , 0
2
+
2
760
N
Cu ce probabilitate s-ar putea face estimarea limitelor intervalului in
care se
incadreaza vanzarea medie saptamanala, daca = x ± 0,5 mil lei, dar se pastreaza marimea initiala a es antionului: n = 80 persoane?
Raspuns: Prin inlocuire in relatia de mai sus, se obtine ca z =
3,28, ceea ce corespunde lui F(z) = 0,999481 in orice tabel al distributiei normale.
Statistica teoretica si economica
Revenind la un volum necesar al esantionului de 32 persoane, cum se face stratificarea?
Rezolvare:
Stratificarea se realizeaza pentru a asigura patrunderea in es antion
a unor elemente din toate tipurile existente in colectivitatea generala. Exista
mai multe tipuri de stratificare a es antionului:
(1) Un procedeu elementar consta in stratificarea simpla, respectiv impartirea
volumului stabilit al esantionului (n = 32) la numarul grupelor existente in
colectivitatea generala (r = 4 tipuri de marfuri comercializate).
Prin urmare, cate 32:4 = 8 elemente se vor preleva din fiecare strat,
prin extragere nerepetata.
N specifica multimii
(2) Stratificarea proportionala tine seama de structura j
N
S j ce alcatuieste colectivitatea generala. In cadrul firmei, personalul operativ
(760 persoane) prezinta urmatoarea structura: anticariat 9,5% (72 persoane), jucarii 30% (228
persoane), librarie 32,5% (247 persoane), iar in raioanele de papetarie circa 28%
(213 persoane).
Pentru a transfera aceasta structura asupra es antionului, se foloseste relatia:
N n n S • = j j N j
Astfel, cele 32 elemente din esantion se repartizeaza dupa cum urmeaza: 3 persoane se preleva (prin extragere nerepetata) dintre (cei 72 de) anticari;
10 persoane dintre cele ce comercializeaza jucarii; 10 persoane dintre librari si 9 persoane
dintre vanzatoarele de la raioanele de papetarie:
3 + 10 + 10 + 9 = 32 persoane.
Evident, unele rotunjiri s-au impus fiind vorba de unitati indivizibile (persoane)
ale colectivitatii generale.
(3) Stratificarea optima a esantionului presupune luarea in considerare
nu numai a structurii colectivitatii generale pe tipuri de activitati ( r j cu 1 = ), dar
si a dispersiei
N j , s ) din colectivitate. specifice fiecarei strat ( 2 j
Astfel, relatia care se foloseste la structurarea esantionului devine: s
•
N
2
• = n n s j j j N
• S
2 j j s . Cu
Mai sus s-au aratat valorile Nj, iar in tabelul 53.2, coloana a cincea,
se afla 2 j aceste date, pentru aflarea numarului de persoane care urmeaza sa intre in
alcatuirea esantionului din randul celor care se ocupa de anticariat este:
96 , 1 72 •
= • =
. 3 88 , 2 32 persoane n
6 , 1568
1
Statistica teoretica si economica
Pentru celelalte trei grupe rezulta, in ordine: 10 persoane; 11 persoane;
8 persoane.
3 + 10 + 11 + 8 = 32 persoane.
Observatie: Prelucrarea datelor referitoare la eventualele caracteristici alternative
se face
in mod asemanator.
5.4. O societate comerciala prezinta urmatoarea repartit ie a personalului sau
pe grupe de varsta:
(date conventionale)
Grupe de varsta (ani) Numar de persoane
Sub 20 10
20-30 30
30-40 40
40-50 15 peste 50 5
Total 100
Se cere:
1. sa se reprezinte grafic repartitia;
2. se considera ca cele 100 de persoane constituie un es antion extras aleator,
simplu, nerepetat dintr-o colectivitate generala de 1000 persoane; sa se determine intervalele
de varsta intre care se situeaza varsta medie a celor 1000 persoane
considerandu-se
= F z
. 2 ; 9545 , 0 ) ( = z
5.5. Timpul pentru inotatoarele cu varsta cuprinsa intre 9
si 10 ani pe distant a de 50 metrii, stilul fluture, este aproximativ normal distribuita cu media 49,4 secunde
si abaterea standard de 2,8 secunde.
1. sa se gaseasca probabilitatea in cazul unui esantion aleator simplu
de 25 de inotatoare care sa aibe media mai mare de 50,15 secunde.
5.6. Sa se obtina un esantion aleator de marime 25 cu media 4 , 83 = x si abaterea
s , dintr-o populat ie cu o distributie normala daca media medie patratica 12 = colectivitatii generale este . 83 x
0 =
5.7. In tabelul urmator sunt prezentat i numarul de enoriasi ai unei biserici
ortodoxe pe grupe de varsta:
Varsta (ani) Numar de enorias i
Sub 20 274
21-50 526 peste 50 345
Se cere:
1. daca se efectueaza o selectie stratificata de volum n=100, sa se determine
numarul de enoriasi care trebuie sa faca parte din fiecare strat;
2. aceeasi cerinta in cazul in care se cunosc abaterile standard
ale celor trei straturi:
= = s s s
. 3 , 2 ; 8 , 4 ; 2 ,
1 3
1 =
2
Statistica teoretica si economica
5.8. Care este valoarea erorii standard a mediei unui es antion de volum n=100,
selectat simplu, aleator repetat, daca dispersia este egala cu 25?
5.9. In tabelul urmator sunt prezentate datele referitoare la localitatea
de rezidenta a studentilor unei facultati economice:
Localizarea geografica Numar de studenti
Nord -; est 347
Sud -; est 624
Sud -; vest 196
Nord -; vest 93
Se cere:
1. daca se utilizeaza selectia stratificata de volum n=200, care va fi marimea
fiecarui strat?
5.10. Un esantion de 500 de familii chestionate in legatura cu nivelul
mediu al cheltuielilor destinate produselor alimentare se prezinta astfel:
Cheltuieli pentru alimente (mii lei) Numar de persoane
Sub 500 80
500-800 120
600-900 150
900-120 0 100 peste 1200 50
Total 500
1. sa se determine coeficientul de asimetrie al repartitiei;
2. daca cele 500 de familii sunt considerate ca fiind o colectivitate generala
din care se extrege un esantion aleator s i nerepetat cu 3 , 1 ; 8064 , 0 ) ( = = z z f
, sa se deteremine marimea esantionului.