Rinkiminės apklausos ir ne tik (I)

Šią savaitę (09.24) Eglė Samoškaitė nusprendė Delfyje panagrinėti, kodėl įvairios rinkimams rengiamos apklausos pateikia vis skirtingus rezultatus. Vienur šoka “darbiečiai”, kitur “konservai”.

Panašu, kad straipsnis turi du matomesnius tikslus: a) paaiškinti apie apklausų rezultatų nesutapimų priežastis ir b) sukelti abejones konkrečių apklausų rezultatais. Ale kiekvienam savo.

Aš gilinsiuosi į apklausų rezultatų nesutapimo priežastis, t.y. a).

Nepaisant galimų niuansų susijusių su tikslu b), straipsnis labai reikalingas, nes skaitantiems įvairius pranešimus dažnai yra nesuvokiami apklausų “niuansai”. Šviesti visuomenę yra ypatingai svarbu! 

Straipsnis http://www.delfi.lt/news/balsuok2012/naujienos/kodel-priesrinkimines-apklausos-pergale-rinkimuose-zada-skirtingoms-partijoms.d?id=59571253

Daug informacijos, nuomonių, tačiau yra praleista ir nutylėta subtilių niuansų, faktorių, kurie sunkiai matomi nedirbantiems su apklausomis. Čia noriu savo žodžiais paneigti/patvirtinti/papildyti straipsnyje minimus faktus. Taigi paeiliui – pradėsiu nuo netikslumų:

Neseniai apklausos duomenis apie rinkėjų preferencijas paskelbė socialinių tyrimų įmonė „Visum verum“

UAB “Visum Verum” yra užsakovas, o minėtą tyrimą atliko “Prime consulting Ltd”. Taip skelbiama Centro partijos puslapyje http://centropartija.lt/aktualijos/280-74. Kodėl straipsnyje kaip užsakovas paminėtas alkas.lt? Man yra paslaptis. Daugiau žiną, viliuosi, pakomentuos. Priskirčiau tai tikslui b).

Na, o dabar apie apklausas bendrai, t.y. a).

Gerb. V.Gaidys pateikia šešias pagrindines priežastis, kodėl gali skirtis apklausų rezultatai. Taigi:

Pirmoji ta, kad iš Lietuvoje tiesioginio interviu metodu apklausiamų 1000 gyventojų, apsisprendę už ką balsuos, būna tik apie 600 žmonių – tikslumo apklausai tai neprideda.  V. Gaidys teigia, kad iš tiesų reiktų apklausti 1000 apsisprendusių balsuoti rinkėjų, bet tai būtų labai brangu – šiuo metu partinės apklausos sujungiamos su kitų užsakovų klausimais Omnibuso apklausoje. „Rinkiminėse apklausose reikėtų apklausti daugiau žmonių nei paprastai vien dėl tos priežasties, kad būtų pririnkta balsuojančiųjų. Šiaip tie klausimai įdedami į Omnibuso apklausą, o jeigu dar reikėtų 500 žmonių specialiai apklausti, tai dešimtys tūkstančių litų susidarytų “, – teigė sociologas.

Šie teiginiai atrodo logiški ir teisingi – jie yra ne melas. Atrodo natūralu, kad apklausus daugiau respondentų, rezultatas bus tikslesnis. Juk 1000 yra vos ne dvigubai daugiau nei 6000. Bet ar tikslumas yra ypatingai reikalingas ir jis išgelbėja nuo dviprasmiškų situacijų? Pateiksiu pavyzdį.

Tuo pačiu metu dvi sociologinių ar kitokių tyrimų įmonės A ir B, naudodami tas pačias idealiai vienodas sąlygas, atliko savo apklausas. Idealiai analogiškų sąlygų nebūna, bet pavyzdžio vardan, darykite prielaidą kad taip buvo. Apklausose respondentų, jau apsisprendusių dalyvauti rinkimuose, buvo klausiama – “Už kurią iš šių partijų balsuosite ateinančiuose rinkimuose?”. Įmonė A apklausė 1000 respondentų ir nustatė, kad pirmauja partija X su 19 proc. rinkėjų balsų, antra yra partija Y su 17% balsų. Įmonė B apklausė 600 respondentų ir nustatė, kad partija X galimai surinktų 18 proc. ir būtų antra, nes partija Y pasirodo “turi” 20 procentą balsų.

Taigi kuri partija iš tikro pirmauja? Partija X ar partija Y?

Remiantis argumentu, kad didesnė apklausa suteikia tikslesnį rezultatą -, būtų galima teigti, kad apklausa A yra geresnė, tikslesnė. Juk ji kainavo dešimtis tūkstančių daugiau, apklausta net 400 respondentų daugiau – visas 1000!

Tik va, statistiškai paremtas standartinis atsakymas būtų – pirmaujančios partijos nėra. Egzistuoja toks reiškinys kaip paklaidos ir jos yra negailestingos. Kalbant statistiškai. Jei tariame, kad norime 95% statistinio užtikrintumo, tai rezultatų tikros reikšmės yra tam tikros paklaidos ribose. Štai lentelė šiam atvejui:

letele paklaidos

Iš lentelės. Apklausos A metu partija X surinko 19 proc., vertinant statistiškai, 95% atvejų reikšmė yra intervale {19-2,4;19+2,4}={16,6;21,4}, partijos Y rezultatas yra intervale {17-2,3;17+2,3}={14,7;19,3}. Šie du galimų reikšmių intervalai persikloja, todėl tos galimos reikšmės statistiškai nėra skirtingos. T.y. pirmaujančios partijos negalime nustatyti.

persidengimas

Norint statistiškai patvirtinti, su 95% statistiniu patikimumu, kad apklausos A atvejų partijų X (19) ir Y (17) procentai yra tikrai skirtingi, reiktų apklausti vos ne 4000-5000 respondentų. 

Analogiškai galima vertinti ir hipotetinės apklausos B rezultatus – pirmaujančios partijos nėra.

Šiuo atveju, nei 1000, nei 600 apklaustų respondentų nepakanka įvertinti kuri partija pirmauja.

Labai svarbu teisingai interpretuoti rezultatus! Didelė imtis yra užtikrintumo pageidavimas. Be to, didėjant imčiai, tikslumas auga nežymiai, o kaina ypatingai.

Norimas rezultatų tikslumas yra ne vienintelis aspektas įtakojantis imties dydžio pasirinkimą. Dar yra kitų faktorių, pvz., paklaidos priklauso ir nuo atsakymų pasiskirstymo, t.y. konkretaus atsakymo procento, ar respondentų reprezentatyvumo. Reprezentatyvumas politinėse apklausose yra ypatingai svarbus, nes skirtingos socio-demografinės grupės turi skirtingas politines nuomones. Mažesnėse imtyse tam tikros gyventojų grupės gali būti reprezentuojamos nepakankamai arba išvis nereprezentuojamos.  

Verta prisiminti. Imties dydis yra sąlyginis tikslumo matas. Didėjant imčiai, tikslumas auga lėčiau nei didėja pati imtis. Įvertinant esamą ar norimą imti, egzistuoja ir papildomi faktoriai į kuriuos reikia atsižvelgti.

Štai pavyzdinė lentelė su didžiausiomis galimomis paklaidomis ir imties dydžiais.

Didžiausios paklaidos

Ir grafikas pavaizduojantis kaip kintant imties dydžiui, kinta didžiausia galima paklaida.

santykis - imties dydis ir didziausia galima paklaida

Didžiausia galima paklaida būna tada, kai atsakymai pasiskirsto 50/50 principu. Na pavyzdžiui, gyventojų paklaustų, “Ar šiandien namie valgėte pusryčius?”, ir atsakymai pasiskirstytų – “Taip” (50 proc.), “Ne” (50 proc.). Jei tarkim atsakymai pasiskirstytų (10/90) ar (20/80), paklaida būtų mažesnė nei didžiausia galima.

Naudinga. Yra paprasta formulė kurią galima naudoti apytiksliai paskaičiuoti didžiausią galimą paklaidą.

paklaidos formule

Ši formulė taikytina, kai tiriama didelė populiacija (pvz. Lietuvos gyventojai).

Duomenys yra surinkti ir surašyti, o va interpretacijos rutuliojasi galvose.

Įrašas gavosi ilgesnis ir dar daug kas nepasakyta. Pratęsiu kitame įraše.


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *