Print
20. 10. 2021.
50 a ZAMKE STATISTIKE
ZAMKE STATISTIKE

Svjetski dan statistike prvi je put obilježen 20. listopada 2010. godine, nakon donošenja rezolucije 64/267. Tema tadašnjeg Svjetskog dana statistike bila je „služenje, profesionalizam, integritet: slavljenje brojnih doprinosa i postignuća službene statistike.“ Više od 140 zemalja sudjelovalo je na ovom uspješnom događaju. Prema rezoluciji 69/282, koja je donesena 2015. godine, ovaj datum obilježava se svakih pet godina. Dakle, 2020. godine međunarodna zajednica obilježava ovaj datum tek treći put. Tema prošlogodišnjeg Svjetskog dana statistike bila je „Povezivanje svijeta podacima kojima možemo vjerovati.“

Ovaj događaj održava se na inicijativu Komisije za statistiku Ujedinjenih naroda. Ovo tijelo, koje je osnovano 1947. godine, okuplja najbolje statističare iz cijelog svijeta u svrhu poboljšanja točnosti međunarodne statistike putem rasprave i provedbe novih standarda i metoda za prikupljanje i analizu podataka. 

Autor: Clément Baloge
Prijevod: Daria Maracheva

„Postoje tri vrste laži – laž, besramna laž i statistika.“

 

Ovaj citat, koji je popularizirao američki pisac Mark Twain, pokazuje kako lako vlasti mogu koristiti statistiku kako bi zaobišle istinu. Iza znanstvenog i objektivnog paravana, statistika je doista jedan od najboljih načina promoviranja svog stajališta koristeći jednostrane podatke koji, međutim, izgledaju pouzdano. Prikazivanje dijela istine, uz istovremeno skrivanje drugih činjenica dobro je poznata praksa koju statistika dozvoljava. Povodom obilježavanja Svjetskog dana statistike potrebno je razumjeti zamke i trikove koje statistika koristi kao instrument.

 

Provođenje statističkih istraživanja  vrlo je političko pitanje. Niz ključnih pitanja se nikada neće postaviti u nekim zemljama jer se ova pitanja smatraju prijetnjom nacionalnom jedinstvu i političkoj stabilnosti. Na primjer, u Francuskoj, kao i u nekim drugim zemljama, provođenje statističkih istraživanja o nacionalnoj i rasnoj pripadnosti je zabranjeno. Prema nekim političarima i sucima, takvi podaci su u suprotnosti s konceptom jednakosti pojedinaca pred Državom. U Španjolskoj, unatoč rastućoj potražnji, Centar za sociološka istraživanja nikada nije pitao ljude podržavaju li oni monarhiju ili ne, jer to može stvoriti političke probleme. Vlade i vlasti često odbijaju provoditi istraživanja o pitanjima koja smatraju osjetljivim.

 

Osim toga, tijekom prikupljanja podataka relativno je lako manipulirati brojkama i informacijama. Na primjer, izračunavanje BDP-a  vrlo je složen zadatak. Svaka zemlja ima svoj pristup. U EU Europski sustav nacionalnih i regionalnih računa (ESA) naveo je 2010. godine da se "nezakonita gospodarska djelatnost smatra poslovanjem kada svi subjekti koji u tome sudjeluju djeluju sporazumno. Dakle, kupnja, prodaja ili razmjena droga ili ukradene imovine je poslovanje, dok krađa nije". Iako se to radi kako bi se poboljšala usporedba podataka među zemljama, očito je da je nemoguće osigurati pouzdane statističke podatke kada je nekontrolirani dio gospodarstva u pitanju. Međutim, kada smo već kod nepouzdanih statističkih podataka, pandemija COVIDA-19 najbolji je primjer. Svaka zemlja  provodi svoju politiku u vezi s testovima na koronavirus i odlučuje je li koronavirus uzrokovao smrt pojedinca ili nije.

Jedan od najvažnijih elemenata u statistici je točnost uzorka. Ovisno o veličini uzorka, mogućnost pogreške također može varirati i jako utjecati na znanstveni interes istraživanja. Što je uzorak manji, podaci su manje pouzdani. Čak u situaciji kada je uzorak velik, teško je provesti istraživanje savršeno. Tijekom predsjedničkih izbora u SAD-u 2016. godine, instituti za istraživanje javnog mnijenja nisu uspjeli ispravno izmjeriti postotak glasača u svakoj sociološkoj kategoriji. Kao posljedica, rezultat statističkog istraživanja nije dao točan rezultat. To je bio jedan od razloga zašto instituti za istraživanje javnog mnijenja nisu uspjeli predvidjeti pobjedu Donalda Trumpa. Unatoč poboljšanju metodologije i znanja statističara, rizik od nepouzdanih podataka zbog metodoloških problema i dalje je velik.

Osim toga, ispitanici ne govore uvijek istinu, odnosno značajan broj njih može skrivati ​​činjenice ili svoje mišljenje, pa čak i lagati. Razlozi toga mogu biti različiti. Na primjer, neki ljudi misle da određen odgovor može biti u njihovom interesu. Drugi se srame svog mišljenja. Bez obzira na razlog, to utječe na točnost podataka. Ovaj problem uočen je tijekom provođenja političkih istraživanja. Uoči izbora u Hrvatskoj, neki glasači HDZ-a radije daju odgovor „ne znam“, umjesto da odgovaraju iskreno za koga će glasati, jer se boje negativne reakcije.

Zbog svih ovih razloga, osiguravanje „podataka kojima možemo vjerovati“ je nevjerojatno težak izazov. To je još teže u zemljama u kojima su instituti i javne ustanove, koji su zaduženi za prikupljanje podataka, pod kontrolom autokratskih režima, ili jednostavno nemaju dovoljno sredstava za obavljanje svojih dužnosti na odgovarajući način.

Osobe ili skupine, koje imaju moć, često pokušavaju utjecati na statistička istraživanja kako bi dobili određeni rezultat. To rade putem manipulacije, poput predselekcije ispitanika, ili načina na koji se pitanje postavlja. Najpoznatiji primjer odnosi se na zubnu pastu robne marke Colgate. Tvrtka je napravila reklamu u kojoj se tvrdi da je 80% zubara preporučilo njihov proizvod. U stvari, ovi zubari su odgovorili da je ova pasta za zube dobar proizvod. Međutim, nisu pri tome rekli da je Colgate bolji od bilo koje druge paste za zube na tržištu. Reklama je konačno uklonjena nakon toga što je tvrtka optužena za zavaravajuće oglašavanje.

Kada je riječ o manipulaciji statistikom, političari su po ovome i dalje najnepouzdaniji. Tijekom debata i govora, političari koriste i iskorištavaju statistiku na različite načine. S obzirom na  visoku vjerodostojnost statističkih podataka među stanovništvom, njihov znanstveni aspekt i nemogućnost potencijalnog protivnika da brzo odgovori na takav argument, statistika je omiljeno oruđe svakog političara. Osim toga, treba istaknuti koliko su statistički podaci važni za obrazloženje politike po svakom pitanju (ekonomija, imigracija, socijalna skrb, itd.) za svaku političku stranku, od krajnje ljevice, do krajnje desnice.

Prvi je problem  u tome što političari u mnogim prilikama iznose lažne ili neprovjerene podatke, što rezultira širenjem "lažnih vijesti". Čak i kad uspiju iznijeti točne podatke, njihova analiza je često pristrana. Kad političari koriste statistiku, posebno kako bi ojačali svoje argumente, stvara se rizik iznošenja djelomične istine. Na primjer, političari desnice koji se zalažu za protjerivanje migranata, koristeći argument da su oni skloniji kriminalu, zaboravljaju spomenuti druge pokazatelje, poput razine obrazovanja, prihoda i drugih društveno-ekonomskih aspekata njihovog života. Stoga je potrebno provjeravati podatke i ozbiljno razmisliti o političarevu korištenju statistike kako bi zaštitili ljude od pristrane analize.

Kad je romska zajednica u pitanju, prikupljanje podataka i korištenje statistike  još je veći izazov. Prvi problem je u tome što vlasti često ne žele prikupljati takve podatke. Vlasti moraju osigurati pravo manjina da budu zastupljene u statistici te država ne smije smatrati takvu zastupljenost prijetnjom za sebe. To nije nanijelo nikakvu štetu zemljama koje to rade. Nažalost, u mnogim zemljama Romi nisu zastupljeni u službenim podacima, što ih čini nevidljivima u zemlji u kojoj žive. Međutim, čak i u zemljama u kojima Romi imaju priliku izjasniti se o svojoj nacionalnoj pripadnosti tijekom provedbe popisa stanovništva, njihova zastupljenost i dalje je veliki problem. Podjele među romskom zajednicom  glavni su izazov. Ne govore svi Romi Romani čib. Osim toga, ne izjašnjavaju se svi Romi kao Romi. Zbog politike asimilacije, koju provode vlasti, neki Romi se izjašnjavaju kao pripadnici nacionalne većine zemlje u kojoj žive, unatoč tome što se u njima često suočavaju s diskriminacijom i segregacijom. Drugi, poput govornika bajaškog ili romani čib, ne žele se izjašnjavati kao Romi jer se smatraju pripadnicima druge kulture. Ovisno o tome kako se popis stanovništva provodi i koliko opcija ima kako bi  pripadnici nacionalnih manjina izjasnili svoju nacionalnu i jezičnu pripadnost, to znatno utječe na rezultate. Na primjer, u Hrvatskoj u popisnom upitniku nemoguće je izabrati bajaški kao materinji jezik. To će rezultirati smanjenjem broja ljudi koji govore tim jezikom unutar romske zajednice i umjetno povećati broj govornika romani čib.

To je dovelo do situacije kada se službena statistika koristi za umanjivanje važnosti politike usmjerene na suzbijanje diskriminacije i segregacije prema Romima. Kad je broj romskog stanovništva u pitanju uvijek postoji veliki jaz između podataka popisa stanovništva i procjena istraživača. To pokazuje koliko je važno za Rome da imaju pravo na odgovarajuću zaštitu i pravednu političku zastupljenost. Na primjer, prema Popisu stanovništva iz 2011. godine u Hrvatskoj živi 16.975 Roma. Međutim, prema procjenama Ureda za ljudska prava i prava nacionalnih manjina Vlade Republike Hrvatske, broj Roma u zemlji kreće se između 30.000 i 40.000 ljudi. Dakle, poboljšanje pouzdanosti statističkih pokazatelja u svrhu provođenja odgovarajućeg političkog programa od ključne je važnosti za zajednicu.

Čak i ako statistički podaci ne odražavaju stvarnost, oni su jedan od najpouzdanijih izvora na koji se možemo osloniti kako bismo razumjeli očekivanja ljudi i njihov život. Najbolji način za opisivanje statistike je reformulacija poznatog Churchillova citata o demokraciji: "Statistika je najgori oblik političkog instrumenta, osim svih ostalih". Međutim, nikada ne smijemo zaboravljati da ih analiziramo i kritiziramo prije nego što im odamo priznanje.

 

 

 

 

The World Statistics Day has been celebrated for the first time on 20 October in 2010 following the resolution 64/267. The first edition focused on the theme “Service, professionalism, integrity: celebrating the many contributions and achievements of official statistics”. More than 140 countries participated in this successful event. According to the resolution 69/282, adopted in 2015, this day will be celebrated every five years. Thus, in 2020, the international community is observing this day only for the third time, with the current topic being “Connecting the world with data we can trust”.

This event is held under the supervision of the United Nations Statistical Commission. Established in 1947, this body gathers chief statisticians from all around the world to improve the accuracy of international statistics by discussing and implementing new standards and methods to collect and analyze data.

 

 

“There are three kinds of lies - lies, damn lies, and statistics.”

 

This quote, popularized by American writer Mark Twain, illustrates how easily the authorities can use statistics to bend the truth. Behind a scientific and objective appearance, statistics are indeed one of the best ways to promote your own view with often biased but trusted data. Illustrating a part of the truth but hiding other facts is a well-known practice that statistics allow to do perfectly. As we celebrate World Statistics Day, it is necessary to understand the traps and tricks of statistics.

 

Conducting statistical research is a highly political issue. Several key questions will never be asked in some countries as they are seen as a threat to national unity and political stability. For example, in France, as in some other countries, conducting statistical research based on ethnic and racial data is forbidden. According to some politicians and judges, such data would not suit the notion of equality of individuals before the State. In Spain, despite growing demand, the Center for Sociological Research never asked people whether they support the monarchy or not, as it may cause some political troubles. Governments and authorities often refuse to conduct research on issues they consider sensitive.

Besides, while collecting data, it is relatively easy to manipulate numbers and information. For example, calculating the GDP is a tricky issue. Each country has its own way to proceed. In the EU, the European System of Accounts of 2010 stated that "illegal economic actions shall be considered as transactions when all units involved enter the actions by mutual agreement. Thus, purchases, sales or barters of illegal drugs or stolen property are transactions, while theft is not." While the goal is to improve the comparison of data between countries, it is clear that providing reliable statistics on an uncontrolled part of the economy is impossible. However, when it comes to unreliable statistics, the Covid19 crisis is a must-talk. Every country has its own policy regarding Coronavirus tests and its way to determine whether or not this virus was the cause of the death of an individual. Thus, even the data provided by John Hopkins University are far from reflecting an objective reality.

 

Finally, one of the most important elements in statistics is the accuracy of the sample. Depending on the sample size, the margin of error can also vary and highly affect the scientific interest of the research. The smaller the sample is, the less reliable the data are. And even then, it remains difficult to set up everything perfectly. During the 2016 elections in the US, poll institutes failed to measure properly the percentage of voters among each sociological category. Thus, the result of the statistical research did not provide a correct result. This failure was one of the reasons why the institutes failed to predict the victory of Donald Trump. Despite the improvement of methodology and knowledge of statisticians, the risk of having untrustworthy data because of methodology issues remains significant.

Furthermore, respondents are not always telling the truth, and a significant number of them can be hiding a fact or an opinion or even lying. The reasons for not disclosing reality can be different. For example, people can think that it is in their interest to give a specific answer. Some others might be ashamed of an opinion. But in every case, it affects the accuracy of data. For example, this kind of problem has been observed in political polls. Before an election in Croatia, some HDZ future voters might prefer to answer „I don't know“ instead of revealing their real intention if they fear some negative reaction.

For all these reasons, providing “data we can trust” is an incredibly complex challenge. It is even truer in countries where institutes and public institutions in charge of collecting data are under the control of an autocratic regime, or when they just do not have enough funds to fulfil their duty properly.

 

Some powerful figures or groups can influence statistical research to reach a definite outcome by manipulating some factors like the members of the sample or the questions asked. The most famous example is related to Colgate toothpaste. The commercial group produced an ad claiming that 80% of dentists recommended their product. In fact, these dentists answered that it was a good thing to use this toothpaste. However, they did not assume that it was a better one than any other on the market. The ad ended up being removed after cases in which the company was accused of misleading advertising.

When it comes to statistics manipulation, politicians remain the most untrustworthy stakeholders. During debates and speeches, political figures use and overuse statistics. Considering the high credibility of these data among the population, their scientific aspect and the impossibility for a potential contradictor to answer quickly to such an argument, these are the favourite tool of any politician. Besides, it is crucial to notice how important they are to justify a policy on every issue (economics, immigration, social welfare, and so on) and by every political party from the far left to the far right.

The first problem is that, on many occasions, politicians provide data that are either false or unverified, leading to a spreading of “fake news”. Moreover, even when they succeed in providing valuable data, their analysis is often biased. While producing correlation with statistics, especially to endorse a political view, the risk of sharing a partial truth is at its higher stake. For example, right-wing politicians explaining that we should expel immigrants because they are statistically more inclined to crime tend to forget to look at other indicators like the level of education, income and any other socio-economic aspects of their lives. Therefore, it is necessary to verify and think about the use of statistics by politicians so as not to be influenced by a biased analysis.

 

When it comes to the Roma community, collecting data and using statistics is even more challenging. The first problem comes when the authorities refuse to collect such data. The right to be represented in statistics should be carried out by the authorities and not seen as something dangerous. It did not create any harm to countries that are doing so. Unfortunately, in many places, Roma do not have the opportunity to be represented in official data, making them invisible to the country they live in. However, in states where the census allows Roma to express their belongings, their representation remains a major issue. The division among the community is the main difficulty. Not all Roma speak Romani. And not all Roma consider themselves as Roma. Because of the assimilation process, some of them consider themselves members of the national majority of their country despite still facing discrimination and segregation. Some others refuse to be considered as Roma as they feel that this is not representing their own specific culture as Boyashi or Romani Chib speakers. Depending on how the census is conducted and how many options are given to you to express your belongings, the results will thus be affected. For example, it is impossible to choose Boyash as your mother tongue in the Croatian census. It might both reduce the official number of people speaking a language related to the Roma community and increase artificially the number of Romani Chib speakers.

 

This lead to official statistics that can be used to undermine the importance of having a policy to tackle discrimination and segregation towards Roma. There is always a massive gap between the Roma population according to censuses and according to researchers. It illustrates how important this issue is for Roma people to enjoy appropriate protection and fair political representation. For example, in Croatia, the 2011 census stated that 16,975 Roma are living in the country. However, according to the estimations of the Office for Human Rights and Rights of National Minorities of the Government of Croatia, the number of Roma in the country is somewhere between 30,000 and 40,000 people. Then, addressing the question of the reliability of statistics to conduct a proper policy agenda is crucial for the community.

 

Even if statistics do not reflect reality, they are one of the most reliable sources that we can count on to understand the expectations of people and their life. Then, the best way to describe statistics might be a revised version of the famous quote of Churchill on democracy: Statistics are the worst form of policy tool, except for all the others. However, never forget to analyze and criticize them before giving them some credit.