Showing posts with label tilasto. Show all posts
Showing posts with label tilasto. Show all posts

Sunday, October 15, 2017

Gaussin käyrä eli normaalijakauma sekä tilastojen harha


Normaalijaukauman kuva
(Lähde: Internet)

Kimmo Huosionmaa

Jokainen maailman poliitikko haluaa saada mahdollisimman paljon ääniä. Paras tapa hankkia noita poliittisessa elämässä tärkeitä kannattajia, jotka laittavat noiden poliitikkojen ehdokas numeroita on tietenkin luvata ihmisille jotain konkreettista, ja tuon takia tietenkin olisi mukavaa tietää ihmisten saama keskipalkka, jotta heiltä ei sitten lähdetä liikaa leikkaamaan, mutta jostain syystä nuo leikkaukset eivät useinkaan osu oikeaan kohtaan. Gaussin käyrä eli normaalijakaumaa esittelevä funktio on varuste, millä matemaatikot tutkivat kohtaa, missä luku-ryhmän keskikohta sijaitsee. Se on kuuluisa “kamelin kyttyrä”, jonka mukaan moni valtio säätää opetussuunnitelmassa esitettyjä asioita.

https://fi.wikipedia.org/wiki/Normaalijakauma
Tuo funktio on tietenkin myös väline, jolla etsitään “suurta keskinkertaisuutta”. Suuri enemmistö on joukko ihmisiä, joita on mukava palvella ainakin jos sattuu olemaan vaalivuosi. Syy miksi suurta enemmistöä kutsutaan joskus “suureksi keskinkertaisuudeksi” johtuu siitä, että jos poliittikko saa tuon ihmisryhmän puolelleen, niin hän saa siitä sitten kuitata todella suuren määrän ääniä. Tuo käyrä on ikään kuin tilastotieteiden “pyhä lehmä”. Sen nimeen voidaan aina vannoa, ja se on tietenkin todella raskaan sarjan väline niiden käsissä, jotka haluavat tietää sen, mitä keskiverto ihminen saa palkkaa tai muuta vastaavaa.


Mutta tällöin unohdetaan sellainen asia, että Gaussin käyrään liittyy harha, mikä saattaa tehdä tuosta välineestä käyttökelvottoman. Tuo harha johtuu siitä, että esimerkiksi lukujoukon äärimmäiset luvut voivat antaa tuon käyrän kohdalla täysin väärän arvon. Eli äärimmäisen suuri luku ikään kuin hinaa tuota “kamelin kyttyrää” pitkin lukusuoraa. Jos otetaan esimerkiksi keskipalkkaa koskeva lukujoukko, ja siihen otetaan vaikka 10 000 ihmistä, joista jokainen saa noin 1400 euroa bruttopalkkaa, minkä jälkeen tähän ryhmään lisätään vaikka NHL-joukkueen jäsenten tai jonkun maailman suuryrityksen johtajan saamat tulot, niin silloin tuo “kamelin kyttyrä” siirtyy aivan jonnekin muualle, mitä sen pitäisi olla. Ja siksi nuo leikkaukset saattavat kohdistua juuri sinne, mihin niitä ei varmasti ainakaan populistin kannalta kannata kohdistaa.


Myös kaiken maailman miljonäärit sekä miljonäärien sukujen jäsenet vääristävät esimerkiksi sellaisia tilastoja, jotka kertovat siitä, käyttääkö tavallinen ihminen esimerkiksi julkisia lääkäripalveluita. Varakkaat ihmiset tietenkin varmasti käyttävät ainakin osittain enemmän yksityisiä lääkäreitä kuin tavalliset palkansaajat, ja varmaan NHL-pelaajilla on tietenkin myös omat yksityiset lääkärinsä käytössä. Joten tällaisten ihmisten ottaminen tilastoon saattaa myös aiheuttaa väärän tiedon kulkeutumisen tietokantaan. Myös se kuka näihin tiedonkeruussa mahdollisesti käytettyihin lomakkeisiin vastaa voi sitten vääristää saatua tietoa.


Juuri tällainen muusta ryhmästä poikkeava luku saattaa muuttaa koko käyrän välineeksi, joka on täysin hyödytön. Samoin jos tilastomatematiikan tai tilastojen avulla yritetään oikeasti etsiä ihmisten keskiluokan tuloja, niin sama tilasto ei kuitenkaan näytä oikeastaan muuta kuin hyödytöntä tietoa. Nimittäin noissa tilastoissa sitten on sellainen huomioitava asia, että ne kertovat vain sen, miten suuria palkkoja vaikkapa Suomessa maksetaan, jos lähteenä käytetään teollisuuden ja muiden yritysten maksamia palkkoja.


Se mikä tuosta tilastosta tekee politiikan kannalta hyödyttömän on sitten sellainen, että siitä ei suoraan näy, että onko tuo palkansaajien ryhmä äänioikeutettuja eli esimerkiksi siitä, että ovatko he sitten maamme kansalaisia ei ole tietoa. Ja sen takia poliittisten ohjelmien teko pelkästään palkkatilastojen avulla on hiukan hankalaa, vaikka tietenkin populistien malli politiikasta  on sellainen, että enemmistölle luvataan paljon, mutta muilta sitten otetaan kaikki pois. Kun puhutaan normaalijakaumaa kuvaavan  funktion antamasta harhasta sekä muista tilastojen ominaisuuksista, niin silloin tietenkin pitää muistaa sellainenkin asia, että maailman 200 rikkainta ihmistä saa muistaakseni saman verran tuloja, kuin loppu maailma yhteensä.


Vaikka noilla ihmisillä tietenkin on käytössään voimakas media-ase, niin silti heidän oma antamansa äänimäärä vaaleissa on todella pieni, mutta heidän saamansa palkka varmasti hinaa gaussin käyrää pitkin lukusuoraa. Jos taas puhutaan siitä, että kouluttamaton ihminen voi saada todella hyvää palkkaa, niin silloin voidaan palkanlaskentaan lisätä vaikka juuri NHL-joukkueiden pelaajien sekä lottomiljonäärien sen vuoden tulot, niin varmasti alkaa tilasto näyttää lupaavalta. Mutta muuten tuo tilasto ei aivan niin oikeita tuloksia näytä, kuin sen toivoisi näyttävän. Kuitenkin myös inhimillinen tekijä sitten kun lähdetään puhumaan vaikka siitä, kuinka paljon työllisyyttä on nyt saatu vähennettyä.


Eli tietenkin jokainen äänestäjä tekee itse sen äänestyspäätöksen, ja siinä hän voi miettiä sitä, että onko juuri hän saanut sen työpaikan. Jos työpaikka ei osu omalle kohdalle, niin miten tuo äänestäjä sitten käyttäytyy voi olla hiukan toista, kuin mitä hänen toivotaan käyttäytyvän. Tuollaisessa tilanteessa hän saattaa kääntää selkänsä entiselle puolueelleen. Toisaalta jos työttömyyttä hoidetaan sillä, että ihmisiä siirretään valtion palvelukseen, niin silloin tuosta henkilöstä ei valtiolle tule mitään muuta kuin menoja valtion taloutta ajatellen, joten tämänkaltainen työllisyyden hoitaminen ei mitään kovin järkevää ole.

Thursday, May 19, 2016

Kreikkalaista tulta sekä kirjastoja


Kun puhutaan Alexandrian suuresta kirjastosta, niin monet ihmettelevät varmasti, että miksi juuri tämä kirjasto kiehtoo minua niin, että siitä kirjoitan lähes jokaiseen kirjoitelmaan? Tuo kirjasto oli aikansa suurin ihme, jonka sisään koottiin lähes kaikki dokumentit siitä, miten muut antiikin maailman ihmeet rakennettiin sekä se mikä niiden minkäkin osan tarkoitus oli. Eli tuo mahtava kirjasto oli oikeastaan kokoelma kirjoituksia, jotka käsittivät antiikin insinööritaitoa, kuten esimerkiksi linssien hiontaa, kreikkalaisten laivojen rakentamista sekä esimerkiksi kreikkalaisten parabolipeilien sekä kreikkalaisen tulen eli eräänlaisen Napalmin sekä sen suihkuttamiseen käytettävien pumppujen valmistusta. Eli kyseessä on oikeastaan ollut ihme, joka kertoo ihmeistä. Ja koska nuo laitteet sekä olivat aikoinaan varmasti sotasalaisuus.

Näin ollen Alexandrian kirjasto oli hyvin tarkka lainaamansa materiaalin laadusta sekä siitä, kuka noita niteitä pääsi lainaamaan, ja tuo kirjasto oli tietenkin tämän takia Alexandrian muisti. Toisin sanoen jos joku lainasi tuota materiaalia, niin hänet sitten merkittiin lainaajaksi, mutta toki tuo kirjasto suojeli tietoaan monella tavoin. Ja yksi noista tavoista oli tietenkin se, että noihin kirjaston kokoelmiin liitettiin myös täysin merkityksettömiä niteitä, joiden väliin nuo hyvin tärkeät niteet, kuten esimerkiksi juuri "kreikkalaisena tulena" tunnetun alkoholia sekä ilmeisesti eukalyptus- tai setriöljyä ja salpietaria sisältäneen polttoaisteluaseen suihkuttamiseen tarvittavien mäntä- tai rataspumppujen valmistusohjeet.

Joten tämä polttotaisteluväline varmasti haluttiin pitää valtiosalaisuutena, ja uskoisin, että noita ainesosia on toki ollut useita. Uskoisin että Alexandrian suuri kirjasto oli muuten melko avoin laitos, mutta sen nimen omaan noita vielä nykyäänkin arvoituksellisia välineitä käsittävä osa saattoi olla suljettu yleisöltä. Eli se saattoi sijaita salaoven tai vartioidun sisäänkäynnin takana, ja noita välineitä koskevat tiedot oli suljettu sen taakse. Ja toki esimerkiksi Rooman keisari saattoi noita niteitä kysellä, ja ehkä osa niistä jäi palauttamatta, joten nuo kirjaston työntekijät sitten kopiovat nuo tekstit arkistoon, josta osaa tietenkin sälytettiin esimerkiksi Kuolleen meren rannalla, mutta kun puhutaan vaikkapa noiden tekstien arvosta, niin kun kristityt sitten alkoivat mellakoida noin 415 jKr. niin toki nuo kirjoitukset olivat arvokkaita myös muiden kuin Rooman keisarin käsissä, ja ehkä ne myytiin tai salakuljetettiin pois Roomasta.

Mutta kun puhutaan noista tuon ajan kirjastoista, niin niissä tietenkin käytettiin myös nidekohtaisia seurantoja, joilla pyrittiin paljastamaan se, että "luukuttiko" joku sitten esimerkiksi valtiosalaisuuksia asiattomille tahoille esimerkiksi näytelmän muodossa. Vaikka kirjasto vaikuttaa monien ihmisten mielestä melko tylsältä paikalta, niin sen niteiden lainaaminen kertoo jotain ihmisistä. Eli jos esimerkiksi jonkun kenraalin muistelmia aletaan lainata jatkuvasti, niin silloin tietenkin se kertoo siitä, että kenraali saattaa olla muuttamassa johonkin alueelle. Samoin jos kirja tai nide varastetaan tai sitä vahingoitetaan, niin silloin tietenkin tilalle tuodaan uusi kappale, mutta jos tuo vahingoittaminen eli kirjan sivujen repiminen jostain tietyltä kohtaa toistuu, niin silloin tietenkin voi virkailija etsiä nuo sivut, ja toimittaa niistä raportin esimerkiksi esimiehelleen.

Silloin tietenkin aletaan noita sivuja tutkia, että voidaan löytää se, mikä niissä on sen arvoista, että henkilö haluaa repiä tuon painotuotteen. Se että verorahoilla ostettuja tuotteita rikotaan ei ole julkisesti hyväksyttävää. Ja tuo osoittaa muutenkin sellaista asennetta tutkijan työtä kohtaan, että siinä saattaa tuon niteen repijä joutua vakaviin vaikeuksiin. Tutkija ei saa koskaan vahingoittaa lähdeaineistoa, koska silloin joku saattaa huomata ehkä tehneensä virheen jossain haastattelussa. Ja esimerkiksi Mafia varmasti seuraa sitä , mitä heistä kirjoitetaan lehdissä. Joten mikäli tutkija yrittää varastaa jotain lehtiä tai repii niistä sivuja, saattaa hän paljastaa tutkimuksensa kohteena olevan esimerkiksi korruption tai muun rikollisuuden. Joten esimerkiksi kirjastossa lehdet kannattaa tässä tapauksessa valokuvata sekä kirjoittaa teksti puhtaaksi omalla tietokoneella, jotta tutkija ei sen takia joudu ongelmiin.

hkimmo.blogspot.fi

Newtonian and Einstein models are still useful tools.

The Einstein and Newtonian gravitational principles are still “hard stuff”. And today, we can say that all gravitational models are suitable...