cwbe coordinatez:
101
1
102
21923
5591638
5592029
5593173
5593301

ABSOLUT
KYBERIA
permissions
you: r,
system: public
net: yes

neurons

stats|by_visit|by_K
source
tiamat
K|my_K|given_K
last
commanders
polls

total descendants::14
total children::2
1 ❤️


show[ 2 | 3] flat


To nie je problém foafu, ale dát z obchodného registra.

Nemáš ako rozlíšiť, či to je jedna alebo dve rôzne osoby. Fuzzy algoritmus je rovnako nepresný, napríklad bežná situácia otec Ing. Jozef Adamovič, syn Jozef Adamovič, obaja trvalý pobyt na rovnakej adrese, každý má inú firmu. Žiaľ, tie dáta neobsahujú žiadny identifikátor osoby, podľa ktorého by sa to spoľahlivo dalo prepojiť. Ale je to problém s dátami od štátu, nie foafu, takže keď to má niekto fixnúť, tak štát...

To len na ilustráciu jedného z mnohých problémov so "zverejňovaním údajov" z verejnej správy.




  • 000001010000000100000102000219230559163805592029055931730559330105593414
    adam 11.10.2010 - 14:31:03 level: 1 UP New
    aha, chňápem.
  • 000001010000000100000102000219230559163805592029055931730559330105593389
    yelowcap 11.10.2010 - 14:13:40 (modif: 11.10.2010 - 14:18:04) level: 1 UP [6K] New Content changed
    Problem je este skor ako v "zverejnovani", a to v tom, ze niektore udaje ma verejna sprava proste chronicky nekonzistentne a ze v nej existuje velmi malo zabudovanych automatickych mechanizmov, ktore by tie data kontrolovali a opravovali (nieco ako controlling vo firmach, ktory dozera o.i. na konzistentnost uctovnictva).

    Kym sa vo verejnej sprave nevyriesi toto (teda ciastkove veci ako: stanovenie data ownerov pre skupiny udajov, urcenie single points of truth a zabehnutie feedback loopov v procese zbierania a upravy dat)- tak vystupom bude stale garbage alebo ciastkovy garbage.

    Pretoze aj keby sme DNES nastavili standardy zverejnovania a zbierania dat, tak kontinualne budu vznikat nove a nove druhy dat, nove veci, co bude mozne a potrebne sledovat a zverejnovat a kym vo VS nebude niekto, kto bude celoplosne periodicky urcovat: "zbierajte od dnes aj toto a v takejto forme, lebo to potrebujeme na toto", tak to nikto zbierat nebude, resp to budu zbierat vsetci po svojom a vystupom budu zas a znova nekonzistentne udaje.

    PRIKLAD: Sledovanie prijmov obyvatelstva a urcovanie poctu ludi v jednotlivych prijmovych skupinach: Kedysi sa stanovili kategorie odstupnovane po 5000 SK. Za najvyssiu kategoriu bolo zvolenych 60 000 a viac.

    Inflacia a rast vsak sposobili to, ze cez 60.000 sa teraz uz prehuplo v porovnani s rokom 2000 viac ludi a teraz sa tam mnozia, bez toho ze by bola znama ich distribucia. Vsetci co sa s tymi udajmi stretnu vedia, ze by bolo rozumne, aby statisticky urad vytvorli kategorie 60-80, 80-100 a 100 a viac, ale proste tam nie je nikto, kto mal riadenie takychto zmien na starosti. Resp tam je, ale nerobi si svoju pracu ani zdaleka poriadne.

    Myslim si, ze diskusia o udajoch verejnej spravy by mala byt komplexnejsia ako diskusia o zverejnovani. malo by to byt teda nieco ako: ZBER UDAJOV VO VEREJNEJ SPRAVE A ZVEREJNOVANIE KLUCOVYCH UDAJOV.

    Toto som chcel rozpravat vcera, ale nedostal som sa k tomu, lebo mi vyprsal cas.

    Sam si myslim, ze opportunity costs vyplyvajuce z toho, ze stat sa v dobrej viere rozhoduje na zaklade nekonzistentych udajov su este vyssie ako umyselne "ukradnute" prostriedky.


    The best time to plant a tree is twenty years ago. The second best time is now.
    more children: (3)