cwbe coordinatez:
101
1
102
21923
5591638

ABSOLUT
KYBERIA
permissions
you: r,
system: public
net: yes

neurons

stats|by_visit|by_K
source
tiamat
K|my_K|given_K
last
commanders
polls

total descendants::33
total children::4
5 ❤️


show[ 2 | 3] flat


juraj0
killya0
lupus yonderboy0
Toth0
09/10
Rozhodol som sa pozriet na zubok suboru procurements_2.csv ktory, zda sa, obsahuje informacie z vestnika verejneho obstaravania (to mi bolo nasledne potvrdene).

13:00 Po priblizne 2-3 hodinach processovania daneho suboru ho dostavam do podoby z ktorej zistim ze celkovy obnos financii o rozdeleni ktorych uvedeny subor vypoveda je tak velke cele cislo, ze mi ho Rko spociatku ani nechce vypisat.

14:42 Pri zoradeni poloziek od najvacsich po najmensie ma zarazilo ze jedna jedina fyzicka osoba, isty judr. Ruzicka, ziskal nieco cez 300milionov korun len za nejaku studiu o dialniciach ci co.

15:00 Rozhodol som sa prepojit informacie zo suboru (tykajuce sa zvacsa pravnickych osob) s informaciami o fyzickych osobach ktore su pritomne na foaf.sk. Cele za pouzitia grafov.

16:00 - 20:00 Prechadzka v lese pocas ktorej mi roger naprgal parser na foaf...vdaka prevelika

20:00 - 22:00 Pozeram v Progressbare film 23.

23:00 Po aplikacii pageranku (pouzivam implementaciu kniznice igraph pre R) na prvy (neorientovany a nevyvazeny) vestnik2foaf graf na mna vyskakuje meno Ing. Vladimir Pacai.




000001010000000100000102000219230559163805592643
nanda
 nanda      11.10.2010 - 00:01:29 (modif: 11.10.2010 - 00:01:52), level: 1, UP   NEW !!CONTENT CHANGED!!
Vyhral som druhe miesto.
Neviem ci si ho zaslusim ale dakujem za podporu.

00000101000000010000010200021923055916380559264305593288
yelowcap
 yelowcap      11.10.2010 - 13:11:23 (modif: 11.10.2010 - 13:15:20), level: 2, UP   NEW !!CONTENT CHANGED!!
podla mna urcite zasluzene.
-
ak budes mat nejake zaujimave a prehladne graficke vystupy, tak plz zaves, tie by som si rad pozrel.

000001010000000100000102000219230559163805592036
nanda
 nanda      10.10.2010 - 18:33:55 , level: 1, UP   NEW
jemne ocisteny dump z vestniku verejneho obstaravania

000001010000000100000102000219230559163805592033
nanda
 nanda      10.10.2010 - 18:29:23 , level: 1, UP   NEW
hrany grafu zjednocujuceho data z foaf a procurements

000001010000000100000102000219230559163805592029
nanda
 nanda      10.10.2010 - 18:26:05 (modif: 11.10.2010 - 00:09:13) [30K] , level: 1, UP   NEW !!CONTENT CHANGED!!
1 Ing. Vladimír Pačai 10974836
2 Ing. Juraj Široký 14875720
3 JUDr. Oszkár Világi 8664261
4 RNDr. Ján Kato 15653738
5 Ing. Peter Korbačka 11289137
6 Ing. Jozef Potisk 6197284
7 Ing. Slavomír Hatina 8898406 - uvedeny v suboroch ako externy poradca prezidenta
8 Ing. Ivan Jakabovič 12342253
9 Ing. Dušan Švantner 10302954 - poslanec za SNS
10 Ing. Rudolf Čížik 12868950

uvedene cisla su suctami obnosov ktore dostali (vramci verejnych obstaravani uvedenych vo vestnikoch) firmy pre ktore su podla foafu dotycne osoby konatelmi vydelene celkovym poctom konatelov dotycnych firiem, t.j. sum(sum(pohladavka_pre_firmu)/pocet_konatelov_firmy)

00000101000000010000010200021923055916380559202905593212
mwt
 mwt      11.10.2010 - 12:37:23 , level: 2, UP   NEW
čo sú to za výsledky, konkrétne? dajú sa použiť ako nejaký dôkazný materiál? asi nie, čo...

00000101000000010000010200021923055916380559202905593192
FLESh
 FLESh      11.10.2010 - 12:16:14 , level: 2, UP   NEW
tie sumy su v € ci Sk

00000101000000010000010200021923055916380559202905593173
adam
 adam      11.10.2010 - 12:02:53 , level: 2, UP   NEW
a už fixli foaf? Lebo keď si napr. zmenil titul, alebo bydlisko, dosť často to foaf nevykrýval (riešil to ako 2 rôzne osoby)

0000010100000001000001020002192305591638055920290559317305593301
juraj
 juraj      11.10.2010 - 13:25:48 [1K] , level: 3, UP   NEW
To nie je problém foafu, ale dát z obchodného registra.

Nemáš ako rozlíšiť, či to je jedna alebo dve rôzne osoby. Fuzzy algoritmus je rovnako nepresný, napríklad bežná situácia otec Ing. Jozef Adamovič, syn Jozef Adamovič, obaja trvalý pobyt na rovnakej adrese, každý má inú firmu. Žiaľ, tie dáta neobsahujú žiadny identifikátor osoby, podľa ktorého by sa to spoľahlivo dalo prepojiť. Ale je to problém s dátami od štátu, nie foafu, takže keď to má niekto fixnúť, tak štát...

To len na ilustráciu jedného z mnohých problémov so "zverejňovaním údajov" z verejnej správy.

000001010000000100000102000219230559163805592029055931730559330105593414
adam
 adam      11.10.2010 - 14:31:03 , level: 4, UP   NEW
aha, chňápem.

000001010000000100000102000219230559163805592029055931730559330105593389
yelowcap
 yelowcap      11.10.2010 - 14:13:40 (modif: 11.10.2010 - 14:18:04) [6K] , level: 4, UP   NEW !!CONTENT CHANGED!!
Problem je este skor ako v "zverejnovani", a to v tom, ze niektore udaje ma verejna sprava proste chronicky nekonzistentne a ze v nej existuje velmi malo zabudovanych automatickych mechanizmov, ktore by tie data kontrolovali a opravovali (nieco ako controlling vo firmach, ktory dozera o.i. na konzistentnost uctovnictva).

Kym sa vo verejnej sprave nevyriesi toto (teda ciastkove veci ako: stanovenie data ownerov pre skupiny udajov, urcenie single points of truth a zabehnutie feedback loopov v procese zbierania a upravy dat)- tak vystupom bude stale garbage alebo ciastkovy garbage.

Pretoze aj keby sme DNES nastavili standardy zverejnovania a zbierania dat, tak kontinualne budu vznikat nove a nove druhy dat, nove veci, co bude mozne a potrebne sledovat a zverejnovat a kym vo VS nebude niekto, kto bude celoplosne periodicky urcovat: "zbierajte od dnes aj toto a v takejto forme, lebo to potrebujeme na toto", tak to nikto zbierat nebude, resp to budu zbierat vsetci po svojom a vystupom budu zas a znova nekonzistentne udaje.

PRIKLAD: Sledovanie prijmov obyvatelstva a urcovanie poctu ludi v jednotlivych prijmovych skupinach: Kedysi sa stanovili kategorie odstupnovane po 5000 SK. Za najvyssiu kategoriu bolo zvolenych 60 000 a viac.

Inflacia a rast vsak sposobili to, ze cez 60.000 sa teraz uz prehuplo v porovnani s rokom 2000 viac ludi a teraz sa tam mnozia, bez toho ze by bola znama ich distribucia. Vsetci co sa s tymi udajmi stretnu vedia, ze by bolo rozumne, aby statisticky urad vytvorli kategorie 60-80, 80-100 a 100 a viac, ale proste tam nie je nikto, kto mal riadenie takychto zmien na starosti. Resp tam je, ale nerobi si svoju pracu ani zdaleka poriadne.

Myslim si, ze diskusia o udajoch verejnej spravy by mala byt komplexnejsia ako diskusia o zverejnovani. malo by to byt teda nieco ako: ZBER UDAJOV VO VEREJNEJ SPRAVE A ZVEREJNOVANIE KLUCOVYCH UDAJOV.

Toto som chcel rozpravat vcera, ale nedostal som sa k tomu, lebo mi vyprsal cas.

Sam si myslim, ze opportunity costs vyplyvajuce z toho, ze stat sa v dobrej viere rozhoduje na zaklade nekonzistentych udajov su este vyssie ako umyselne "ukradnute" prostriedky.


The best time to plant a tree is twenty years ago. The second best time is now.

00000101000000010000010200021923055916380559202905593173055933010559338905593519
juraj
 juraj      11.10.2010 - 15:40:12 [2K] , level: 5, UP   NEW
Máš pravdu vo všetkom, akurát ja si myslím, že toto treba riešiť paralelne.

Teraz musíme chcieť od VS, aby zverejnila všetky dáta, ktoré má v IS až na dáta, kde je dôvod nezverejniť ich (osobné údaje, utajované informácie).

Preto, lebo je to zo zákona povinná robiť a preto, lebo keď ich do toho nedokopeme, nebude to robiť.

Na kvalitu údajov sa treba zamerať tiež, je to dlhodobejšia záležitosť, ale to nebráni tomu, aby údaje boli zverejňované vždy -- a keď ľudia ten bordel uvidia, aspoň budú tlačiť viac.

Každopádne prístup (viem, že si to tak ani netvrdil, len preistotu explicitne uvediem) "najprv spravme poriadok, potom to dajme von" je určite najhorší možný. Lebo ten poriadok nebude nikdy a údaje tiež nie.

0000010100000001000001020002192305591638055920290559317305593301055933890559351905593663
yelowcap
 yelowcap      11.10.2010 - 17:01:48 (modif: 11.10.2010 - 17:07:38), level: 6, UP   NEW !!CONTENT CHANGED!!
Aj ty máš pravdu vo všetkom.
A tiez mas pravdu, ze to treba riesit paralelne (a neoddelene).
Na Hackday som (si) kreslil take infograficke koliecko, kde som sa snazil zachytit podla mna potrebne aktivity - tuto potrebnu paralelnost aktivit (s nejakymi quick wins) som tam nezachytil - rozsirim a potom zavesim.
-
-
-
otazka: Nestartovanie vsetkych tychto aktivit by mal na starosti urad vlady?
Je tam uz v tejto chvili na to niekto full-time dedikovany?

000001010000000100000102000219230559163805592029055931730559330105593389055935190559366305594646
juraj
 juraj      12.10.2010 - 08:49:50 , level: 7, UP   NEW
Neviem, o úrade vlády nemám informácie, to je asi skôr otázka na Zuzanu, každopádne sa obávam, že štartovať to budeme musieť my.

0000010100000001000001020002192305591638055920290559317305593301055933890559351905593552
drakh
 drakh      11.10.2010 - 16:01:15 , level: 6, UP   NEW
ten posledny ustavec 100% suhlas.

When I sleep, I dream too much

00000101000000010000010200021923055916380559202905593173055933010559338905593471
roger
 roger      11.10.2010 - 15:10:01 , level: 5, UP   NEW
pointou panelovej diskusie bolo, ze je dost akutny problem s tou novou legislativou 'plosneho zverejnovania'. to treba hasit najrychlejsie - ci uz na strane poskytovania udajov, ale aj na strane spracovania (tretim sektorom).

0000010100000001000001020002192305591638055920290559317305593301055933890559347105593526
juraj
 juraj      11.10.2010 - 15:43:25 , level: 6, UP   NEW
Pozor, to nie je nová legislatíva. Zákon, ktorý im prikazuje proaktívne zverejňovať údaje z IS platí od roku 2006. To znamená, že už štyri roky by sme nemali od inštitúcií požadovať údaje a oni na to reagovať, ale by nám mali tie údaje aktívne tlačiť.

To, že na to serú je druhá vec, ale tváriť sa, že po nich zrazu chceme niečo nové je veľmi zlý prístup -- oni to majú robiť už štyri roky.

Nová legislatíva bude vo zverejňovaní zmlúv, teda v tom, že ich nebude možné jednoduchou klauzulkou v zmluve "utajiť".

000001010000000100000102000219230559163805592029055931730559330105593389055934710559352605593571
roger
 roger      11.10.2010 - 16:12:23 , level: 7, UP   NEW
ano, to je ale komunikacia smerom k statu - ze to nie je novinka, len treba popracovat na forme.

ale inak bude potrebny intenzivny tlak ako pri novej veci (suvisi aj so zmenou garnitury a tym ze to tak ci tak nefunguje) - hlavne v otazke "odporu" spravcov a dodatavatelov IS.

00000101000000010000010200021923055916380559202905593173055933010559338905593424
Thunder Perfect Mind
 Thunder Perfect Mind      11.10.2010 - 14:34:36 , level: 5, UP   NEW
suhlasim, len v tej euforii netreba zabudnut na to ze stat moze byt aj velmi nebezpecny vlastnik udajov :)

0000010100000001000001020002192305591638055920290559317305593301055933890559342405593439
yelowcap
 yelowcap      11.10.2010 - 14:47:39 (modif: 11.10.2010 - 14:49:05), level: 6, UP   NEW !!CONTENT CHANGED!!
true.

niekde na zaciatku celeho procesu zberu udajov je filozoficka dilema, co vsetko chceme, aby stat vlastnil, co vsetko mal prepojene (ci tam proste nema byt niekde chinese wall) a ktori ludia z tych 350 tisic zamestnancov VS maju mat k tomu pristup.

0000010100000001000001020002192305591638055920290559317305593301055933890559342405593428
adam
 adam      11.10.2010 - 14:36:17 , level: 6, UP   NEW
neboj sa, "štát" vie zistiť všetko potrebné aj dnes, keď veľmi chce :)

000001010000000100000102000219230559163805592029055931730559330105593389055934240559342805593528
juraj
 juraj      11.10.2010 - 15:44:36 , level: 7, UP   NEW
Hej, ale je iné, či niečo zistí tak, že sa niekto musí hrabať v horde šanónov alebo či to spraví jeden select.

Ale to je cena za transparentný štát.

Čokoľvek, čo sa týka osobných údajov by samozrejme malo ísť mimo...

000001010000000100000102000219230559163805592029055931730559330105593389055934240559342805593429
Thunder Perfect Mind
 Thunder Perfect Mind      11.10.2010 - 14:37:49 , level: 7, UP   NEW
nebojim, len cim uplnejsie a dostupnejsie su tie udaje tym menej treba chciet.

00000101000000010000010200021923055916380559202905592913
hojso
 hojso      11.10.2010 - 09:47:59 , level: 2, UP   NEW
Ing. Vladimír Pačai

Cassoviainves - to su ti chlapci co urobili armaturku myjava , bukozu hencovce a mnoho mnoho dlasieho.

00000101000000010000010200021923055916380559202905592806
randlover
 randlover      11.10.2010 - 08:34:41 , level: 2, UP   NEW
Prečo to delíš počtom konateľov?

0000010100000001000001020002192305591638055920290559280605593165
nanda
 nanda      11.10.2010 - 12:00:13 (modif: 11.10.2010 - 12:01:10), level: 3, UP   NEW !!CONTENT CHANGED!!
chcel som to niecim vyvazit...

rad by som podotkol ze uvedene cifry maju len cisto ilustracny charakter, istotne netvrdim ze take statom emitovane obnosy skoncili v rukach uvedenych osob

(ale na to ze mi relativne primitivny algoritmus zo vsetkych moznych na-slovenskej-scene-posobiacich-postaviciek vyplul prave uvedenych panov to nieje zle, nie?)

0000010100000001000001020002192305591638055920290559280605593051
johari
 johari      11.10.2010 - 11:11:12 , level: 3, UP   NEW
tiez mi to pride skreslujuce

000001010000000100000102000219230559163805592029055928060559305105593310
juraj
 juraj      11.10.2010 - 13:29:09 , level: 4, UP   NEW
Čísla sú skresľujúce, resp. nič nehovoriace, ale ber to iba ako "váhu" osoby, nie ako sumu, ktorú zarobili (celkovo, suma ktorú firma zarobila je dosť rôzna, niekto môže predať 100 vojenských áut, na každom zarobí 10%, niekto môže dodať štúdiu v rovnakej sume a zisk z toho je 70%).

Podstatné je, že tých ľudí treba nejak vyvážiť. To, čo sa mne (ako porotcovi v súťaži) na tom páčilo bol fakt, že keď sa tie mená objavili, tak novinári sa na ne pozreli a všetci tie mená dôverne poznali.

Keď teraz štát začne zverejňovať kvantá zmlúv, čo môžu byť naozaj tisícky dlhých dokumentov, je dobré mať algoritmy, ktoré síce nepresne, ale aspoň nejak môžu novinárom povedať, ktorým zmluvám sa pozrieť na zúbky. Lebo to, že by niekto čítal všetky zmluvy je čistá fantasmagória.

Čiže ako taký prvý filter, "pozrite sa na týchto" je to podľa mňa veľmi dobré. Samozrejme, iní novinári sa budú pozerať iným spôsobom a to je dobré.

00000101000000010000010200021923055916380559202905592061
nanda
 nanda      10.10.2010 - 18:52:15 , level: 2, UP   NEW
record_id id year bulletin_id procurement_id customer_ico
25801 26090 26090 2008 30 00829 - VNS 30416094
customer_company_name
25801 Ministerstvo dopravy, pôšt a telekomunikácií Slovenskej republiky
supplier_ico supplier_company_name supplier_region
25801 31757812 JUDr. Jaroslav Ružička, CSc. NA
procurement_subject
25801 Poskytovanie neprioritných služieb pri výbere spôsobu a podmienok financovania diaľnic a rýchlostných ciest na území Slovenskej republiky zo súkromných zdrojov.
price currency is_VAT_included
25801 391270000 SKK false

00000101000000010000010200021923055916380559202905592059
nanda
 nanda      10.10.2010 - 18:51:05 , level: 2, UP   NEW
record_id id year bulletin_id procurement_id customer_ico
3541 3558 3558 2006 141 07568 - VNS NA
customer_company_name supplier_ico supplier_company_name
3541 31783325 JUDr. Vladimír Kán advokát
supplier_region
3541 NA
procurement_subject
3541 Vymáhanie pohľadávok za porušenie tarifno-prepravných podmienok.
price currency is_VAT_included
3541 345000000 SKK false

00000101000000010000010200021923055916380559202905592034
huba
 huba      10.10.2010 - 18:30:38 , level: 2, UP   NEW
pekna zberba toto zda sa

0000010100000001000001020002192305591638055920290559203405593826
d3nzel
 d3nzel      11.10.2010 - 18:23:32 , level: 3, UP   NEW
stretavka/assembly:)