total descendants:: total children::1 1 ❤️ |
Pozadal jsem hromiho o vysvetleni zajimavych cisel z Kyberia July 2006 PageRank FriendsLink Analysis a tu je jeho odpoved: Pagerank je algoritmus ktory Ti dokaze najst vlastny vektor (eigenvector s eigenvalue=1) k matici ktorou popisujes urcity graf. Graf je matematicka entita ktora je velmi vhodna na popisovanie struktur ktore sa zkladaju z entit a z vztahov medzi tymito entitami. Kyberia 2 bola navrhnuta ako taka struktura, preto sa nad nou podobne analyzy daju realizovat s velkou lahkostou, obzvlast za pouzitia dobrych nastrojov. A kazdy kto vie, vie ze najlepsim nastrojom na trhu je soft ktory nic nestoji - R for statistical computing... Teraz trochu ludskejsie. Vyberiem si kriterium podla ktoreho z databazy kybce vyselectujem data. Pre hentu analyzu som si ako kriterium zvolil FRIENDS LINK medzi dvomi uzivatelskymi nodami. Kedze osoba A moze mat za frienda osobu B bez toho aby osoba B mala za frienda osobu A, jedna sa o orientovany graf. Tento graf mi kniznice "igraf" pretransformuje na maticu nad ktorou mozno realizovat mnozstvo zaujimavych operacii. Jeden z najzaujimavejsich sposobov ako zredukovat celu maticu popisujucu "kto je koho friend" na mnozinu dat ktore nieco hovoria o celku kyberia systemu je pouzitie toho co je dnes zname ako PageRank Algoritmus. Info o tom ako to funguje si v pripade zaujmu istotne najdes na wikipedii (mne tu teraz nefrci mozilla a tuto odpoved Ti pisem v linkse , takze ziadne linky Ti sem nehodim, si kazdopadne dost sikovny na to aby si uz sledoval vyznacene stopy) Osobne si ziskane data interpretujem tak, ze pozicia v rebricku urcuje podstatnost dotycneho usera pre celok systemu (ktory je, opakujem, popisovany zatial iba pomocou jednoho kriteria ktorym je existencia friendslinku medzi X a Y). Cim vyssi pagerank (ktoremu si v hantyrke mojej miniteorie hovorim skor "importance"), tym vyssia mieru vplyvu ktory ma dotycna osoba na danu socialnu siet. A u rozumnych ludi plati taktiez - cim vyssia miera vplyvu, tym vyssia zodpovednost. Preto ludi na celnych prieckach uvedeneho rebricka povazujem za najvacsmi zodpovednych za NALADY ktore sa kyberiou sirili v obdobi v ktorom boli uvedene data dumpnute (okolo 6.7.2006). Osobne som presvedceny o tom ze cela vec vypoveda o vplyve dotycneho jednotlivca na celok systemu ovela viac ako pocet cifier v idcku na ktore sa tu ti slabomyselnejsi z vas zevraj uz niekolko rokov hraju. Vypocet page.ranku bol pokial sa nemylim realizovany s damping factorom 0.23 (alebo 0.42? alebo 0.77?...tazko riect :) |
| |||||||||||||||||||||||