čtvrtek 18. listopadu 2010

Pražská velká koalice a social network analysis

V posledním blogpostu jsem se tu vyznával k lásce k relativně nové vědní disciplíně jménem social network analysis. Teď se k ní opět vracím, protože mne přivedla k zajímavým obrázkům, které se týkají pražského magistrátu v minulosti, přitomnosti a zřejmě i budoucnosti. Nejdříve ale trocha teorie. Andrew Odewahn vytvořil před časem pozoruhodný projekt. Vizualizoval výsledky hlasování senátorů v americkém senátu během řady volebních období. Spojnici grafu pak stanovil tak, že senátor měl vazbu k jinému tehdy, pokud měli alespoň 65 procent stejných hlasování. Výsledek byl ohromující a můžete se na něj podívat třeba zde.

I napadlo mě udělat obdobnou analýzu i pro náš pražský magistrát. Na webu magistrátu sice nejsou výsledky hlasování k dispozici v strojově zpracovatelném formátu, ale díky šikovnosti programátorů se je podařilo stáhnout. Ondřej Nekola pak data z XML agregoval do GraphML, tedy formátu, se kterým je možné dál pracovat v NodeXL. Na rozdíl od Odewahna jsem nebyl na naše pražské konšele tak přísný a zvolil jsem hranici 75 procent shody v hlasováních. Proč tak vysoké číslo? Šlo mi o to, že v matici jsou započtena i hlasování o procedurálních otázkách. A teď ty výsledky?

Nejdřív surové grafy pro jednotlivé vlády


volební období 1998 - 2002


volební období 2002 - 2006


volební období 2006 - 2010

Co je na všech krásně vidět, je faktická roztříštěnost opozice na pražské radnici posledních 12 letech. Další informace ovšem vynikne, pokud v grafu ponecháme jen ty, co mají alespoň tři shody s ostatními. Vyloupnou se nám tak tvrdá hlasovací jádra.


volební období 1998 - 2002


volební období 2002 - 2006


volební období 2006 - 2010

Co z nich můžeme vyčíst? Především to, že v letech 1998 - 2006 tu vládla velká koalice. To není až tak zajímavé. Zajímavější ale již je, že ve všech třech obdobích byl na blízku vždy nějaký zastupitel komunistů, který rád pomohl s hlasováním. Dokonce i v období 2006 - 2010, kdy si zavdal jen jeden sociální demokrat. Podotýkám, že ačkoli komunisté nejsou oficiálně na magistrátu u moci, jejich role v kontrolním výboru je značná. Tolik k minulosti a přítomnosti.

Teď ale malá poznámka k budoucnosti. Nová koalice má velmi křehkou většinu, vzhledem k minulosti ale víme, že se umí domluvit a hlavně, že pokud bude zapotřebí, tak má zřejmě dobré zkušenosti s tichou podporou KSČM.

sobota 30. října 2010

Identifikace komunity kolem účtu na Twitteru

Jak je možná patrno z některých mých zmínek na Twitteru, poslední dobou se zabývám intenzivně oblastí Social Network Analysis. Vděčím za to Petru Lupačovi, upozornil mne totiž na blog Jana Schmida, který se právě SNA věnuje. V analýze sociálních sítí se fakticky potkává sociologie s teorií grafů a vytvářejí nádherná intelektuální dobrodružství, mající využití v celé řadě oblastí. Navíc díky pokročilým nástrojům může základní analýzu dnes dělat i člověk, neseznamený dopodrobna se zákoutími matematiky. Já jsem se po kratším zkoumání zatím zastavil u nástroje NodeXL, který funguje mimo jiné i jako šablona do Excelu a je šířen pod GPL licencí.

Z mnoha dosavadních experimentů mi zatím přišel nejnázornější příklad hledání komunit mezi lidmi propojenými kolem twitter uživatele Stonome. Účet patří mému domovskému akademickému pracovišti, má 96 následovníků a sám následuje 41 uživatelů. Při importu do NodeXL je třeba zvolit i natažení hran, propojující jednotlivé následovníky, a následované účty mezi sebou. Ostatně více se dočete v dokumentaci, která je ke stažení na stránkách projektu.

Výsledný graf pak vypadá například takto:



(klikni pro větší)

Na první pohled docela chaos, že? Nicméně pomocí SNA si lze v celé věc sjednat poněkud lepší pořádek. Nás v tomto případě zajímá, zda ve změti následovníků a následovaných existují nějaké relevatní komunity. To můžeme zjistit pomocí hledání klastrů v grafu. V našem případě jsem zvolil takzvaný Girvan–Newman algoritmus a výsledek vypadá o kousek lépe.



(klikni pro větší)

Barvy tu odlišují několik komunit, ale stále je to poněkud nepřehledné. Pro lepší výsledek tedy odstraníme z grafu samotný účet Stunome (jde nám o komunitu okolo něj, ne o něj samotný) a potlačíme všechny úzly, které mají tři a méně propojení s okolím. Výsledek teď vypadá o moc lépe:



(klikni pro větší)

Vcelku zřetelně se nám vydělila modrá skupina. Tu tvoří především studenti magisterského a doktorandského studia na SNM, potažmo UISKu. Vyjímky jsou případy členství v jiné komunitě, která se překrývá s komunitou SNM. Příkladem může být účet mého kolegy z práce aborym, propojený s účtem našich studentů adbara a zbiejczuka. Pěkně se také vydělila oranžová komunita lidí z "branže" jako je marek_baco a perlino. Zelené spojnice ukazují na dvě studentky prvního ročníku, které zatím do modré komunity vplouvají.

Jako finální perličku ještě můžeme náš graf obohatit o nějaké zvýraznění dominantnosti postavení ve skupině. NodeXL nabízí kupříklad eigenvector, který se snaží vyjádřit centrálnosti uzlů pro celek grafu. Tedy přibližně řečeno: kdo má nejvíce nejblíže ke všem ostatním. Výsledek aplikace vidíte na posledním grafu:



(klikni pro větší)

Krásné je, jak v modré komunitě dobře vidíme její husté propojení, zvlášť kolem studentů druhého ročníku, který v zásadě představuje hledané jádro studentů a učitelé SNM na Twitteru. Pokud se teď vrátíte k původnímu grafu musíte uznat, že pár tahy jsme se posunuli do velmi zajímavého místa, kdy jsme zcela formálním postupem rozklíčovali užitečnou informaci.

sobota 16. října 2010

Jak hledat telefonní čísla na Facebooku

Často se hovoří o problému bezpečnosti osobních dat na síti Facebook. Méně často se ale mluví o tom, že zneužitelná data musíte nejdřívě sami na Facebook dát a jeden se diví, co všechno jsou ochotni uživatele na svou zeď napsat. Já například zkusil hleda předčíslí mobilního čísla 608. (přímý link). Nestačil jsem se divit, kolik lidí píše na své zdi čísla mobilů. V kombinaci s tím, že mají většinou veřejné profily, jsou idealním terčem pro telesales... A to v lepším případě.

čtvrtek 29. července 2010

100 milionů facebookových účtů a jak to bylo ve skutečnosti

Média zachvátila horečka. Z Facebooku prý unikly údaje o 100 milionech uživatelů. O tempora o mores!. Zlí hackeři v akci. Jaká je ale realita? Nejsem odborník na bezpečnost, ale relativně se vyznám v data (web, text) miningu. V Ataxu Interactive mám na starost nejen projekt www.klaboseni.cz, ale hlavně vývoj produktu Ataxo Social Insider, který se právě monitoringu komunikace na sociálních sítí věnuje a to včetně data miningu. A tak jsem sedl, hledal a našel...

Pravda je banální. Počítačový odborník jménem Ron Bowes napsal malý program, který automatizoval stáhování dat o uživatelích Facebooku. Program to byl poměrně old school viz dále a Bowes nevyužil Open Graph API (to je limitováno 100 dotazy za hodinu na jednu IP adresu, mrk, mrk pane Dočekale), ale šel cestou, které se říka scrapování stránek. Zachoval se vlastně jako běžný internetový vyhledávač, jen se soustředil na Facebook. Stažené údaje publikoval prostřednictvím sítě torrentové služby. Údaje jsou samy o sobě neškodné, jen propojují jméno uživatele a čísla na FB. Jak to kdosi komentoval na Twitteru: v telefoním seznamu je o vás víc informací.

Momentálně je originální blogpost nedostupný, stejně jako zdrojový kód, který bylo použit. Proto jeho hlavní část přetiskuji z cache Googlu pod článkem. (až bude opět dostupný, smažu ho). Stejně jako jsem umístil na Paste Code zdrojový kód programu, který použil. Když si ho projdete, zjistite jediné: ten člověk měl prostě dobrý nápad jak strojově vyškrabat veřejně přístupná data. Mimochodem pokud je na jeho činnosti něco nelegální, proč rovnou nekřičet na Google nebo Yahoo? Navíc Yahoo Boss Search API vám zajistí přístup ještě luxusnější.

Co z celé pseudokauzy plyne? V zásadě nic nového:

- drtivá většina novinářů nerozumí tomu o čem píše (zdravím novinky.cz)
- pokud už mají aspoň elementární znalost, neobtěžují se jít ke kořenů věcí (pooh.cz)
- a konečně Facebook je dnes stejně milován bulvárem jako velká hudební stár a tak podobných mediálních kravin můžeme čekat ještě víc

To je vše.

P.S. A ještě slibená podstatná část původního blogpostu Rona Bowese:

Return of the Facebook Snatchers


Background

Way back when I worked at Symantec, my friend Nick wrote a blog that caused a little bit of trouble for us: Attack of the Facebook Snatchers. I was blog editor at the time, and I went through the usual sign off process and, eventually, published it. Facebook was none too happy, but we fought for it and, in the end, we got to leave the blog up in its original form.

Why do I bring this up? Well last week @FSLabsAdvisor wrote an interesting Tweet: it turns out, by heading to https://www.facebook.com/directory, you can get a list of every searchable user on all of Facebook!

My first idea was simple: spider the lists, generate first-initial-last-name (and similar) lists, then hand them over to @Ithilgore to use in Nmap's awesome new bruteforce tool he's working on, Ncrack.

But as I thought more about it, and talked to other people, I realized that this is a scary privacy issue. I can find the name of pretty much every person on Facebook. Facebook helpfully informs you that "[a]nyone can opt out of appearing here by changing their Search privacy settings" -- but that doesn't help much anymore considering I already have them all (and you will too, when you download the torrent). Suckers!

Once I have the name and URL of a user, I can view, by default, their picture, friends, information about them, and some other details. If the user has set their privacy higher, at the very least I can view their name and picture. So, if any searchable user has friends that are non-searchable, those friends just opted into being searched, like it or not! Oops :)

The lists

Which brings me to the next topic: the list! I wrote a quick Ruby script (which has since become a more involved Nmap Script that I haven't used for harvesting yet) that I used to download the full directory. I should warn you that it isn't exactly the most user friendly interface -- I wrote it for myself, primarily, I'm only linking to it for reference. I don't really suggest you try to recreate my spidering. It's a waste of several hundred gigs of bandwidth.

The results were spectacular. 171 million names (100 million unique). My original plan was to use this list to generate a list of the top usernames (based on first initial last name):

129369 jsmith
79365 ssmith
77713 skhan
75561 msmith
74575 skumar
72467 csmith
71791 asmith
67786 jjohnson
66693 dsmith
66431 akhan

Or first name last initial:

100225 johns
97676 johnm
97310 michaelm
93386 michaels
88978 davids
85481 michaelb
84824 davidm
82677 davidb
81500 johnb
77800 michaelc

Or even the top usernames based on first name dot last name (sorry, I can't link this one due to bandwidth concerns; but it's included in the torrent):

17204 john.smith
7440 david.smith
7200 michael.smith
6784 chris.smith
6371 mike.smith
6149 arun.kumar
5980 james.smith
5939 amit.kumar
5926 imran.khan
5861 jason.smith

Or even the most common first or last names:

977014 michael
963693 john
924816 david
819879 chris
640957 mike
602088 james
584438 mark
515686 jason
503658 robert
484403 jessica

913465 smith
571819 johnson
512312 jones
503266 williams
471390 brown
386764 lee
360010 khan
355639 singh
343220 kumar
324972 miller

So, those are the top 10 lists. But I'll bet you want everything!

The Torrent

But it occurred to me that this is public information that Facebook puts out, I'm assuming for search engines or whatever, and that it wouldn't be right for me to keep it private. Why waste Facebook's bandwidth and make everybody scrape it, right?

So, I present you with: a torrent! If you haven't download it, download it now! And seed it for as long as you can.

This torrent contains:

* The URL of every searchable Facebook user's profile
* The name of every searchable Facebook user, both unique and by count (perfect for post-processing, datamining, etc)
* Processed lists, including first names with count, last names with count, potential usernames with count, etc
* The programs I used to generate everything

So, there you have it: lots of awesome data from Facebook. Now, I just have to find one more problem with Facebook so I can write "Revenge of the Facebook Snatchers" and complete the trilogy. Any suggestions? >:-)

Limitations

So far, I have only indexed the searchable users, not their friends. Getting their friends will be significantly more data to process, and I don't have those capabilities right now. I'd like to tackle that in the future, though, so if anybody has any bandwidth they'd like to donate, all I need is an ssh account and Nmap installed.

An additional limitation is that these are only users whose first characters are from the latin charset. I plan to add non-Latin names in future releases.

sobota 29. května 2010

Výsledky crowdsourcingového výzkumu pro předpověď voleb do PSP

Konečně můžu uvolnit výsledky crowdsourcingového výzkumu, který jsme provedli se studenty Studia nových médií 18. května 2010. Cílem bylo jednak ověřit Surowieckého teorii o moudrosti davu a za druhé udělat kontrolní měření pro experimenty Adama Javůrka z projektu NextBig www.100chytrych.cz

Experiment SNM stál na 350 odpovědích náhodně získaných v ulicích Prahy. Otázka zněla: Které strany se podle Vás dostanou do parlamentu? A kolik získají procent. Po odfiltrování evidentních mašíblů zbylo 190 odpovědí. Pak už jsme jen spočítali výsledná čísla.






strananáš výzkumskutečný výsledek
ČSSD 27,322
ODS 24,620,2
TOP 09 12,716,7
KSČM 12,211,2
VV810,8


Předběžně: podařilo se nám trefit pořadí, procenta však nikoli. Otázkou je proč. Jednou z možností je, že lidé nemuseli nic investovat do svých odpovědí (například sázku) a tak projikovali svá přáním. Zkusíme to ověřit při podzimních volbách. O dalších poznatcích budu určitě informovat.

pátek 28. května 2010

The Mechanical Cinderella na GUGcampu

Před pár týdny jsme byl prezentovat Mechanickou Popelku na českém GUGcampu. Záznam prezentace je již dostupný na YouTubu a já ho zde jen vkládám.



čtvrtek 22. dubna 2010

Populární stránky podle Facebooku

Facebook spustil včera celou řadu nových funkcí, které narušují hranici mezi Facebookem a okolním webem. Pro mne osobně je velice zajímavá funkce Recommendations. Jedná se o jednoduchý widget, který má na vstupu URL webu a na výstupu seznam aktuálně nejvíc sdílených (a zřejmě i dobře hodnocených) stránek ze zadaného webu.

Zajímavé ale je, že nemusíte nutně vložit jen svoje URL, ale i cizí. Uvidíte tak seznam populárních podstránek webů, které vám nepatří. Vybírány jsou zřejmě buď podle vašich přátel v případě, že jste přihlášeni nebo z celého okruhu Facebooku. V praxi tak můžete například jednoduše testovat, které články ze zpravodajských serverů jsou momentálně nejvíce populární. Ve chvíli kdy píšu tenhle text, tak na Novinkách celkově kraluje článek Autorům South Parku hrozí smrt kvůli dílu s prorokem Mohamedem.

Pokud vás tedy zajímá, co zajímá dav, tak máte v ruce ideální nástroj. A Facebook zřejmě zase získal další střípek do mozaiky jménem personalizovaná reklama.



sobota 10. dubna 2010

Google: Na rychlosti záleží

Včera potvrdil oficiální blog Googlu, že rychlost načítání vaší stránky je součástí jejího rankingu a tudíž je důležitá pro umístění stránek ve vyhledávači. Zároveň doporučil několik nástrojů pro měření rychlosti načítání a případné návrhy jak načítání urychlit. Mezi nástroji je i funkce z Labu Google Webmaster Tools, která automaticky vytváří přehled o rychlosti stránek a to včetně porovnání s rychlostí jiných stránek v internetu.

Zároveň ale Google v postu uvádí, že změna se týká hodnocení méně než 1 procenta stránek a že je v provozu již několik týdnu. Jak tedy říká Matt Cuts na svém blogu: pokud si toho moc lidí do teď nevšimlo, tak to zas tak převratná změna není. Nicméně z mého pohledu by to mohlo přivést tvůrce stránek, aby se více zabývali na jakých serverech běží jejich aplikace a vyvinuli tlak na hostingové firmy směrem k zlepšení.

úterý 6. dubna 2010

Krize končí? Google si to nemyslí


Google Insight je služba, která dává uživatelům představu o tom, jak moc bylo klíčové slovo v minulosti hledáno na Googlu. Nabízí i komfortní zobrazení grafů a možnost filtrovat výsledky podle zemí a podobně. O užitečnosti této aplikace se můžete přesvědčit ve dvou studiích: americké Predicting the Present with Google Trends a německá Google Econometrics and Unemployment Forecasting.

V té první výzkumníci z Googlu ukazují, jak jsou si podobné křívky hledání z ekonomických oblastí a skutečné výsledky jednotlivých segmentů, ba co víc jak spolu vzájemně souvisí hospodářské výsledky firem a vyhledávání jejich výrobků. Podobnost jde tak daleko, že podle hledání jde předpovídat do jaké země budou lidé jezdit na dovolenou. Německá studie nás bude zajímat o něco více. Odborníci z Forschungsinstitut zur Zukunft der Arbeit v ní ukazují, jak hledání inzerátů práce dokáže přepovídat skutečný stav nezaměstnanosti v Německu. Jak to může fungovat? Poměrně jednoduše: co hledáme na internetu, hledáme z nějakých reálných důvodů. Pokud se poohlížeme po práci, zřejmě jí chcem změnit.

Mimochodem uvedené práce vznikaly před tím, než Google doplnil Insight o novou vlastnost, kterou je schopnost předpovídat jak se bude křivka hledání v budoucnu pohybovat v závislosti na svém minulém průběhu. Nechme stranou teorii, jak je to možné a zkusme se podívat na analytické možnosti, které tato volba nabízí v kontextu ekonomické krize. Dopředu říkám, že to nejsou data moc optimistická.

Začněme nejdříve bez předpovědí. Podle informací, které přinesl server Novinky, v roce 2009 překročil počet exekucí 1.000.000, v roce 2008 to bylo 550.000 a v roce 2007 428.000.

Pokud se podívate na křivku hledání slova "exekuce", tak zcela věrně kopíruje tento trend.





Leden 2010 má skoro dvojnásobek hledání oproti lednu 2009.

To ovšem není vše. Podívejme se, jak vypadá hledání klíčového slova "volná místa" i s předpovědí:





Vidíme, že předpověď ukazuje víceméně stejný průběh pro rok 2010, jako byl v roce 2009. Podobně stagnuje i trend pro klíčová slova "hledám práci"







Pro rok 2010 nás tedy podle Googlu žádné zlepšení nečeká. Začínáme skoro na deseti procentech nezaměstnaných a stejně tak s nimi i zřejmě skončíme. Mimochodem v tom se Google Insight shoduje i s předpověďmi ekonomů. Pokud chceme nepřímé potvrzení této teorie, tak můžeme zkusit vyhledávání slova "psycholog". Je obecně známo, že v době krize roste potřeba psychologické porady, takže pokud je zde zřejmá souvislost, měl by s ní souviset i počet hledání psychologů. Je to tak? Je!





Dobře: čeká nás rok nezaměstnanosti a šetření. Jak to bude vypadat? Kupříkladu lehce poklesne zájem o dovolené:






a v Egyptě se jich zřejmě bude konat o něco míň:






A opět: analytici si to myslí také,

Vyhlídka jsou to nevábné. Na faktu, že letošní rok nebude o nic lepší než minulý, ba zřejmě o něco horší nic nezmění ani volby. Možná o to pečlivěji bychom se měli rozhodovat.

Na závěr se ale sluší dodat nějakou tu pozitivní zprávu. Zkusím to: pokud skutečně fungují předpovědi a měření na základě našeho hledání ve vyhledávačích, dostáváme zajímavý a důležitý klíč ke kolektivnímu vědomí a to je fajn.

P.S. Data jsem sbíral 5.4. 2010 Google je může dál zpřesňovat a měnit.

pondělí 22. března 2010

Google přestal s cenzurou v Číně

Google přestal dnes cenzurovat výsledky hledání ve své čínské mutaci na adresa www.google.cn. Splnil tak své výhružky a navíc velice elegantně. Zájemce o hledání přesměruje na svou hongongskou verzi, která není cenzurovaná. Ve finále to tedy bude Čína, kdo zamezí hledání na Googlu, nikoli společnost sama. Elegantní. Další informace najdete na oficiálním blogu Googlu.

pátek 19. března 2010

Filmy zdarma III. - Surrealismus

Dnešní filmový pátek věnujeme surrealismu a jeho hlavním protagonistům ve filmu. Luise Buňuel, Salvador Dalí, René Clair a Man Ray jsou naši dnešní hrdinové. Černým koněm vzadu pak Walt Disney, který inicioval společná projekt se Salvatorem Dalí v roce 1946 pod názvem Destino. Ten byl dokončen až v roce 2003 a režii se ujal Dominique Monfery.


Entr'acte (1924)
Režie: René Clair
http://video.google.com/videoplay?docid=-1790665857858342084
http://www.imdb.com/title/tt0014872/
IMDB: 7.7/10

L'Étoile de mer (1928)
Režie: Man Ray
http://www.youtube.com/watch?v=PODxAXZqfKU
http://www.youtube.com/watch?v=EClBiWiMIGo&feature=related
http://www.imdb.com/title/tt0146367/
IMDB: 7.5/10

Un chien andalou (1929)
Režie: Luis Buñuel a Salvador Dalí
http://video.google.com/videoplay?docid=3629815223183267424
http://www.imdb.com/title/tt0020530/
IMDB: 8.0/10

L'Âge d'or (1930)
Režie: Luis Buñuel a Salvador Dalí
http://video.google.com/videoplay?docid=7633509394552540790
http://www.imdb.com/title/tt0021577/
IMDB: 7.7/10

Destino (2003)
Režie: Dominique Monfery
http://www.youtube.com/watch?v=UzzZa5o1q5k
http://www.imdb.com/title/tt0377770/
IMDB: 8.1/10

neděle 14. března 2010

Testuje Google nový design?

UPDATE: Tak z mého počítače se lze na nový design dostat přes tuto URL: http://www.google.com/webhp?hl=en&safe=off&aq=f&aqi=g10&oq=

Původní text: Před malou chvilkou se mi objevily výsledky hledání na Google v tomto designu:



Ale už je to zase pryč. Zdá se, že Google přikračuje k dalšímu redesignu. Uvidíme.

Google cenzuruje hledání hlasem

Minulý týden se objevila možnost posílat buzzy prostřednictvím Google Voice Search. Funguje to i na iPhone, pokud máte aplikaci nainstalovánou. Neodolal jsem a vyzkoušel to. Princip je prostý, stačí říct "post buzz" a pak svůj post. GVS rozpozná, že mu dáváte pokyn k buzzování a přepíše vaše slova. Jaké překvapení mne ale čekalo, když jsem zkusil postnout nespisovný výkřik: "You motherfucker!"




Vidíte? Google nahradil slovo "fucker". Po chvilce experimentování jsem zjistil, že se to netýká jen postování buzzů, ale také vyhledávání slova jako motherfucker, fuck off či piece of shit prostě tohle cestou nenajdete:



pátek 12. března 2010

Filmy zdarma II. - Ruská avantgarda

Je tu pátek a s ním pokračování seriálu o filmech volně dostupných na serverech Googlu. Dnes jsem pro vás vyhledal porci ruské filmové avangardy a jejich hlavních akterů: Ejzenštejna, Pudovkina a Vertova. Doufám, že se vám budou líbit.

Броненосец Потёмкин / Battleship Potemkin (1925)
Režie: Sergej Ejzenštejn
http://video.google.com/videoplay?docid=-1630669376406423668&ei=wB-aS6D1MZnk2gLhyuD3DA&q=potemkin&view=3&dur=3#
http://www.imdb.com/title/tt0015648/
IMDB: 8.1/10

Октябрь / October (1928)
Režie: Sergej Ejzenštejn
http://video.google.com/videoplay?docid=1264898891656456473&ei=KyGaS8aNCJCM2ALb_JH8DA&q=eisenstein&view=3&dur=3#
http://www.imdb.com/title/tt0018217/
IMDB: 7.8/10


Стачка / Strike (1925)
Režie: Sergej Ejzenštejn
http://video.google.com/videoplay?docid=-5619972126280085254&ei=5yGaS9WeJJvu2AKxgcHeDA&q=eisenstein&view=3&dur=3#
http://www.imdb.com/title/tt0015361/
IMDB: 7.8/10

Мать / Mother (1926)
Režie: Vsovold Pudovkin
http://video.google.com/videoplay?docid=-7787303432302951458&ei=_R-aS-n9OY-M2ALUyeXuDA&q=Pudovkin&view=3&dur=3#
http://www.imdb.com/title/tt0017128/
IMDB: 7.8/10

Человек с Киноаппаратом / Man with A Movie Camera (1929)
Režie: Dziga Vertov
http://video.google.com/videoplay?docid=-2809965914189244913&ei=KiCaS7fNL5zw2ALkq7j-DA&q=Dziga+Vertov&view=3&dur=3#docid=-7991379281115932333
http://www.imdb.com/title/tt0019760/
IMBD: 8.3/10

pondělí 8. března 2010

Nejhledanější slova v našeptávači Seznamu podle abecedy

Z mých předchozích blogpostů je asi už poznat, že mne baví data, která o světě kolem vypovídají vyhledávače a především Google. Dnes jsem se ale zaměřil na Seznam a konkrétně na jeho službu Našeptávač. Tu Seznam sám definuje takto:

"Seznam si zpracovává statistiky o hledanosti jednotlivých slov a sousloví. Zjistili jsme, že mnozí uživatelé ocení možnost místo psaní celého slova vybrat myší nebo klávesnicí dotaz, který již někdo jiný položil. Po zadání několika prvních písmen dotazu pod vyhledávacím polem proto automaticky vypisujeme nejčastěji hledané varianty s uvedeným počtem vyhledávání." Když dodává, že "Nápovědy řadíme podle kombinace různých faktorů, z nichž nejdůležitější je hledanost daného dotazu." s tím, že vynechává vulgarismy a podobně. (zdroj)

Zajímalo mne, jaká jsou tedy ta nejvíc hledaná slušná slova a tak jsem i pro vás připravil jejich seznam podle abecedy (vždy maximálně prvních deset ke každému písemenu). Interpetaci ponechám na čtenářích, byť zastoupení různých způsobů jak nalézt porno je nepřehlédnutelná:-)

a
aukro.cz, aukro aukce online, aukro, auto kelly, autobazary, annonce.cz, atlas.cz, aha, avizo, asko nábytek,
b
bazos, blesk, bazos.cz, brigády, blesk.cz, bazar, badoo, barbie hry, babicovy dobroty recepty, bonprix katalog 2010,
c
centrum.cz, comeback, csfd, centrum, csob, ceska sporitelna cz, cestovní kanceláře, citáty, chaty a chalupy, cinestar,
č
česká spořitelna, česká televize, česká pošta, čt, česká spořitelna servis 24, čsob banka, čt 1 archiv pořadů, čt1, česká pojišťovna, čez,
d
dlouha videa, dlouha videa.cz, dlouha videa zdarma, daňové přiznání za rok 2009, divokekmeny.cz, dvd v novinách a časopisech, dlouhavidea.cz, dsl mereni rychlosti internetu, dlouhodoba predpoved pocasi, dm drogerie,
ď
ďáblova bible, ďábel nosí pradu, ďáblův advokát, ďáblova dílna, ďábel nosí pradu ke shlédnutí, ďáblova lest, ďáblice, ďábelská topinka, Ďábelská garda, ďábel medvědovitý,
e
exim tours, elektroworld, email, evropa 2, exim tours 2010, egypt, evropa 2 online, ebay.com, elektro, email.cz,
f
facebook, facebook.com, freevideo, filmy online, freefoto, free video, filmy, facebook přihlášení, facebook.cz, filmy ke shlédnutí zdarma,
g
google, google.cz, ge money bank, google překladač, ge money bank internet banka, google.com, gladiatus, google mapy, grepolis, gelové nehty,
h
hry, hry online, hry pro dívky, hry zdarma, horoskopy, hry pro nejmenší, hry ke stažení zdarma, hry pro dva, herna, hyperinzerce.cz,
i
idos, idnes, ikea, idos jízdní řády, inzerce zdarma, idos jízdní řády autobusů, icq, idnes.cz, inzerce, ikariam,
j
jízdní řády, jízdní řády autobusů, justice.cz, jobs.cz, justice, jak se staví sen, jízdní řády vlaků, jarní prázdniny 2010, jarní bundy, jízdní kola,
k
katastr nemovitostí nahlížení, katastr nemovitostí, komerční banka, kinotip.cz, kočárky, kuchyně, karaoke texty, karaoke, kurzy měn, kinotip,
l
libim se ti, libimseti.cz, lide.cz, libimseti, lide, letáky, levné pneu, lékárna, letenky, lego,
m
mimibazar, mp3 ke stazeni zdarma, mimibazar.cz, mp3, mobilní telefony, mapy.cz, motorkari.cz, motoinzerce, mp3s.nadruhou, mapy,
n
nova.cz, nokia, nova, nabídka práce, nahlížení do katastru nemovitosti, notebooky, nábytek, nokia 5230, nokia 5800, nejlevnejsipneu.cz,
ň
ňadra, ň, ňadra ivety bartošové,
o
obchodní rejstřík, online hry zdarma, o2, ordinace v růžové zahradě 2, obrázky, ordinace v růžové zahradě poslední díl, onlinovky, obrázky na profil, osobnosti.cz, o2 telefonica,
p
práce, poštovní spořitelna, počasí, prima tv, překladač, prace.cz, poslat sms zdarma, půjčky, přání k narozeninám, parfémy,
q
quelle katalog 2010, quelle, qip, quelle výprodej, queens shop, quiksilver, quelle katalog 2010 online, queens, qip download, quiksilver.cz,
r
redtube, redtube.com, recepty, rozzlobenimuzi.com, rychlost připojení k internetu, reality.cz, radio online, reality, renault.cz, raiffeisen bank,
ř
řecko, řidičský průkaz, řidiči volná pracovní místa, řím, říčky v orlických horách, řecko 2010, řemeslné živnosti, řez ovocných stromů, řez vinné révy, řidič,
s
sms zdarma, superhry, sms zdarma na o2, seznamka, stahuj.cz, sms zdarma na t mobile, superhry.cz, sms, seznamka štěstí, sportka aktualni vysledky,
š
štěstí osudová seznamka, škoda auto, škoda, škoda auto cz, škoda octavia, špindlerův mlýn, šaty, šíp, škoda fabia, šperky,
t
tv program, tn.cz, t mobile.cz, tv nova, tipsport, t mobile, tapety na plochu, tipcars.cz, tn cz nova, telefonní seznam,
ť
Ťupa, ťuhýk obecný,
u
uloz to, ulozto.cz, úřad práce, ulož to cz, uloz.to, ulozto, ulice, účesy, úřad práce ostrava, úřad práce brno,
v
vodafone.cz, vodafone sms zdarma, videa zdarma, vodafone, vtipy, vysoké školy, volná pracovní místa, volny.cz, velikonoční dekorace, velikonoce,
w
www.superhry.cz, www.facebook.com, www.aukro.cz, www.nova.cz, wikipedia, www.tn.cz, www.centrum.cz, wikipedie, www.google.cz, www.odmenazadobiti.cz,
x
xvideos.com, xvideos, xchat, xhamster.com, xchat.cz, xbox 360, xhamster, x lander, xzone, xicht.cz,
y
youtube.com, youtube, you tube, youtube broadcast yourself, youtube videa, youtube com videa, yutobe, yamaha, ytong, yahoo.com,
z
zlaté stránky, zelená úsporám, zelene imperium, zákoník práce, zlaté stránky telefonní seznam, zboží.cz, zhlednito, zakulisi, zoo praha, zákoník práce 2010,
ž
živnostenský rejstřík, životopis vzor, životopis, živnostenský zákon, žaluzie, živnostenský úřad, živnostenský list, žehlička na vlasy, žena, ženy v pokušení,


pátek 5. března 2010

Filmy zdarma na YouTubu a Google Videu - část I.

K pátečnímu večeru patří buď hospoda nebo pěkný film. Do hospody dnes nejdu a proto jsem pro milovníky kvalitních filmů začal vytvářet nepravidelný seriál. Pokusím se v něm zmapovat alespoň část celovečerních snímků dostupných veřejně na serveru YouTube a Video Google. Dnes začínáme porcí německé klasiky: Leni Riefenstahl, F.W. Murnau, Fritz Lang, Robert Wiene a jejich celosvětově slavné snímky:

Triumph des Willens (1935)
Režie: Leni Riefenstahlová
http://www.youtube.com/watch?v=LPAxaFxjiDk
http://www.imdb.com/title/tt0025913/
IMDB: 7.8/10

Nosferatu (1922)
Režie: F.W. Murnau
http://www.youtube.com/watch?v=rcyzubFvBsA
http://www.imdb.com/title/tt0013442/
IMDB: 8.1/10

Das Cabinet des Dr. Caligari (1920)
Režie: Robert Wiene
http://www.youtube.com/watch?v=xrg73BUxJLI

http://www.imdb.com/title/tt0010323/
IMDB: 8.1/10

Faust - Eine deutsche Volkssage (1926)
Reže: F.W. Murnau
http://video.google.com/videoplay?docid=7688523464781787807#
http://www.imdb.com/title/tt0016847/
IMDB: 8.0/10

M - Eine Stadt sucht einen Moerder (1931)
Režie: Fritz Lang
http://www.youtube.com/watch?v=_O_ldOK3dDE

http://www.imdb.com/title/tt0022100/
IMDB: 8.6/10

Google Chart API umí renderovat vzorce z TeXu

Tohle je drobnost, která potěší: Google Chart API umí renderovat vzorce zapsané v TeXu do obrázku. Podrobnosti v dokumentaci zde: http://code.google.com/intl/ja/apis/chart/docs/gallery/formulas.html

čtvrtek 4. března 2010

Vyhledávače jako nástroje pro měření sémantické podobnosti a vzdálenosti slov

Na zkoušku z informační vědy jsem se pokusil dat dohromady teoretické pozadí Mechanické Popelky a vůbec nastínit tak základní směr mé dizertační práce. Pokud to někoho zajímá, tak práce je dispozici zde: Vyhledávače jako nástroje pro měření sémantické podobnosti a vzdálenosti slov. Budu rád za poznámky, nápady etc. Naopak doufám, že někomu bude text k užitku.

úterý 2. března 2010

Google našeptávač aneb o čem ženy sní

Dan Ariely je můj oblibený vědec. Pokud tohoto izraelského profesora ekonomie neznáte, pak si pusťte jeho famózní TEDtalk nebo kupte jeho knihu Predictably Irrational (česky vyšel dokonce její překlad pod neuvěřitelným názvem Jak drahé je zdarma?) Ariely se věnuje tzv. behavioralní ekonomii, která se zabývá nejrůznějšími faktory, které vytvářejí naše ekonomická rozhodnutí. Díky tomu se Ariely kouká často dost neobvklým směrem a využívá podivné metody. Jednou z vtipných je využití našeptávače Googlu (Google Suggest) pro určení našich preferencí.

Našpetávač Googlu během psání dotazu doplňuje jeho možné varianty podle nejčastěji hledáných frází. Ariely ho využil pro hledání toho co hledají manželé a manželky o svých protějšcích a výsledky byly minálně vtipné viz jeho blog. Neotřelé metody se chytli další a pozoruhodné úlovky můžete najít třeba zde. Ariely na blogu také upozornil na krásnou službu, která se jmenu Web Seer, která nabízí vizualizaci průniku mezi dvěma napovědami. Mimochodem průnikem fraze "Obama is" a "Bush is " je fráze "is idiot" a "is antichrist."

Pokud byste takovéto využití Google našeptávače považovali za lehkovážné, tak mám pro vás čtení na delší večer. Projděte si studie na toto téma na Scholar Google. Uvidíte jak lze search query využívat na sto způsobů. Není to tak humorné, nicméně rozhodně důvtipné.

neděle 28. února 2010

Ikony pro Google Maps zdarma

Na adrese http://code.google.com/p/google-maps-icons/ naleznete více než 900 ikon pro vlastní mashupy nad Google Maps nebo Google Earth. Ikony jsou uvolněné pod licencí Creativ Commons. Myslím, že se to určitě někdy bude někomu hodit.

sobota 27. února 2010

Jak monitorovat buzzy psané česky

Pokud chcete monitorovat pouze a jen české Buzzy, můžete k tomu využít hack Dannyho Sullivana z předchozího postu. Je třeba jen trochu upravit volanou URL. Česká mutace Google.cz totiž neobsahuje možnost sledovat updates, anglická zase nenabízí snado volbu "jen stránky v českém jazyce." Po chvilice hraní ale dosáhnete kýženého výsledku:

http://www.google.com/search?hl=en&tbo=1&tbs=mbl%3A1&q=site%3Agoogle.com&lr=lang_cs&aq=f&aqi=&aql=&oq=

Jedinou drobnou chybou je, že na stránce nefunguje korektně běžící stream s texty, jste tak odkázání na reloadování stránky. Samozřejmě můžete také buzzy prohledávat. Můj vlastní buzz se ve streamu objevil do jedné minuty od jeho odeslání.

UPDATE: Podle výsledků se zdá, že Google klade důraz nejen na jazyk buzzu, ale také na většinový jazyk profilu.

pondělí 15. února 2010

Jak hledat v Google Buzzu


Předpokládám, že jste nepřehlédli spuštění sociální sítě Googlu pod názvem Google Buzz. Buzz nebo Hlášky, které se objevily v Gmailu automaticky všem uživatelům jsou a ještě budou předmětem vášnivých debat kvůli problematice zabezpečení osobních dat. Mne však mnohem víc zajímalo jak v Google Buzz globálně vyhledávat, jak si vede Buzz v porovnání s Twitterem a jak v browseru zobrazovat mapu s buzzy, tak jako na mém iPhonu. Odpověď na první dvě otázky naznačuje veterán zkoumání Googlu Danny Sullivan ve svém postu na Buzzu.

Na otázku jak hledat v Google Buzz odpovídá neuvěřitelně krásným hackem, stačí k tomu zadat následující url

http://www.google.com/search?q=site:google.com&tbs=mbl:1


nebo v anglické verzi zvolit zobrazování Updates pro operátor site:google.com. Jednoduché a krásné. Google Buzz běží na Google doméně, tudíž stačí autorefenčně nechat Google prohledávat sebe sama.

Druhá otázka, totiž jak je Buzz využívaný, je trochu složitější. Sullivan ale tvrdí, že zkoušel porovnávat několik výsledku dotazů na doménu google.com a twitter.com a zdá se mu, že na stejná klíčová slovo vrací Google Buzz přibližně 1/4 výsledků Twitteru, což by bylo na službu, která právě startuje fantastické číslo.

Pokud jde o otázku jak zobrazit mapu s Buzzy z okolí jak jí známe z mobilních telefonů, tak řešení nabízí buzz Philippa Wyssena, který přináší návod jak v browseru spustit mobilní verzi.

Postup je triviální (odzkoušeno na Firefoxu):

1. Jděte na http://m.google.com/app/buzz (ujistěte se, že jste přihlášeni do Google / Gmail)
2. Klikněte na tlačítko "Continue on an unsupported device."
3. A je to! Můžete použít mobilní verzi služby Google Buzz

Vyzkoušejte to, určitě je to zajímavé řešení, dokud nebude k Buzz slušné API.

středa 3. února 2010

K čemu je dobrá Mechanická Popelka

Ve svém vstupu na pražském TEDx loni v prosinci jsem hovořil o přeměně internetu ze sítě v mraveniště a s tím spojeném nástupu principů kolektivní inteligence či kolektivního vědomí. Jako jeden z nejjednodušších příkladů, který zároveň dobře ukazuje, co se mění, mi posloužil příběh o Popelce, která uměla roztřídit značky internetových firem a značky výrobců aut, aniž by k tomu potřebovala vědět cokoli o autech nebo o internetovém obchodu. Jediné, co potřebovala, byla kalkulačka, okénko vyhledávače Google a znalost teorie pravděpodobnosti.

Většině přítomných to přišlo jako lehká magie, proto jsem vytvořil stránky s názvem Mechanická popelka (http://www.mechanicalcinderella.com/), kde si můžete tutu jednoduchou metodu ověřit sami. Základem není tentokrát Jaccardův index, o němž jsem mluvil v přednášce, ale sofistikovanější "normalized Google distance". Také tento vzorec vychází ze vztahu samostatných výskytů slova a jeho souvýskytů, avšak doplňuje jej trochou komplikovanější matematiky. Podrobnosti si můžete přečíst v původní studii autorů vzorce Rudiho Cilibrasiho a Paula M. B. Vitanyiho.

Naše Popelka na TEDx měla za úkol roztřídit tyto značky: Google, Yahoo, Microsoft, BMW, Chevrolet a Jaguar. (Máme jen pět políček, a tak ponecháme Microsoft stranou, za což se mu omlouvám). Jak si poradí naše Mechanická Popelka? Výsledek můžete vidět zde. Čím je číslo v tabulce nižší, tím silněji jsou spolu slova spojována, tím mají k sobě blíže. Čísla se mohou pohybovat v intervalu 0 až přibližně 1,4. Díky barvičkám na první pohled vidíme dva silné shluky. Prvním je Google a Yahoo, druhým pak naši výrobci automobilů.

Nabízí se otázka, k čemu je taková věc "normálnímu člověku" dobrá. Otázka je to naprosto oprávněná a souvisí s tím, jak se mění náš přístup k internetu. Pokud začneme chápat internet jako jakési kolektivní vědomí, pak se naše Popelka může stát jedním ze způsobů jak se ho ptát. Dejme tomu že chceme vědět, se kterou z následujících zemí máme nejsilněji spojené slovo "dovolená":

ChorvatskoBulharsko Rusko Polsko Angola
dovolená 0.28532696 0.31441792 0.638793 0.67618915 1.31600954


Vidíme, že nejlépe dopadlo Chorvatsko, následované Bulharskem. Naopak Angola pro nás rozhodně s dovolenou spojena není. Další možností je podívat se, nakolik máme s výrobci spojené jejich výrobky, případně i hodnocení "nejlepší" a "nejhorší". Podotýkám, že nejde o nějaké objektivní vyhodnocení kvality, ale o to, jak jsou daná slova spojena s příslušnými značkami v našem kolektivním vědomí.







Acer Asus Dell Sony
netbook 0.35800007 0.3266841 0.45478901 0.47944917
notebook 0.26631807 0.40387194 0.4695783 0.37106721
best 0.82109866 0.77081225 0.49510104 0.45805274
worst 1.05309145 1.08005446 1.03558973 0.95438995

Všiměme si, že Acer a Asus jsou silně spojeny s pojmy "netbook" a "notebook". Pokud však jde o pozitivní emoci spojenou se značkou, vítězí značky Dell a Sony. Co se týče negativního hodnocení, to je u všech značek podobně slabé. Jinými slovy: žadná není automaticky považována za špatnou, ale Dell a Sony jsou spojeny s větší kvalitou. Opět zdůrazňuji, že je řeč o kolektivním vědomí uživatelů netu, nikoli o objektivním faktu. Že jedna a tatáž značka k sobě může poutat silné pozitivní i negativní emoce, ostatně dokládá následující porovnání:





Apple Microsoft Google
good 0.70586178 0.74145629 0.81755285
bad 0.69155598 0.79771654 0.8291063
worst 0.77489962 0.87146646 0.96386942
best 0.55691428 0.69787407 0.60119018


Je zde dobře znát, že Apple k sobě váže kladné i záporné emoce silněji než zbylé dvě společnosti, což ostatně potvrzuje i naše běžná intuice.

Jak je vidět Mechanical Cinderella v sobě skrývá mnohem více možností než jen třídění. Záleží jen na představivosti každého uživatele, co z ní dokáže vyčíst.

pátek 29. ledna 2010

Bing je nejlepší vyhledávač on-line porna na světě


Dnešní tip pro hledání se týká nejambicioznějšího konkurenta Googlu, společnosti Microsoft a jeho vyhledávače Bing. Jak známo, tak Bing sází především na takzvané vertikální hledání, tedy hledání v znalostních doménách. Ukazuje se, že se nevyhýbá i poněkud netradičním doménám jako je například on-line porno. Co to v praxi znamená?

Pokud nastavíte v Bingu jako svou domovskou zemi Spojené státy, vypnete bezpečné hledání a necháte vyhledat video kupříkladu pro klíčové slova "MILF blonde", zobrazí se vám řada výsledků, které rozhodně nejsou vhodné pro osoby mladší 18 let. Zajímavě ovšem demonstrují pěkné vychytávky vyhledávače. Můžete použít filtry typ formátu filmu, jeho délky či kvality nahrávky. Nejzajímavější funkce je ovšem videonáhled: pokud najedete na klip myší, tak se spustí krátká ukázka, včetně zvukové stopy. V případě výsledků z ne-bezpečného hledání doporučuji ovšem vypnout v kanceláři zvuk.

Zdá se, že chlapci v Microsoftu prostě a jednoduše vsadili na známé heslo: Internet is for porn.

úterý 26. ledna 2010

Náhledy dokumentů v Google Docs

Obrázek vydá za tisíc slov, prý. Rozhodně se tím řídí v Googlu a tak do své aplikace Google Docs čerstvě přidali zobrazení seznamu dokumentů ve formátu náhledu. Z mého pohledu je to docela užitečné, zvlášť při skladování PDFek. Volba je dostupná v seznamu souborů vpravo nahoře.



Zdroj: Google Docs Blog - A thumbnail is worth about one hundred words

Google Reader začal sledovat i změny stránek

Když jsem si jednou měřil čas, který strávím u aplikací firmy Google, vyšel mi Google Reader jako druhá nejdůležitější aplikace po GMailu. Ano, hledání bylo třetí. Důvod je celkem jednoduchý: plné zaužívání RSS kanálů na internetu odsouvá hledání postavené na mé aktivitě směrem k "televiznímu" principu ve kterém konzumujete novinky na svých oblíbených serverech ve své čtečce.

Nyní bude tato konzumace mnohem zase o něco jednodušší. Google oznámil spuštění nové fičurky v Google Readeru, kterou je sledování změn statických stránek. Postup je poměrně jednoduchý. Po kliknutí na poličko "Add a subscription" zadáte místo url RSS kanálu adresu stránk, kterou chcete sledovat. Google se ještě ujistí, že chcete kanál změn skutečně vytvořit a je to.



pondělí 25. ledna 2010

Google Chrome 4 Stable je venku. Pro windows

Oficiální Google Chrome Blog dnes oznámil vydání stabilní verze Chrome 4 a hrdě se prsí více než 1,500 novými vylepšeními dostupným skrze rozšíření dostupných v Google Chrome Extension Gallery.

Mohl by to býti důvod k radosti, ale pro mne není. Mám totiž Maca a tak s uživatelskou recenzí ještě chvílku musím počkat a maximálně se u toho čekání koukat na video:



neděle 24. ledna 2010

Je budoucnost Bingu v kuchařských receptech?

Ačkoli Google stále vykazuje naprostou nadvládu v hledání na internetu, jeho hlavní rival Microsoft Bing to nevzdává. Na serveru Search Engine Land vyšel zajímavý rozhovor s šéfem Bingu Stefanem Weitzem, v kterém se zmiňuje o možnostech Bingu v tomto konkurenčním boji. Říká v něm mimo jiné, že je důležité znovu promyslet co znamená relevantní výsledek. Podle Weitze vyhovoval systém PageRanku v dobách ranného internetu, dnes se ale mění požadavky. Pokud kupříkladu hledám odpověď na otázku po nejlepší nemocnici k léčbě rakoviny, nedává smysl si myslet, že mne zpětné linky na stránku pomohu, říká Weitz.

Svým způsobem má jistě pravdu. Zdá se, že Microsoft Bing se bude snažit zacílit své snažení právě na lepší identifikaci toho, co svým dotazem uživatel sleduje, než co přesně píše do vyhledávače. To potvrzují i Weitzova slova: "Relevancy is relative. It is about the intent of the user, first of all. What is the user trying to do? Then, secondly, what do you know about the user or the query that could help to better refine the results? Again, don’t think about results as more links. Result could be an answer. The weather in Seattle is a fairly canonical answer. Relevancy could be canonical. Relevancy could be definitive, where we know 99% of people ultimately go for this type of answer."

Do této logiky zapadá i větší soustředění na vertikální hledání, které sebou Bing přináší. Včetně rétoriky o Bingu jako nástroji rozhodování (viz link u výsledku hledání
Nastavit službu Bing jako nástroj pro rozhodován). Otázka je jak úspěšná bude tato strategie, nicméně už nyní nese své ovoce a to skoro do slova. Bing spustil totiž další vertikálu: hledání kuchařských receptů a to se vždycky hodí.:-)

P.S. Upravil jsem název svého blogu. Slovo převážně jsem doplnil po důkladném zvážení, co vše přináší konkurenční vyhledávače. V budoucnu se proto můžete těšit i na Tipy a triky pro Bing a další.

pátek 22. ledna 2010

Google blog se přiblížil Wordpressu

Google nově umožnil uživatelům serveru Blogger.com přidávat krom blogpostů i statické stránky s kontakty či dalšími informacemi. Google blog se tak o něco více přiblížil Wordpressu, což není špatný tah. Pro rychle vytvoření stránek od kterých očekávate několik základních informací a blogpostovací plochu, což popravdě bývá nejčastější požadavek, je to ideální volba. Navíc Google Blog lze spustit na vlastní doméně a tak ho lze pro menší projekty pustit i na "pěkné adrese". Nová funkcionalita je dostupná při vstupu přes Blogger in Draft.

Oficiální popis společnosti Google: What Are Pages?

středa 20. ledna 2010

Ukládej a sdílej MP3 (a cokoli jiného) přes Google Docs

Dnes ráno na mne v Google Docs vybaflo nové okénko:



neváhal jsem a vyzkoušel. Jak jinak než na obsahu poměrně choulostivém: mp3. Bez problému jsem uploadoval pět mp3 souborů. To ale není vše. Ve výpisu jsem objevil, že i pro MP3 soubory je povolená možnost Share, neboli sdílení.




Co myslíte? Ano, bez problému jsem nasdílel mp3 soubor s kolegou. Jinými slovy GDrive je realitou právě teď. Velikost souboru je omezena na 250 MB a celkově máte k dispozici 1GB. Za mizeny 0,25 dolaru za 1 GB si můžete ovšem dokoupit místa co hrdlo ráčí.

Rapidshare má teď asi trochu mrzení.

UPDATE: zdá se, že nová fičůra se objevuje postupně, takže pokud ji nevidíte ve svém rozhraní, počkejte.

úterý 19. ledna 2010

Microsoft: Opusťte Internet Explorer 6 a Windows XP

Jak upozornil server ars technica, společnost Microsoft oficiálně vyzvala své zákazníky, aby okamžitě opustili prohlížeč Internet Explorer 6 a platformu Windows XP. Důvodem je bezpečnostní chyba v Internet Exploreru 6, která zřejmě napomohla útoku na servery společnosti Google.

Ve vyjádření na stránkách Technet Blogs je instrukce popsána poměrně lakonicky: "We recommend users of IE6 on Windows XP upgrade to a new version of Internet Explorer and/or enable DEP. Users of other platforms are at reduced risk. We also recommend users of Windows XP upgrade to newer versions of Windows." S tím, že chyba využitá hackery je přítomná ve všech verzích prohlížeče Internet Explorer ("All versions may crash after opening the attack code. However, there are a number of ways to limit the attack to an IE crash and prevent attacker code execution.") a uživatelé mají buď v ostatních vypnout JavaScript a nebo povolit politku DEP. (Podrobnosti viz Technet Blogs.) Záplata bude vydána, zda i pro Internet Explorer 6 není jasné.

Těžko odhadnout, kdo bude vítězem a poraženým v tomhle boji. Pokud ale bude poraženým Internet Explorer 6, tak se mnoha tvůcům webu uleví.

pondělí 18. ledna 2010

Video CNET: Popis útoku Číny na Google



Francie se přidala k Německu: nepoužívejte Internet Explorer

Zdá se, že trable Internet Exploreru nekončí. K německému varování se přidala i Francie. Varování před bezpečnostní chybou se týká všech verzí Internet Exploreru na platformách Windows XP, Vista i 7. Další info například v článku: IT expert alarmed by governments’ browser warnings (via BreakingNews)

pátek 15. ledna 2010

Čínskému útoku pomohla chyba v Internet Exploreru

Zdá se, že čínský útok na stroje společnosti Google má další oběť. Tentokrát je jí Internet Explorer konkurenčního Microsoftu. Informoval o tom Georg Kurtz z antivirové společnosti McAffee na blogu společnosti. Podle jeho vyjádření využili zřejmě hackeři nezdokumentovanou chybu v prohlížeči Internet Explorer k propašování programu, který umožnil útočníkovi zcela ovládnout napadený počítač: "Our investigation has shown that Internet Explorer is vulnerable on all of Microsoft’s most recent operating system releases, including Windows 7. Still, so far the attacks we’ve seen using this vector have been focused on Internet Explorer 6."

Kurtz tak doplnil další kousek do skládačky toho, co se vlastně stalo. Na celkový obraz si ale ještě počkáme. Pokud jde o Internet Explorer, tak Microsoft samozřejmě na odstranění chyby pracuje, nicméně se zdá, že někteří nechtějí riskovat. Německý úřad Federal Office for Information Security, který má na starosti počítačovou bezpečnost, už vydal varování: Přestaňte používat Internet Explorer, dokud nevydá Microsoft záplatu.

Nebojte se o svá data, uklidňuje Google

Včera jsem publikoval v Deníku Referendu komentář ke konfliktu mezi Googlem a Čínou. V něm jsem vyslovil názor, že skutečným důvodem pro ostrou reakci amerického gigantu je obava ze ztráty důvěry v bezpečnost dat, které máte v Googlu uložené. Jak mne upozornil jedne z komentujících na Facebooku, tak mou interpretaci nepřímo potvrdil i Dave Girouard z divize Google, který na Enterprise Blogu uklidňoval velké klienty takto:

"This was not an assault on cloud computing. It was an attack on the technology infrastructure of major corporations in sectors as diverse as finance, technology, media, and chemical. The route the attackers used was malicious software used to infect personal computers. Any computer connected to the Internet can fall victim to such attacks. While some intellectual property on our corporate network was compromised, we believe our customer cloud-based data remains secure."


Google musí zklidni nejen firemní klienty, ale i státní úředníky. Gmail jako základní poštovní server využívá totiž i řada zaměstnanců státu, včetně pracovníků amerického ministerstva obrany.

Další podrobnosti najdete v například v článku Government Gmail use following Google's China news. Podrobnější rozbor obrany cloudu pak v článku Google Defends Cloud Computing in the Wake of China Hack Attacks. Pokud jde o vztah americké administrativy a Google Apps dopručuji pro začátek text: The US Government Is Going Google

čtvrtek 14. ledna 2010

Obrázky ze zničeného Haiti jsou již dostupné v Google Earth

Google publikoval obrázkovou vrstvu pro Google Earth s aktuálními fotkami poničeného Haiti. Stáhnou si ji můžete zde. Další podrobnosti nalezenet na blogu Google Earth.

středa 13. ledna 2010

Gmail teď pojede přes HTTPS defaultně

Útok čínských hackerů přináší i další ovoce. Google dnes oznámil, že poštovní služba Gmail používá od dnešního dne jako základní nastavení bezpečné připojení přes HTTPS. Google se nemohl delší dobu rozhodnout mezi rychlostí a bezpečností. Nyní Čína rozhodla za něj. Od teď se ke svém poště připojujte na adrese https://www.gmail.com

Google končí s cenzurou výsledku hledání v Číně

Zdá se, že Googlu došla trpělivost s čínskými kyberútoky na internetové servery. Dnes na svém blogu oznámil, že po sérii sofistikovaných útoků z Číny se rozhodla jednat a ruší cenzuru svých výsledku hledání pro Čínu.

Google také uvedl, že původním terčem útoků nebyl on sám, ale jiné americké společnosti a zdá se, že ne malé. Dnes potvrdil útoky na své servery jiný gigant - společnost Adobe. Google se do věci vložil až po tom, co se terčem útoku staly GMailové účty tuctu čínských obránců lidských práv.

Rekace Google je jasná: "We have decided we are no longer willing to continue censoring our results on Google.cn, and so over the next few weeks we will be discussing with the Chinese government the basis on which we could operate an unfiltered search engine within the law, if at all."

Začíná válka mezi Googlem a Čínou? Uvidíme co přinese dnešní den. Večer připravím na toto téma komentář. Zatím doporučuji text René Steina.

úterý 12. ledna 2010

Google spustil "GDrive" - externí disk v cloudu

Oficiální blog Google Docs oznámil, že Google během několika týdnů spouští ukládání typem souboru neomezených dat na svých Google Apps v cloudu. Jeden soubor může být maximálně 250 MB veliký, pro začátek dostává každý 1GB volného místa. Každý další GB bude stát 0,25 dolarů na rok. Viz tato nabídka V praxi tak mohou uživatelé začí využívat Google Docs jako externí disk včetně možnosti sdílet adresáře. Ze strany Google se jedná o logický krok, který doplňuje koncept Google Chrome OS, jak na to budou reagovat další poskytovatelé podobných služeb uvidíme.

Google integruje data z Twitteru do nápovědy klíčových slov

Marty Weintraub upozornil na to, že Google začal s integrací dat Twitteru do nápovědy hledání. Jinými slovy doporučená klíčová slova, které vyhledávač nabízí většinou ve spodní části obrazovky s výsledky detailu, vycházejí i z témat a trendů, která se aktuálně probírají na Twitteru. Jak to v praxi vypadá, si můžete prohlédnout na blogu aimClear.

Pokud má Weintraub pravdu, pak se potvrzují závěry z mojí prezentace na WebExpo o analýze českého Twitteru (viz Slideshare: Světový a český Twitter jako zdroj pro data mining) a komunikace na Twitteru předpovídá hledání na vyhledávačích. Uvidíme jak dopadnou nová čísla z Vrabčáka.

Rotující kedluben, tedy pardón, rotující Google!

Krásný příklad využití SVG pro animaci najdete na adrese: http://simulacrum.dorm.duke.edu/allyourgoogle.svg. Takhle se točit Google kolem své osy asi jen tak neuvidíte. Případné zájemce přímo vybízím k prozkoumání zdrojového kódu. Pozor: funguje to jen v prohlížečích, které podporují SVG!

pondělí 11. ledna 2010

Google bude měnit billboardy v Street View

Jak informoval server ReadWriteWeb přichází Google s novou formou reklamy ve svých Google Maps. Nechal si totiž patentovat novou technologii pomoci které bude nahrazovat reklamní plochy ve StreetView novými billboardy. RWW upozorňuje na zajímavou věc, samozřejmě, že je to dobrý nápad pro lokální podniky umístit do Street View reklamu kupříkladu na svou kavárnu, zároveň ale Google v patentu mluví o uplatnění systému aukcí na jednotlivé plochy, v praxi tak může reklamní plochu na vaší kavárně vydražit konkurence.

V patentu stojí doslova: "The link can be associated with a property owner, for example the property owner which owns the physical property portrayed. The link can alternatively be associated with an advertiser who placed the highest bid on the image recognized within the region of interest (e.g., poster, billboard, banner, etc.). Any portion of the geographic display image in which the region of interest is located can be selectable (e.g., hot-linked). For example, the image of the coffee shop can be hot-linked to an advertisement for the coffee shop."

Zdá se, že Google objevil další zlatý důl. Už se těším na souboj KFC vs. McDonalds:)

Jak vložit Street View do vlastních stránek

Jednoduchou javascriptovou knihovnu pro vložení Street View do svých stránek vydala firma ToGo Software. Po stažení knihovny na adrese street.js stačí jen do stránek vložit tento kód s adresou a vše je hotovo (tedy pokud je pro adresu Street View dostupné):


<html>
<script language="javascript" src="stview.js"></script>
<body>

<div class="$stview">3634 Las Vegas Blvd South, Las Vegas, NV 89109</div>

<script>
$stview.parse();
</script>

</body>
</html>

knihovna umožňuje vložit nejen DIV s adresou, ale také s GPS, pak stačí jen vložit


<div class="$stviewLatLon" width="240" height="320">42.375248, -71.115133</div>



Knihovna nevyžaduje žádné generování vlastního API klíče od Google, použít ji tak zvládne i úplný začátečník.

neděle 10. ledna 2010

YouTube jako piáno

To video vypadá jako blbinka. Pokud si jej pustíte a necháte nahrát celé, můžete na něm klikat a hrát tak na pomyslné piáno. Schválně...


... jenže mne na tom videu zaujalo něco jiného. Totiž využití YouTube k vytvoření interaktivní hry. Myslím, že to má docela pěkný potenciál. Namátkou: jednoduchá adventura, remake kinoautomat či dada koláž zpráv. Možná, že YouTube jen čeká na svého Radoka, aby se stal YouTubomatem.

sobota 9. ledna 2010

Čapek na titulce Google!

U příležitosti 120. výročí narozenin Karla Čapka, umístil Google jeho portrét na svou homapage. Krásné připomenutí člověka, který se svým bratrem,  dal světu slovo robot. Mimochodem ten robot, byl  ve skutečnosti android.