tag:blogger.com,1999:blog-4800868479261373682024-03-18T07:03:45.682+01:00Taky trochu o GoogluBlog (převážně) o tipech, tricích a dění kolem aplikací společnosti Google.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.comBlogger90125tag:blogger.com,1999:blog-480086847926137368.post-32631136296344200702012-07-02T22:28:00.000+02:002012-07-03T08:34:14.527+02:00Jak zjistit počet sdílení (i konkurenčních) webových stránek na Facebooku pomocí Google Refine a Facebook APIZajímalo by vás jaké jsou nejsdílenější stránky konkurečního webu na Facebooku? Nebo jaké články ze serveru TV NOVA lidé nejvíce mezi sebou na Facebooku sdílí? Zjistit to, je možná jednodušší, než si myslíte. Pomoci vám v tom může další nástroj do Googlu, který se jmenuje <a href="http://code.google.com/p/google-refine/">Google Refine</a>.
<br />
<br />
Tento nástroj byl původně vyvíjen společností Freebase, kterou Google před časem koupil, a jeho hlavní úlohou bylo pomáhat čistit nekonzistetní datasety. Ostatně podívejte se určitě na instruktážní video, které Google nabízí na stránkách produktu, až si budete program stahovat. Narozdíl od většiny služeb od Googlu totiž Google Refine běží u vás na počítači, byť se do něj přihlašujete v prohlížeči na adrese http://127.0.0.1:3333/
<br />
<br />
Po nainstalování, spuštění a načtení stránky Google Refine ve vašem browseru si můžete vybrat jakým způsobem chcete naimportovat data. Program totiž podporuje celou řadu formátů (CSV, XLS, JSON, XML etc.) a to jak ze souborů uložených na disku, tak přímo z webu. V praxi to tak znamená, že do něj můžete například naimportovat libovolný XML dokument z internetu. Tady se už dostáváme k našemu úvodnímu slibu. Značná část webů totiž obsahuje volně přístupnou mapu stránek v XML formátu, pomoci které pomáhají vyhledávačům lépe indexovat celý web. Obvykle má soubor název sitemap.xml a pomocí Googlu se můžete přesvědčit, že jich lze najít všude dost. Já jsem náhodou našel mapu stránek Televizních novin TV Nova na adrese <a href=" http://tn.nova.cz/sitemap.xml">http://tn.nova.cz/sitemap.xml</a>
<br />
<br />
V menu Google Refine zvolte volbu Create project a v něm položku Web Addresses (URLs). Po zadání URL souboru (pozor včetně http!) se dostanete stránku Configure Parsing Options, zde vyberete myší typ oblasti, která se bude parsrovat, potvrdite ji tlačítkem a uvidíte náhled výsledného importu.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://3.bp.blogspot.com/-Eu33CStDBHg/T_IELkkcn1I/AAAAAAAAHmA/oiNrk3h5SJY/s1600/volba-parsrovane-oblasti-prednactenim.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="203" width="400" src="http://3.bp.blogspot.com/-Eu33CStDBHg/T_IELkkcn1I/AAAAAAAAHmA/oiNrk3h5SJY/s400/volba-parsrovane-oblasti-prednactenim.png" /></a></div>
<br />
<br />
Pokud je vše podle vašich představ, pokračujte a přes tlačítko Create project vpravo nahoře založte nový projekt. Data se stáhnou a vy se objevíte v prostředí podobném klasickému tabulkovému procesoru se sloupci obsahujícími data z importovaného XML.
<br />
<br />
Nyní máte k dispozici mapu stránek a bude třeba ji doplnit o údaje o počtu sdílení na Facebooku (nebo o řadu dalších, vaší fantazii se meze nekladou). K tomu využijeme volbu z menu pro sloupec s url. Vybreme nejdříve volbu Edit column a v ní Add column by fetching URL's která umožňuje použít data z buňky jako součást volání libovolné URL. V našem případě to bude jednoduché volání API Facebooku, konkrétně jeho služby, která vrací počet shares konkrétní URL. Služba se nachází na adrese <a href="http://graph.facebook.com/?id=http://www.klaboseni.cz">http://graph.facebook.com/?id=http://www.klaboseni.cz</a> a je celkem zřejmé, že za parametr ID je třeba doplnit požadované URL. Služba vrací JSON, který mj. obsahuje i položko shares s počtem sdílení stránky na Facebooku.
<br />
<br />
Po volbě Add column by fetching URL's se objeví jednoduché vyskakovací okonké. Nás v něm nyní budou zajímat jen tři položky. Prvním je New column name kde uvedeme, jak se nový sloupec bude jmenovat např. FB JSON. Druhým je Throttle delay, kde je uvedena doba mezi jednotlivými dotazy v milisekundách. V základním nastavení má 5 sekund a pokud nikam nespěcháte, doporučuji ho nechat nastavené pravě na tuto hodnotu. Některé služby vás totiž při příliš agresivním dotazování mohou dočasně zablokovat.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-L-5huArX7-A/T_ICG29wH0I/AAAAAAAAHk4/_kAzEE7gQ_0/s1600/screen-s-fb-json.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="250" width="400" src="http://4.bp.blogspot.com/-L-5huArX7-A/T_ICG29wH0I/AAAAAAAAHk4/_kAzEE7gQ_0/s400/screen-s-fb-json.png" /></a></div>
<br />
<br />
Nicméně zkuste s ní experimentovat, u Facebook API by mělo nastavení na 1 sekundu (1000 v milisekundách) být v pořádku. Konečne posledním políčkem je textarea se názvem Expression. V ní můžete specifikovat jaká url, a případně s jakými parametry, budou volána a to pomocí programovacího jazyka <a href="http://code.google.com/p/google-refine/wiki/GRELFunctions">GREL</a> (či dvou dalších, ale nechme je stranou). V našem případě stačí výraz
<br />
<br />
"http://graph.facebook.com/?id=" + value
<br />
<br />
a pak už jen klikněte na OK a můžete začít stahovat data z Facebooku.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://1.bp.blogspot.com/-Z0QDMzl6nS8/T_ICQnVentI/AAAAAAAAHlE/AxhiZ6i3jIs/s1600/screen-s-procesem-stahovani.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="250" width="400" src="http://1.bp.blogspot.com/-Z0QDMzl6nS8/T_ICQnVentI/AAAAAAAAHlE/AxhiZ6i3jIs/s400/screen-s-procesem-stahovani.png" /></a></div>
<br />
<br />
Po dokončení operace uvidíte nový sloupec, který obsahuje v každé buňce patřičný JSON.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-XM917MmMtsg/T_ID763ggbI/AAAAAAAAHl0/uLRQF_0Oebw/s1600/screen-po-nacteni-JSON.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="113" width="400" src="http://4.bp.blogspot.com/-XM917MmMtsg/T_ID763ggbI/AAAAAAAAHl0/uLRQF_0Oebw/s400/screen-po-nacteni-JSON.png" /></a></div>
<br />
<br />
Teď je ještě třeba extrahovat z JSONu počet shares pro danou stránku. Pomůže nám k tomu opět scriptovací jazyk GREL. Na sloupci opět zvolíme možnost Edit Column, tentokrát ale s volbou Add column based on this column, pomoci které lze vytvořit nový sloupec skrzeva transformaci původního.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://1.bp.blogspot.com/-8XfGKPw-_wA/T_ICn03RtMI/AAAAAAAAHlQ/y-bQHxYDJT8/s1600/screen-pro-transformaci-column.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="250" width="400" src="http://1.bp.blogspot.com/-8XfGKPw-_wA/T_ICn03RtMI/AAAAAAAAHlQ/y-bQHxYDJT8/s400/screen-pro-transformaci-column.png" /></a></div>
<br />
<br />
Tentokrát využijeme vestavěného parseru JSONu v GRELu a do Expression přidáme následujicí instrukci:
<br />
<br />
value.parseJson()["shares"]
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://2.bp.blogspot.com/-sbLEs3yef44/T_IDp0NGpCI/AAAAAAAAHlo/l0BiMqmhHNw/s1600/Add-column-based-on-column-FB-JSON.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="295" width="400" src="http://2.bp.blogspot.com/-sbLEs3yef44/T_IDp0NGpCI/AAAAAAAAHlo/l0BiMqmhHNw/s400/Add-column-based-on-column-FB-JSON.png" /></a></div>
<br />
<br />
Zbývá ještě pojmenovat nový sloupec kupříkladu jako FB Shares. Pak jen stačí kliknout opět na OK.
<br />
<br />
Za chvíli máte k dispozici nový sloupec s přehledem sdílení.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://1.bp.blogspot.com/-ySENr2RwgeM/T_IC4Mg4GZI/AAAAAAAAHlc/iC6xMRW0V7g/s1600/vysledek%2Bs%2BFB%2BShres.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="138" width="400" src="http://1.bp.blogspot.com/-ySENr2RwgeM/T_IC4Mg4GZI/AAAAAAAAHlc/iC6xMRW0V7g/s400/vysledek%2Bs%2BFB%2BShres.png" /></a></div>
<br />
<br />
Nyní ho jen seřadíme pomocí funkce Sort a je to.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-vl3JqD048vM/T_IAU7v8khI/AAAAAAAAHkg/nn5Adfnls4k/s1600/sort.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="145" width="400" src="http://4.bp.blogspot.com/-vl3JqD048vM/T_IAU7v8khI/AAAAAAAAHkg/nn5Adfnls4k/s400/sort.png" /></a></div>
<br />
<br />
Vidíme, že v případě TV Nova byly těmi nejsdílenějšími zprávami posledních týdnů právě tyhle:
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-sGaMmvboYLM/T_IAzSTeLYI/AAAAAAAAHks/-NIxSE2eens/s1600/prvnichpet.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="83" width="400" src="http://4.bp.blogspot.com/-sGaMmvboYLM/T_IAzSTeLYI/AAAAAAAAHks/-NIxSE2eens/s400/prvnichpet.png" /></a></div>
<br />
<br />
Asi sami tušíte, že v případě konkurenčních stránek mohou být výsledky zajímavější a že se nemusíte jenom omezit na volání API pro Facebook Shares, ale o tom zase někdy jindy.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-47912467953032611942012-07-01T21:09:00.001+02:002012-07-02T15:19:39.746+02:00Mapa followerů na Twitteru pomocí NodeXL a Google Fusion TablesAnalýza publika na sociálnících sítích by měla patřit k základům jakékoli systematické komunikaci s ním. Obzvlášť pokud se jedna o značku či osobu, která už může počítat své fanoušky na tisíce, může být analýza jejich profilů k nezaplacení. Jedním z typů analýzy je zmapování geografického rozmístění fanoušků. Jsou spíše z větších měst? Nebo jsou víceméně rozporstraněni po celé zemi? A jak na to vlastně přijít? A jaké fanoušky má moje konkurence?
<br />
<br />
Jednou z možností, jak prozkoumat odkud vaši fanoušci pocházejí, je využít údajů, které sami o sobě poskytují. V případě sociální sítě Twitter, které se budeme dále věnovat, je to i údaj Location, který mají fanoušci možnost vyplnit ve svém profilu. Právě z něj lze poměrně jednoduše vygenerovat mapu jejich umístění po světě s přijatelnou odchylkou od reality. Překvapivě nemusíte mít k tomu žádné speciální znalosti. Postačí k tomu obyčejný <a href="http://www.microsoft.com/cze/office2010/produkty/excel.aspx">Microsoft Excel</a> a <a href="http://www.google.com/fusiontables/Home/">Google Fusion Tables</a>.
<br />
<br />
<b>Získání základních údajů</b>
<br />
Pokud nejste programátor, který si umí stáhnout seznam svých následovníků pomoci Twitter API, můžete k tomu využít open source tamplate pro Excel, který se jmenuje <a href="http://nodexl.codeplex.com/">NodeXL</a> a je určený především k social network analysis. Díky tomu obsahuje možnost importovat z Twitteru i seznam vašich (či konkurenčních i jiných) následovníků, včetně detailů o jejich profilu.
<br />
<br />
Pro rychlejší stažení doporučuji povolit pro NodeXL přístup k vašemu Twitter účtu, podstatně se tak zvýší limit na počet dotazů do Twitter API.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://1.bp.blogspot.com/-8mmX4-H0I1o/T_CdWsWQ86I/AAAAAAAAHjY/aBkIbMkuOa8/s1600/nodexl-zadani.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="225" width="400" src="http://1.bp.blogspot.com/-8mmX4-H0I1o/T_CdWsWQ86I/AAAAAAAAHjY/aBkIbMkuOa8/s400/nodexl-zadani.png" /></a></div>
<br />
<br />
Po stažení potřebných údajů smažte přebytečné listy a ponechte jenom list Vertices a smažte přebytečné sloupce.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://3.bp.blogspot.com/-e5zFoI-vGIk/T_CeGV2_cDI/AAAAAAAAHjk/80Lxlghcsck/s1600/nodexl-cisteni.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="225" width="400" src="http://3.bp.blogspot.com/-e5zFoI-vGIk/T_CeGV2_cDI/AAAAAAAAHjk/80Lxlghcsck/s400/nodexl-cisteni.png" /></a></div>
<br />
<br />
Soubor si můžete uložit jako XLS, ale pro lepší výsledky při konverzi doporučuji zvolit formát TSV neboli textový soubor oddělený tabulátory.S ním budeme pracovat v dalším kroku. Tím bude import dat do Google Fusion Tables.
<br />
<br clear="all" />
<b>Vytváříme mapu</b>
<br />
V dalším kroku naimportujeme TSV se seznamem svých followerů do webové služby Google Fusion Tables, která je primárně určena pro práci a vizualizaci větší souborů dat.
V Gogle Drive zvolíme možnost vytvořit nový soubor, vybereme možnost Table a nahrajem soubor s daty.
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-hUX8oi-Y7QY/T_CemeWYa2I/AAAAAAAAHjw/RsNuXw2m5UQ/s1600/importtable.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="273" width="400" src="http://4.bp.blogspot.com/-hUX8oi-Y7QY/T_CemeWYa2I/AAAAAAAAHjw/RsNuXw2m5UQ/s400/importtable.png" /></a></div>
<br />
<br />
Po úspěšném importu bychom měli vidět tabulku podobnou jako je tato:
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-n4oi2c0u1O0/T_Ce4O6BkeI/AAAAAAAAHj8/yVjLODLvPEM/s1600/poimportu.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="157" width="400" src="http://4.bp.blogspot.com/-n4oi2c0u1O0/T_Ce4O6BkeI/AAAAAAAAHj8/yVjLODLvPEM/s400/poimportu.png" /></a></div>
<br />
<br />
Zkontrolujte v menu položku Edit -> Modify Columns, že má u sloupce Description nastavený typ na Location, případně ho na něj nastavte. Tím, se Google Fusion Table dozvědí, že mají interpretovat data v tomto sloupci jako data určující geolokaci. Nyní už jen stačí zvolit tu spravnou vizualizaci. V našem případě tedy v menu zvolit položku Visualize a v ní vybrat Map. Fusion Tables spusti analýzu pomoci Google Maps API (aniž by vám ubírali ovšem z denního limitu):
<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-Gnsn4bjP1G0/T_CfA6MmsGI/AAAAAAAAHkI/LKW8Qtvo4o8/s1600/geolokace.png" imageanchor="1" style="margin-left:1em; margin-right:1em"><img border="0" height="185" width="400" src="http://4.bp.blogspot.com/-Gnsn4bjP1G0/T_CfA6MmsGI/AAAAAAAAHkI/LKW8Qtvo4o8/s400/geolokace.png" /></a></div>
<br />
<br />
a po chvíli se můžete těšit z podobného výsledku jako já:
<br />
<br />
<iframe width="620" height="480" scrolling="no" frameborder="no" src="https://www.google.com/fusiontables/embedviz?viz=MAP&q=select+col7+from+1kNTqrYit5ag-Bm6iOdBcsuV30FU2m2qIFcNs7_s&h=false&lat=50.12057809796007&lng=17.0907446437501&z=7&t=1&l=col7"></iframe>
<div align="center">(<a href="https://www.google.com/fusiontables/embedviz?viz=MAP&q=select+col7+from+1kNTqrYit5ag-Bm6iOdBcsuV30FU2m2qIFcNs7_s&h=false&lat=50.12057809796007&lng=17.0907446437501&z=7&t=1&l=col7">větší verze</a>)</div>
<br />
<br />
Pokud jste hračičkové, můžete si s ním samozřejmě dál pohrát. Kupříkladu upravit šablonu pro popup okénko s detaily a podobně. Pro začátek to ovšem stačí.
<br />
<br />
Někdy příště se podíváme na to, jak získat kromě mapy i seznam GPS pozic a hlavně jak normalizovat data ze sloupce Location do jednotné podoby. Pomůže nám v tom další produkt společnosti Google jmémen Google Refine. Ale o tom zase jindy.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com1tag:blogger.com,1999:blog-480086847926137368.post-1197155672690013312011-07-01T07:29:00.001+02:002011-07-01T07:29:38.207+02:00Statistiky pro tlačítko +1Server <a href="http://searchengineland.com/">Search Engine Land</a> přinesl informaci, že Google už mj. uvolnil <a href="http://searchengineland.com/google-1-reporting-now-in-google-webmaster-tools-83798?utm_source=twitterfeed&utm_medium=twitter&utm_campaign=feed-main">statistiky pro tlačítko +1</a>. Najdete je ve nástroji <a href="https://www.google.com/webmasters/tools">Google Webmaster Tools</a> přinášejí vám základní přehled o pluskování vašeho webu: vliv na vyhledávání, aktivitu a informace o návštěvnících.<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-JZFog3AryD0/Tg1a5-iRqgI/AAAAAAAAFUA/__eRni1a5u8/s1600/Screen+shot+2011-07-01+at+7.22.30+AM.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="168" src="http://4.bp.blogspot.com/-JZFog3AryD0/Tg1a5-iRqgI/AAAAAAAAFUA/__eRni1a5u8/s320/Screen+shot+2011-07-01+at+7.22.30+AM.png" width="320" /></a></div>
<br />
<br />
Já mám zatím implementováné plusko jen na <a href="http://www.klaboseni.cz/">www.klaboseni.cz</a>, takže údajů k analyzování zatím moc není. Zřejmě však přišel čas k masivnímu nasazení. Uvidíme, jak se to celé dál bude vyvíjet.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-77102441664147190242011-06-30T10:16:00.001+02:002011-07-01T07:29:38.211+02:00Google testuje nový vzhledZdá se, že Google začal testovat nový nový vzhled. Osobně mi přijde docela pěkný a evidentně se sjednocuje s Google plus. To by odpovídalo snaze Googlu zrušit rozdíl mezi "search" a "social".<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://4.bp.blogspot.com/-RYuGYu9eGu8/Tgww0OsVGUI/AAAAAAAAFT0/e2FUCaH2wWI/s1600/Screen+shot+2011-06-30+at+10.08.11+AM.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="168" src="http://4.bp.blogspot.com/-RYuGYu9eGu8/Tgww0OsVGUI/AAAAAAAAFT0/e2FUCaH2wWI/s320/Screen+shot+2011-06-30+at+10.08.11+AM.png" width="320" /></a></div>
Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-50868400257941957252011-06-29T06:59:00.000+02:002011-06-29T06:59:27.843+02:00Fonty, láska, moucha aneb nejen Google + je novinkaBlogy po celém světě plní informace o spuštění sociální sítě Google + a není divu, protože se jedná o událost očekávánou již delší dobu. Trochu tak zanikly další dvě novinky, které také Google včera spustil. První z ních je uvolnění 180 fontů pro web zdarma v rámci projektu <a href="http://www.google.com/webfonts/v2">Google web fonts</a>. Na první pohled řada z nich vypadá docela dobře a lze je využít pro vložení do webových stránek.<br />
<br />
Druhou novinkou je projekt <a href="http://www.google.com/whatdoyoulove/">What do you love?</a> Který slouží jako jakási přehlídka mnoha oblastí, kde vám Google umožňuje pracovat. Na jednom místě tak vidít jak Google Trends, tak Google Search, stejně jako Google Video Chat. Vypadá to pěkně, až na jednu mušku. No, v Čechách spíš mouchu. Pokud totiž máte rádi Čechy nebo něco s diakritikou, tak mate smůlu. Viz přiložený screenshot...<br />
<br />
<div class="separator" style="clear: both; text-align: center;">
<a href="http://1.bp.blogspot.com/-FO77bV9vARE/TgqvmmeSLWI/AAAAAAAAFTY/1vUCV9VOivk/s1600/Screen+shot+2011-06-29+at+6.51.38+AM.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img border="0" height="202" src="http://1.bp.blogspot.com/-FO77bV9vARE/TgqvmmeSLWI/AAAAAAAAFTY/1vUCV9VOivk/s320/Screen+shot+2011-06-29+at+6.51.38+AM.png" width="320" /></a></div>
<br />
Obě nové služby patří sice do kategorie maličkosti, ale stejně tak do kategorie potěší. Tak užívejte.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com3tag:blogger.com,1999:blog-480086847926137368.post-26703502394268624802011-01-11T16:27:00.001+01:002011-01-11T16:52:35.191+01:00Pokutované pumpy a Google Fusion TablesMezi moje oblíbené technologie Google patří služba <a href="http://www.google.com/fusiontables">Google Fusion Tables</a>, která umožňuje pracovat s velkými objemy dat. Funguje to velice prostě. Do GFT naimportujete CSV, XLS nebo Google Spreadsheet (limit je 100MB) a můžete začít. Buď různě agregovat nebo dotazovat. Přes <a href="http://code.google.com/apis/fusiontables/">API</a> totiž máte k dispozici i jednoduchý SQL-like jazyk. Ostatně na YouTube nalezenete třeba toto <a href="http://www.youtube.com/watch?v=p0xnk9zFQpY">instruktážní video</a>.<br /><br />Zajímavostí GFT je implementace geoparsingu. V praxi tak do GFT můžete například naimportovat <a href="http://ekonomika.idnes.cz/prulom-inspekce-zacala-zverejnovat-pumpy-s-nekvalitnim-palivem-px0-/eko-doprava.aspx?c=A110111_095521_eko-doprava_fih">seznam pump pokutovaných Českou obchodní inspekcí</a> a ten snadno sdílet nebo vizualizovat na mapě. <br /><br />Oba příklady máte zde:<br /><a href="http://www.google.com/fusiontables/DataSource?snapid=122489">Pokutované pumpy - Google Fusion Tables</a><br /><a href="http://bit.ly/genbms">Interkativní mapa s pokutovanými pumpami</a><br /><br />Nebo můžete mapu rovnou vložit do stránek:<br /><iframe width="600px" height="500px" scrolling="no" src="http://www.google.com/fusiontables/embedviz?viz=MAP&q=select+col0%2C+col1%2C+col2%2C+col3%2C+col4%2C+col5%2C+col6+from+387479+&h=false&lat=49.61070993807422&lng=15.8642578125&z=8&t=1&l=col0"></iframe><br /><br />Pěkné, co říkáte?<br /><br />UPDATE: zdá se, že geoparsing má ještě drobné chybky, viz pumpa na Staromáku. Díky za upozornění.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com7tag:blogger.com,1999:blog-480086847926137368.post-14201129100326281442010-11-18T14:42:00.000+01:002010-11-18T14:42:20.440+01:00Pražská velká koalice a social network analysisV posledním blogpostu jsem se tu vyznával k lásce k relativně nové vědní disciplíně jménem social network analysis. Teď se k ní opět vracím, protože mne přivedla k zajímavým obrázkům, které se týkají pražského magistrátu v minulosti, přitomnosti a zřejmě i budoucnosti. Nejdříve ale trocha teorie. Andrew Odewahn vytvořil před časem pozoruhodný projekt. Vizualizoval výsledky hlasování senátorů v americkém senátu během řady volebních období. Spojnici grafu pak stanovil tak, že senátor měl vazbu k jinému tehdy, pokud měli alespoň 65 procent stejných hlasování. Výsledek byl ohromující a můžete se na něj podívat třeba <a href="http://broadcast.oreilly.com/2009/05/us-senato-social-graph-1991--.html">zde</a>.<br />
<br />
I napadlo mě udělat obdobnou analýzu i pro náš pražský magistrát. Na <a href="http://magistrat.praha-mesto.cz">webu magistrátu</a> sice nejsou výsledky hlasování k dispozici v strojově zpracovatelném formátu, ale díky šikovnosti programátorů se je podařilo stáhnout. Ondřej Nekola pak data z XML agregoval do GraphML, tedy formátu, se kterým je možné dál pracovat v NodeXL. Na rozdíl od Odewahna jsem nebyl na naše pražské konšele tak přísný a zvolil jsem hranici 75 procent shody v hlasováních. Proč tak vysoké číslo? Šlo mi o to, že v matici jsou započtena i hlasování o procedurálních otázkách. A teď ty výsledky?<br />
<br />
Nejdřív surové grafy pro jednotlivé vlády<br />
<br />
<a href="http://www.stromateis.eu/sna/1998-2002-75.png"><img src="http://www.stromateis.eu/sna/1998-2002-75m.png"></a><br />
volební období 1998 - 2002<br />
<br />
<a href="http://www.stromateis.eu/sna/2002-2006-75.png"><img src="http://www.stromateis.eu/sna/2002-2006-75m.png"></a><br />
volební období 2002 - 2006<br />
<br />
<a href="http://www.stromateis.eu/sna/2006-2010-75.png"><img src="http://www.stromateis.eu/sna/2006-2010-75m.png"></a><br />
volební období 2006 - 2010<br />
<br />
Co je na všech krásně vidět, je faktická roztříštěnost opozice na pražské radnici posledních 12 letech. Další informace ovšem vynikne, pokud v grafu ponecháme jen ty, co mají alespoň tři shody s ostatními. Vyloupnou se nám tak tvrdá hlasovací jádra.<br />
<br />
<a href="http://www.stromateis.eu/sna/jadro-1998-2002-75.png"><img src="http://www.stromateis.eu/sna/jadro-1998-2002-75m.png"></a><br />
volební období 1998 - 2002<br />
<br />
<a href="http://www.stromateis.eu/sna/jadro-2002-2006-75.png"><img src="http://www.stromateis.eu/sna/jadro-2002-2006-75m.png"></a><br />
volební období 2002 - 2006<br />
<br />
<a href="http://www.stromateis.eu/sna/jadro-2006-2010-75.png"><img src="http://www.stromateis.eu/sna/jadro-2006-2010-75m.png"></a><br />
volební období 2006 - 2010<br />
<br />
Co z nich můžeme vyčíst? Především to, že v letech 1998 - 2006 tu vládla velká koalice. To není až tak zajímavé. Zajímavější ale již je, že ve všech třech obdobích byl na blízku vždy nějaký zastupitel komunistů, který rád pomohl s hlasováním. Dokonce i v období 2006 - 2010, kdy si zavdal jen jeden sociální demokrat. Podotýkám, že ačkoli komunisté nejsou oficiálně na magistrátu u moci, jejich role v kontrolním výboru je značná. Tolik k minulosti a přítomnosti. <br />
<br />
Teď ale malá poznámka k budoucnosti. Nová koalice má velmi křehkou většinu, vzhledem k minulosti ale víme, že se umí domluvit a hlavně, že pokud bude zapotřebí, tak má zřejmě dobré zkušenosti s tichou podporou KSČM.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com10tag:blogger.com,1999:blog-480086847926137368.post-80274949957021449362010-10-30T22:41:00.001+02:002010-10-30T22:42:27.852+02:00Identifikace komunity kolem účtu na Twitteru<p>Jak je možná patrno z některých mých zmínek na Twitteru, poslední dobou se zabývám intenzivně oblastí <a href="http://www.orgnet.com/sna.html">Social Network Analysis</a>. Vděčím za to Petru Lupačovi, upozornil mne totiž na <a href="http://tlampac.webnode.cz/">blog Jana Schmida</a>, který se právě SNA věnuje. V analýze sociálních sítí se fakticky potkává sociologie s teorií grafů a vytvářejí nádherná intelektuální dobrodružství, mající využití v celé řadě oblastí. Navíc díky pokročilým nástrojům může základní analýzu dnes dělat i člověk, neseznamený dopodrobna se zákoutími matematiky. Já jsem se po kratším zkoumání zatím zastavil u nástroje <a href="http://nodexl.codeplex.com/">NodeXL</a>, který funguje mimo jiné i jako šablona do Excelu a je šířen pod GPL licencí. <br /><p>Z mnoha dosavadních experimentů mi zatím přišel nejnázornější příklad hledání komunit mezi lidmi propojenými kolem <a href="http://twitter.com/stunome">twitter uživatele Stonome</a>. Účet patří mému domovskému akademickému pracovišti, má 96 následovníků a sám následuje 41 uživatelů. Při importu do NodeXL je třeba zvolit i natažení hran, propojující jednotlivé následovníky, a následované účty mezi sebou. Ostatně více se dočete v dokumentaci, která je ke stažení na stránkách projektu.<br /><p>Výsledný graf pak vypadá například takto:<br /><p><a href="http://www.klaboseni.cz/sna/velke/stunome_hola_vetsi.png"><img src="http://www.klaboseni.cz/sna/male/stunome_hola_vetsi.png" border=0></a><br /><br /><a href="http://www.klaboseni.cz/sna/velke/stunome_hola_vetsi.png">(klikni pro větší)</a><br /><p>Na první pohled docela chaos, že? Nicméně pomocí SNA si lze v celé věc sjednat poněkud lepší pořádek. Nás v tomto případě zajímá, zda ve změti následovníků a následovaných existují nějaké relevatní komunity. To můžeme zjistit pomocí hledání klastrů v grafu. V našem případě jsem zvolil takzvaný <a href="http://en.wikipedia.org/wiki/Girvan%E2%80%93Newman_algorithm">Girvan–Newman algoritmus</a> a výsledek vypadá o kousek lépe.<br /><p><a href="http://www.klaboseni.cz/sna/velke/stunome-cluster.png"><img src="http://www.klaboseni.cz/sna/male/stunome-cluster.png" border=0></a><br /><br /><a href="http://www.klaboseni.cz/sna/velke/stunome-cluster.png">(klikni pro větší)</a><br /><p>Barvy tu odlišují několik komunit, ale stále je to poněkud nepřehledné. Pro lepší výsledek tedy odstraníme z grafu samotný účet Stunome (jde nám o komunitu okolo něj, ne o něj samotný) a potlačíme všechny úzly, které mají tři a méně propojení s okolím. Výsledek teď vypadá o moc lépe:<br /><p><a href="http://www.klaboseni.cz/sna/velke/stunome-cluster-filtr4-out-in-degree-without-stunome.png"><img src="http://www.klaboseni.cz/sna/male/stunome-cluster-filtr4-out-in-degree-without-stunome.png" border=0></a><br /><br /><a href="http://www.klaboseni.cz/sna/velke/stunome-cluster-filtr4-out-in-degree-without-stunome.png">(klikni pro větší)</a><br /><p>Vcelku zřetelně se nám vydělila modrá skupina. Tu tvoří především studenti magisterského a doktorandského studia na SNM, potažmo UISKu. Vyjímky jsou případy členství v jiné komunitě, která se překrývá s komunitou SNM. Příkladem může být účet mého kolegy z práce aborym, propojený s účtem našich studentů adbara a zbiejczuka. Pěkně se také vydělila oranžová komunita lidí z "branže" jako je marek_baco a perlino. Zelené spojnice ukazují na dvě studentky prvního ročníku, které zatím do modré komunity vplouvají.<br /><p>Jako finální perličku ještě můžeme náš graf obohatit o nějaké zvýraznění dominantnosti postavení ve skupině. NodeXL nabízí kupříklad <a href="http://www.faculty.ucr.edu/~hanneman/nettext/C10_Centrality.html#Eigenvector">eigenvector</a>, který se snaží vyjádřit centrálnosti uzlů pro celek grafu. Tedy přibližně řečeno: kdo má nejvíce nejblíže ke všem ostatním. Výsledek aplikace vidíte na posledním grafu:<br /><p><a href="http://www.klaboseni.cz/sna/velke/stunome-cluster-filtr4-out-in-degree-without-stunome-eigenvector.png"><img src="http://www.klaboseni.cz/sna/male/stunome-cluster-filtr4-out-in-degree-without-stunome-eigenvector.png" border=0></a><br /><br /><a href="http://www.klaboseni.cz/sna/velke/stunome-cluster-filtr4-out-in-degree-without-stunome-eigenvector.png">(klikni pro větší)</a><br /><p>Krásné je, jak v modré komunitě dobře vidíme její husté propojení, zvlášť kolem studentů druhého ročníku, který v zásadě představuje hledané jádro studentů a učitelé SNM na Twitteru. Pokud se teď vrátíte k původnímu grafu musíte uznat, že pár tahy jsme se posunuli do velmi zajímavého místa, kdy jsme zcela formálním postupem rozklíčovali užitečnou informaci.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com2tag:blogger.com,1999:blog-480086847926137368.post-19974923589297392522010-10-16T12:59:00.001+02:002010-10-16T13:06:43.168+02:00Jak hledat telefonní čísla na FacebookuČasto se hovoří o problému bezpečnosti osobních dat na síti Facebook. Méně často se ale mluví o tom, že zneužitelná data musíte nejdřívě sami na Facebook dát a jeden se diví, co všechno jsou ochotni uživatele na svou zeď napsat. Já například zkusil hleda předčíslí mobilního čísla 608. (<a href="http://www.facebook.com/search/?flt=1&q=608&gl=1&lo=cs_CZ&tas=0.8206650938373059">přímý link</a>). Nestačil jsem se divit, kolik lidí píše na své zdi čísla mobilů. V kombinaci s tím, že mají většinou veřejné profily, jsou idealním terčem pro telesales... A to v lepším případě.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com3tag:blogger.com,1999:blog-480086847926137368.post-14582428467676936422010-07-29T21:58:00.006+02:002010-08-02T09:39:47.022+02:00100 milionů facebookových účtů a jak to bylo ve skutečnostiMédia zachvátila horečka. Z Facebooku prý unikly údaje o 100 milionech uživatelů. O tempora o mores!. Zlí hackeři v akci. Jaká je ale realita? Nejsem odborník na bezpečnost, ale relativně se vyznám v data (web, text) miningu. V Ataxu Interactive mám na starost nejen projekt <a href="http://www.klaboseni.cz">www.klaboseni.cz</a>, ale hlavně vývoj produktu Ataxo Social Insider, který se právě monitoringu komunikace na sociálních sítí věnuje a to včetně <a href="http://www.youtube.com/watch?v=0hYU2xEn9hA">data miningu</a>. A tak jsem sedl, hledal a našel...<br />
<br />
Pravda je banální. Počítačový odborník jménem Ron Bowes napsal malý program, který automatizoval stáhování dat o uživatelích Facebooku. Program to byl poměrně old school viz dále a Bowes nevyužil Open Graph API (to je limitováno 100 dotazy za hodinu na jednu IP adresu, mrk, mrk <a href="http://www.pooh.cz/pooh/a.asp?a=2016200">pane Dočekale</a>), ale šel cestou, které se říka <a href="http://en.wikipedia.org/wiki/Web_scraping">scrapování stránek</a>. Zachoval se vlastně jako běžný internetový vyhledávač, jen se soustředil na Facebook. Stažené údaje publikoval prostřednictvím sítě torrentové služby. Údaje jsou samy o sobě neškodné, jen propojují jméno uživatele a čísla na FB. Jak to kdosi komentoval na Twitteru: v telefoním seznamu je o vás víc informací.<br />
<br />
Momentálně je <a href="http://www.skullsecurity.org/blog/?p=887.">originální blogpost</a> nedostupný, stejně jako <a href="http://www.skullsecurity.org/blogdata/facebook.rb.">zdrojový kód</a>, který bylo použit. Proto jeho hlavní část přetiskuji z cache Googlu pod článkem. (až bude opět dostupný, smažu ho). Stejně jako jsem umístil na <a href="http://paste.ideaslabs.com/show/jpNWpPCmsA">Paste Code</a> zdrojový kód programu, který použil. Když si ho projdete, zjistite jediné: ten člověk měl prostě dobrý nápad jak strojově vyškrabat veřejně přístupná data. Mimochodem pokud je na jeho činnosti něco nelegální, proč rovnou nekřičet na <a href="http://www.google.cz/#hl=cs&source=hp&q=inurl%3A%22%2Fdirectory%2Fpeople%22+site%3Afacebook.com&btnG=Vyhled%C3%A1v%C3%A1n%C3%AD+Google&aq=f&aqi=&aql=&oq=inurl%3A%22%2Fdirectory%2Fpeople%22+site%3Afacebook.com&gs_rfai=&fp=5f3cff520318ea69">Google</a> nebo <a href="http://search.yahoo.com/search;_ylt=Aim2hwfWjYqFzTuqzT49fCqbvZx4?p=inurl%3A%22%2Fdirectory%2Fpeople%22+site%3Afacebook.com&toggle=1&cop=mss&ei=UTF-8&fr=yfp-t-701">Yahoo</a>? Navíc Yahoo Boss Search API vám zajistí přístup ještě luxusnější. <br />
<br />
Co z celé pseudokauzy plyne? V zásadě nic nového:<br />
<br />
- drtivá většina novinářů nerozumí tomu o čem píše (zdravím novinky.cz)<br />
- pokud už mají aspoň elementární znalost, neobtěžují se jít ke kořenů věcí (pooh.cz)<br />
- a konečně Facebook je dnes stejně milován bulvárem jako velká hudební stár a tak podobných mediálních kravin můžeme čekat ještě víc<br />
<br />
To je vše.<br />
<br />
P.S. A ještě slibená podstatná část původního blogpostu Rona Bowese:<br />
<br />
<h4>Return of the Facebook Snatchers</h4><br />
<b>Background</b><br />
<br />
Way back when I worked at Symantec, my friend Nick wrote a blog that caused a little bit of trouble for us: Attack of the Facebook Snatchers. I was blog editor at the time, and I went through the usual sign off process and, eventually, published it. Facebook was none too happy, but we fought for it and, in the end, we got to leave the blog up in its original form.<br />
<br />
Why do I bring this up? Well last week @FSLabsAdvisor wrote an interesting Tweet: it turns out, by heading to https://www.facebook.com/directory, you can get a list of every searchable user on all of Facebook!<br />
<br />
My first idea was simple: spider the lists, generate first-initial-last-name (and similar) lists, then hand them over to @Ithilgore to use in Nmap's awesome new bruteforce tool he's working on, Ncrack.<br />
<br />
But as I thought more about it, and talked to other people, I realized that this is a scary privacy issue. I can find the name of pretty much every person on Facebook. Facebook helpfully informs you that "[a]nyone can opt out of appearing here by changing their Search privacy settings" -- but that doesn't help much anymore considering I already have them all (and you will too, when you download the torrent). Suckers!<br />
<br />
Once I have the name and URL of a user, I can view, by default, their picture, friends, information about them, and some other details. If the user has set their privacy higher, at the very least I can view their name and picture. So, if any searchable user has friends that are non-searchable, those friends just opted into being searched, like it or not! Oops :)<br />
<br />
<b>The lists</b><br />
<br />
Which brings me to the next topic: the list! I wrote a quick Ruby script (which has since become a more involved Nmap Script that I haven't used for harvesting yet) that I used to download the full directory. I should warn you that it isn't exactly the most user friendly interface -- I wrote it for myself, primarily, I'm only linking to it for reference. I don't really suggest you try to recreate my spidering. It's a waste of several hundred gigs of bandwidth.<br />
<br />
The results were spectacular. 171 million names (100 million unique). My original plan was to use this list to generate a list of the top usernames (based on first initial last name):<br />
<br />
129369 jsmith<br />
79365 ssmith<br />
77713 skhan<br />
75561 msmith<br />
74575 skumar<br />
72467 csmith<br />
71791 asmith<br />
67786 jjohnson<br />
66693 dsmith<br />
66431 akhan<br />
<br />
Or first name last initial:<br />
<br />
100225 johns<br />
97676 johnm<br />
97310 michaelm<br />
93386 michaels<br />
88978 davids<br />
85481 michaelb<br />
84824 davidm<br />
82677 davidb<br />
81500 johnb<br />
77800 michaelc<br />
<br />
Or even the top usernames based on first name dot last name (sorry, I can't link this one due to bandwidth concerns; but it's included in the torrent):<br />
<br />
17204 john.smith<br />
7440 david.smith<br />
7200 michael.smith<br />
6784 chris.smith<br />
6371 mike.smith<br />
6149 arun.kumar<br />
5980 james.smith<br />
5939 amit.kumar<br />
5926 imran.khan<br />
5861 jason.smith<br />
<br />
Or even the most common first or last names:<br />
<br />
977014 michael<br />
963693 john<br />
924816 david<br />
819879 chris<br />
640957 mike<br />
602088 james<br />
584438 mark<br />
515686 jason<br />
503658 robert<br />
484403 jessica<br />
<br />
913465 smith<br />
571819 johnson<br />
512312 jones<br />
503266 williams<br />
471390 brown<br />
386764 lee<br />
360010 khan<br />
355639 singh<br />
343220 kumar<br />
324972 miller<br />
<br />
So, those are the top 10 lists. But I'll bet you want everything!<br />
<br />
<b>The Torrent</b><br />
<br />
But it occurred to me that this is public information that Facebook puts out, I'm assuming for search engines or whatever, and that it wouldn't be right for me to keep it private. Why waste Facebook's bandwidth and make everybody scrape it, right?<br />
<br />
So, I present you with: a torrent! If you haven't download it, download it now! And seed it for as long as you can.<br />
<br />
This torrent contains:<br />
<br />
* The URL of every searchable Facebook user's profile<br />
* The name of every searchable Facebook user, both unique and by count (perfect for post-processing, datamining, etc)<br />
* Processed lists, including first names with count, last names with count, potential usernames with count, etc<br />
* The programs I used to generate everything<br />
<br />
So, there you have it: lots of awesome data from Facebook. Now, I just have to find one more problem with Facebook so I can write "Revenge of the Facebook Snatchers" and complete the trilogy. Any suggestions? >:-)<br />
<br />
<b>Limitations<br />
</b><br />
So far, I have only indexed the searchable users, not their friends. Getting their friends will be significantly more data to process, and I don't have those capabilities right now. I'd like to tackle that in the future, though, so if anybody has any bandwidth they'd like to donate, all I need is an ssh account and Nmap installed.<br />
<br />
An additional limitation is that these are only users whose first characters are from the latin charset. I plan to add non-Latin names in future releases.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com4tag:blogger.com,1999:blog-480086847926137368.post-2443633584134374362010-05-29T20:29:00.004+02:002010-05-29T20:39:19.577+02:00Výsledky crowdsourcingového výzkumu pro předpověď voleb do PSPKonečně můžu uvolnit výsledky crowdsourcingového výzkumu, který jsme provedli se studenty Studia nových médií 18. května 2010. Cílem bylo jednak ověřit Surowieckého teorii o moudrosti davu a za druhé udělat kontrolní měření pro experimenty Adama Javůrka z projektu NextBig <a href="http://www.100chytrych.cz/">www.100chytrych.cz</a><br /><br />Experiment SNM stál na 350 odpovědích náhodně získaných v ulicích Prahy. Otázka zněla: Které strany se podle Vás dostanou do parlamentu? A kolik získají procent. Po odfiltrování evidentních mašíblů zbylo 190 odpovědí. Pak už jsme jen spočítali výsledná čísla.<table><br /><tr><td>strana</td><td>náš výzkum</td><td>skutečný výsledek<td></tr><br /><tr><td>ČSSD</td><td> 27,3</td><td>22<td></tr><br /><tr><td>ODS</td><td> 24,6</td><td>20,2<td></tr><br /><tr><td>TOP 09</td><td> 12,7</td><td>16,7<td></tr><br /><tr><td>KSČM</td><td> 12,2</td><td>11,2<td></tr><br /><tr><td>VV</td><td>8</td><td>10,8<td></tr> <br /></table><br /><br />Předběžně: podařilo se nám trefit pořadí, procenta však nikoli. Otázkou je proč. Jednou z možností je, že lidé nemuseli nic investovat do svých odpovědí (například sázku) a tak projikovali svá přáním. Zkusíme to ověřit při podzimních volbách. O dalších poznatcích budu určitě informovat.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-31480610914469183722010-05-28T12:43:00.002+02:002010-05-28T12:43:15.833+02:00The Mechanical Cinderella na GUGcampuPřed pár týdny jsme byl prezentovat Mechanickou Popelku na českém GUGcampu. Záznam prezentace je již dostupný na YouTubu a já ho zde jen vkládám.<br />
<br />
<object width="640" height="385"><param name="movie" value="http://www.youtube.com/v/nqml47ACRdI&hl=en_US&fs=1&"></param><param name="allowFullScreen" value="true"></param><param name="allowscriptaccess" value="always"></param><embed src="http://www.youtube.com/v/nqml47ACRdI&hl=en_US&fs=1&" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="640" height="385"></embed></object>Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-18993006993664039942010-04-22T17:08:00.009+02:002010-04-24T00:01:46.211+02:00Populární stránky podle FacebookuFacebook spustil včera celou řadu nových funkcí, které narušují hranici mezi Facebookem a okolním webem. Pro mne osobně je velice zajímavá funkce <a href="http://developers.facebook.com/docs/reference/plugins/recommendations">Recommendations</a>. Jedná se o jednoduchý widget, který má na vstupu URL webu a na výstupu seznam aktuálně nejvíc sdílených (a zřejmě i dobře hodnocených) stránek ze zadaného webu. <br /><br />Zajímavé ale je, že nemusíte nutně vložit jen svoje URL, ale i cizí. Uvidíte tak seznam populárních podstránek webů, které vám nepatří. Vybírány jsou zřejmě buď podle vašich přátel v případě, že jste přihlášeni nebo z celého okruhu Facebooku. V praxi tak můžete například jednoduše testovat, které články ze zpravodajských serverů jsou momentálně nejvíce populární. Ve chvíli kdy píšu tenhle text, tak na Novinkách celkově kraluje článek <a href="http://www.novinky.cz/zahranicni/amerika/198241-autorum-south-parku-hrozi-smrt-kvuli-dilu-s-prorokem-mohamedem.html">Autorům South Parku hrozí smrt kvůli dílu s prorokem Mohamedem</a>.<br /><br />Pokud vás tedy zajímá, co zajímá dav, tak máte v ruce ideální nástroj. A Facebook zřejmě zase získal další střípek do mozaiky jménem personalizovaná reklama.<br /><br /><iframe src="http://www.facebook.com/plugins/like.php?href=http%3A%2F%2Fttgoogle.blogspot.com%2F2010%2F04%2Fpopularni-stranky-podle-facebooku.html&layout=standard&show_faces=true&width=450&action=like&colorscheme=light" scrolling="no" frameborder="0" allowTransparency="true" style="border:none; overflow:hidden; width:450px; height:px"></iframe>Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-61487818306973974982010-04-10T22:18:00.006+02:002010-04-10T22:35:05.234+02:00Google: Na rychlosti záležíVčera potvrdil oficiální blog Googlu, že <a href="http://googlewebmastercentral.blogspot.com/2010/04/using-site-speed-in-web-search-ranking.html">rychlost načítání vaší stránky je součástí jejího rankingu</a> a tudíž je důležitá pro umístění stránek ve vyhledávači. Zároveň doporučil několik nástrojů pro měření rychlosti načítání a případné návrhy jak načítání urychlit. Mezi nástroji je i funkce z Labu <a href="https://www.google.com/webmasters/tools/labs-site-performance-1">Google Webmaster Tools</a>, která automaticky vytváří přehled o rychlosti stránek a to včetně porovnání s rychlostí jiných stránek v internetu.<br /><br />Zároveň ale Google v postu uvádí, že změna se týká hodnocení méně než 1 procenta stránek a že je v provozu již několik týdnu. Jak tedy říká <a href="http://www.mattcutts.com/blog/site-speed/">Matt Cuts na svém blogu</a>: pokud si toho moc lidí do teď nevšimlo, tak to zas tak převratná změna není. Nicméně z mého pohledu by to mohlo přivést tvůrce stránek, aby se více zabývali na jakých serverech běží jejich aplikace a vyvinuli tlak na hostingové firmy směrem k zlepšení.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-71404914889845755292010-04-06T22:24:00.013+02:002010-04-22T14:09:44.321+02:00Krize končí? Google si to nemyslí<iframe src="http://www.facebook.com/plugins/like.php?href=http%3A%2F%2Fttgoogle.blogspot.com%2F2010%2F04%2Fkrize-konci-google-si-to-nemysli.html&layout=standard&show_faces=true&width=450&action=like&colorscheme=light" scrolling="no" frameborder="0" allowTransparency="true" style="border:none; overflow:hidden; width:450px; height:25px"></iframe><br /><a href="http://www.google.com/insights/search/#">Google Insight</a> je služba, která dává uživatelům představu o tom, jak moc bylo klíčové slovo v minulosti hledáno na Googlu. Nabízí i komfortní zobrazení grafů a možnost filtrovat výsledky podle zemí a podobně. O užitečnosti této aplikace se můžete přesvědčit ve dvou studiích: americké <a href="http://www.google.com/googleblogs/pdfs/google_predicting_the_present.pdf">Predicting the Present with Google Trends</a> a německá <a href="http://ftp.iza.org/dp4201.pdf">Google Econometrics and Unemployment Forecasting</a>.<br /><br /><p>V té první výzkumníci z Googlu ukazují, jak jsou si podobné křívky hledání z ekonomických oblastí a skutečné výsledky jednotlivých segmentů, ba co víc jak spolu vzájemně souvisí hospodářské výsledky firem a vyhledávání jejich výrobků. Podobnost jde tak daleko, že podle hledání jde předpovídat do jaké země budou lidé jezdit na dovolenou. Německá studie nás bude zajímat o něco více. Odborníci z Forschungsinstitut zur Zukunft der Arbeit v ní ukazují, jak hledání inzerátů práce dokáže přepovídat skutečný stav nezaměstnanosti v Německu. Jak to může fungovat? Poměrně jednoduše: co hledáme na internetu, hledáme z nějakých reálných důvodů. Pokud se poohlížeme po práci, zřejmě jí chcem změnit. <br /><br /><p>Mimochodem uvedené práce vznikaly před tím, než Google doplnil Insight o novou vlastnost, kterou je schopnost předpovídat jak se bude křivka hledání v budoucnu pohybovat v závislosti na svém minulém průběhu. Nechme stranou teorii, jak je to možné a zkusme se podívat na analytické možnosti, které tato volba nabízí v kontextu ekonomické krize. Dopředu říkám, že to nejsou data moc optimistická.<br /><br /><p>Začněme nejdříve bez předpovědí. Podle <a href="http://www.novinky.cz/domaci/189639-pocet-exekuci-v-cr-poprve-presahl-jeden-milion.html">informací</a>, které přinesl server Novinky, v roce 2009 překročil počet exekucí 1.000.000, v roce 2008 to bylo 550.000 a v roce 2007 428.000. <br /><br /><p>Pokud se podívate na křivku hledání slova "exekuce", tak zcela věrně kopíruje tento trend. <br /><br /><a href="http://www.google.com/insights/search/#q=exekuce&geo=CZ&cmpt=q"><br /><img src="http://lh5.ggpht.com/_JAQ_5vAjsOI/S7uZRtOPv_I/AAAAAAAAEuI/SPVIvDu-7nA/s400/exekuce.png" border="0"><br /></a><br /><br /><p>Leden 2010 má skoro dvojnásobek hledání oproti lednu 2009.<br /><br /><p>To ovšem není vše. Podívejme se, jak vypadá hledání klíčového slova "volná místa" i s předpovědí:<br /><br /><a href="http://www.google.com/insights/search/#q=voln%C3%A1%20m%C3%ADsta&geo=CZ&cmpt=q"><br /><img src="http://lh6.ggpht.com/_JAQ_5vAjsOI/S7uZRzcLLII/AAAAAAAAEuY/yCU87BSr0N4/s400/volnamista.png" border="0"><br /></a> <br /><br /><p>Vidíme, že předpověď ukazuje víceméně stejný průběh pro rok 2010, jako byl v roce 2009. Podobně stagnuje i trend pro klíčová slova "hledám práci"<br /><br /><br /><a href="http://www.google.com/insights/search/#q=hled%C3%A1m%20pr%C3%A1ci&geo=CZ&cmpt=q"><br /><img src="http://lh4.ggpht.com/_JAQ_5vAjsOI/S7uZfZiz9CI/AAAAAAAAEuc/HMFuiB0klnw/s400/hledampraci.png" border="0"><br /></a><br /><br /><br /><p>Pro rok 2010 nás tedy podle Googlu žádné zlepšení nečeká. Začínáme skoro na deseti procentech nezaměstnaných a stejně tak s nimi i zřejmě skončíme. Mimochodem v tom se Google Insight shoduje i s <a href="http://www.mediafax.cz/ekonomika/2979091-Analytici-Mira-nezamestnanosti-v-CR-v-prosinci-vzrostla-na-9-3-procenta">předpověďmi ekonomů</a>. Pokud chceme nepřímé potvrzení této teorie, tak můžeme zkusit vyhledávání slova "psycholog". Je obecně známo, že v době krize roste potřeba psychologické porady, takže pokud je zde zřejmá souvislost, měl by s ní souviset i počet hledání psychologů. Je to tak? Je!<br /><br /><a href="http://www.google.com/insights/search/#q=psycholog&geo=CZ&cmpt=q"><br /><img src="http://lh3.ggpht.com/_JAQ_5vAjsOI/S7uZR6gUkgI/AAAAAAAAEuU/zV-zhsePHJM/s400/psycholog.png" border="0"><br /></a><br /><br /><p>Dobře: čeká nás rok nezaměstnanosti a šetření. Jak to bude vypadat? Kupříkladu lehce poklesne zájem o dovolené:<br /><br /><a href="http://www.google.com/insights/search/#q=dovolen%C3%A1&geo=CZ&cmpt=q"><br /><img src="http://lh3.ggpht.com/_JAQ_5vAjsOI/S7uZR_RQXeI/AAAAAAAAEuQ/YaXOyT01ar0/s400/dovolena.png" border="0"><br /></a><br /><br /><br />a v Egyptě se jich zřejmě bude konat o něco míň:<br /><br /><br /><a href="http://www.google.com/insights/search/#q=Egypt&geo=CZ&cmpt=q"><br /><img src="http://lh3.ggpht.com/_JAQ_5vAjsOI/S7uZRr3F-WI/AAAAAAAAEuM/niyag2E0xaY/s400/egypt.png" border="0"><br /></a><br /><br /><p>A opět: <a href="http://finweb.ihned.cz/c1-41743370-cesi-budou-na-letosnich-dovolenych-setrit-o-zahranici-si-nechaji-zdat">analytici</a> si to myslí také,<br /><br /><p>Vyhlídka jsou to nevábné. Na faktu, že letošní rok nebude o nic lepší než minulý, ba zřejmě o něco horší nic nezmění ani volby. Možná o to pečlivěji bychom se měli rozhodovat. <br /><br /><p>Na závěr se ale sluší dodat nějakou tu pozitivní zprávu. Zkusím to: pokud skutečně fungují předpovědi a měření na základě našeho hledání ve vyhledávačích, dostáváme zajímavý a důležitý klíč ke kolektivnímu vědomí a to je fajn. <br /><br /><p>P.S. <i>Data jsem sbíral 5.4. 2010 Google je může dál zpřesňovat a měnit. </i>Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com3tag:blogger.com,1999:blog-480086847926137368.post-17934544206783212862010-03-22T20:58:00.000+01:002010-03-22T20:58:44.810+01:00Google přestal s cenzurou v ČíněGoogle přestal dnes cenzurovat výsledky hledání ve své čínské mutaci na adresa <a href="http://www.google.cn">www.google.cn</a>. Splnil tak své výhružky a navíc velice elegantně. Zájemce o hledání přesměruje na svou hongongskou verzi, která není cenzurovaná. Ve finále to tedy bude Čína, kdo zamezí hledání na Googlu, nikoli společnost sama. Elegantní. Další informace najdete na <a href="http://googleblog.blogspot.com/2010/03/new-approach-to-china-update.html">oficiálním blogu Googlu</a>.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-55468391343733740162010-03-19T16:49:00.000+01:002010-03-19T16:49:24.430+01:00Filmy zdarma III. - SurrealismusDnešní filmový pátek věnujeme surrealismu a jeho hlavním protagonistům ve filmu. Luise Buňuel, Salvador Dalí, René Clair a Man Ray jsou naši dnešní hrdinové. Černým koněm vzadu pak Walt Disney, který inicioval společná projekt se Salvatorem Dalí v roce 1946 pod názvem Destino. Ten byl dokončen až v roce 2003 a režii se ujal Dominique Monfery.<br />
<br />
<br />
<b>Entr'acte (1924)</b><br />
Režie: René Clair <br />
<a href="http://video.google.com/videoplay?docid=-1790665857858342084">http://video.google.com/videoplay?docid=-1790665857858342084</a><br />
<a href="http://www.imdb.com/title/tt0014872/">http://www.imdb.com/title/tt0014872/</a><br />
IMDB: 7.7/10 <br />
<br />
<b>L'Étoile de mer (1928)</b><br />
Režie: Man Ray<br />
<a href="http://www.youtube.com/watch?v=PODxAXZqfKU">http://www.youtube.com/watch?v=PODxAXZqfKU</a><br />
<a href="http://www.youtube.com/watch?v=EClBiWiMIGo&feature=related">http://www.youtube.com/watch?v=EClBiWiMIGo&feature=related</a><br />
<a href="http://www.imdb.com/title/tt0146367/">http://www.imdb.com/title/tt0146367/</a><br />
IMDB: 7.5/10 <br />
<br />
<b>Un chien andalou (1929)</b><br />
Režie: Luis Buñuel a Salvador Dalí <br />
<a href="http://video.google.com/videoplay?docid=3629815223183267424">http://video.google.com/videoplay?docid=3629815223183267424</a><br />
<a href="http://www.imdb.com/title/tt0020530/">http://www.imdb.com/title/tt0020530/</a><br />
IMDB: 8.0/10<br />
<br />
<b>L'Âge d'or (1930)</b><br />
Režie: Luis Buñuel a Salvador Dalí <br />
<a href="http://video.google.com/videoplay?docid=7633509394552540790">http://video.google.com/videoplay?docid=7633509394552540790</a><br />
<a href="http://www.imdb.com/title/tt0021577/">http://www.imdb.com/title/tt0021577/</a><br />
IMDB: 7.7/10 <br />
<br />
<b>Destino (2003)</b><br />
Režie: Dominique Monfery<br />
<a href="http://www.youtube.com/watch?v=UzzZa5o1q5k">http://www.youtube.com/watch?v=UzzZa5o1q5k</a><br />
<a href="http://www.imdb.com/title/tt0377770/">http://www.imdb.com/title/tt0377770/</a><br />
IMDB: 8.1/10Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-45803415498911539142010-03-14T11:22:00.009+01:002010-04-06T22:16:59.383+02:00Testuje Google nový design?UPDATE: Tak z mého počítače se lze na nový design dostat přes tuto URL: <a href="http://www.google.com/webhp?hl=en&safe=off&aq=f&aqi=g10&oq=">http://www.google.com/webhp?hl=en&safe=off&aq=f&aqi=g10&oq=</a><br /><br />Původní text: Před malou chvilkou se mi objevily výsledky hledání na Google v tomto designu:<br /><br /><table style="width:auto;"><tr><td><a href="http://picasaweb.google.com/lh/photo/MgJUE-yTYf8iqJcrEf6Mdg?feat=embedwebsite"><img src="http://lh5.ggpht.com/_JAQ_5vAjsOI/S5y39SeDj8I/AAAAAAAAEsg/aAmwQO0cAIs/s400/Screen%20shot%202010-03-14%20at%2011.08.57%20AM.png" /></a></td></tr></table><br /><br />Ale už je to zase pryč. Zdá se, že Google přikračuje k dalšímu redesignu. Uvidíme.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-72455880487002083682010-03-14T11:10:00.002+01:002010-03-14T11:13:33.096+01:00Google cenzuruje hledání hlasemMinulý týden se objevila možnost posílat buzzy prostřednictvím Google Voice Search. Funguje to i na iPhone, pokud máte aplikaci nainstalovánou. Neodolal jsem a vyzkoušel to. Princip je prostý, stačí říct "post buzz" a pak svůj post. GVS rozpozná, že mu dáváte pokyn k buzzování a přepíše vaše slova. Jaké překvapení mne ale čekalo, když jsem zkusil postnout nespisovný výkřik: "You motherfucker!"<br /><br /><br /><img src="http://lh3.ggpht.com/_JAQ_5vAjsOI/S5yoA-DrkkI/AAAAAAAAEsI/94iI2OUMHno/s800/photo%283%29.jpg"><br /><br />Vidíte? Google nahradil slovo "fucker". Po chvilce experimentování jsem zjistil, že se to netýká jen postování buzzů, ale také vyhledávání slova jako motherfucker, fuck off či piece of shit prostě tohle cestou nenajdete:<br /><br /><img src="http://lh3.ggpht.com/_JAQ_5vAjsOI/S5yoAoksImI/AAAAAAAAEsA/nEu0ELbmd0c/s800/photo.jpg"><img src="http://lh6.ggpht.com/_JAQ_5vAjsOI/S5yoAp5PWyI/AAAAAAAAEsE/nB2lR4bxa5w/s800/photo%282%29.jpg">Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-76200553460080837822010-03-12T12:51:00.005+01:002010-03-12T13:26:26.630+01:00Filmy zdarma II. - Ruská avantgardaJe tu pátek a s ním pokračování seriálu o filmech volně dostupných na serverech Googlu. Dnes jsem pro vás vyhledal porci ruské filmové avangardy a jejich hlavních akterů: Ejzenštejna, Pudovkina a Vertova. Doufám, že se vám budou líbit.<br /><br /><b>Броненосец Потёмкин / Battleship Potemkin (1925)</b><br />Režie: Sergej Ejzenštejn<br /><a href="http://video.google.com/videoplay?docid=-1630669376406423668&ei=wB-aS6D1MZnk2gLhyuD3DA&q=potemkin&view=3&dur=3#">http://video.google.com/videoplay?docid=-1630669376406423668&ei=wB-aS6D1MZnk2gLhyuD3DA&q=potemkin&view=3&dur=3#</a><br /><a href="http://www.imdb.com/title/tt0015648/">http://www.imdb.com/title/tt0015648/</a><br />IMDB: 8.1/10<br /><br /><b>Октябрь / October (1928)</b><br />Režie: Sergej Ejzenštejn<br /><a href="http://video.google.com/videoplay?docid=1264898891656456473&ei=KyGaS8aNCJCM2ALb_JH8DA&q=eisenstein&view=3&dur=3#">http://video.google.com/videoplay?docid=1264898891656456473&ei=KyGaS8aNCJCM2ALb_JH8DA&q=eisenstein&view=3&dur=3#</a><br /><a href="http://www.imdb.com/title/tt0018217/">http://www.imdb.com/title/tt0018217/</a><br />IMDB: 7.8/10<br /><br /><br /><b>Стачка / Strike (1925)</b><br />Režie: Sergej Ejzenštejn<br /><a href="http://video.google.com/videoplay?docid=-5619972126280085254&ei=5yGaS9WeJJvu2AKxgcHeDA&q=eisenstein&view=3&dur=3#">http://video.google.com/videoplay?docid=-5619972126280085254&ei=5yGaS9WeJJvu2AKxgcHeDA&q=eisenstein&view=3&dur=3#</a><br /><a href="http://www.imdb.com/title/tt0015361/">http://www.imdb.com/title/tt0015361/</a><br />IMDB: 7.8/10<br /><br /><b>Мать / Mother (1926)</b><br />Režie: Vsovold Pudovkin<br /><a href="http://video.google.com/videoplay?docid=-7787303432302951458&ei=_R-aS-n9OY-M2ALUyeXuDA&q=Pudovkin&view=3&dur=3#">http://video.google.com/videoplay?docid=-7787303432302951458&ei=_R-aS-n9OY-M2ALUyeXuDA&q=Pudovkin&view=3&dur=3#</a><br /><a href="http://www.imdb.com/title/tt0017128/">http://www.imdb.com/title/tt0017128/</a><br />IMDB: 7.8/10<br /><br /><b>Человек с Киноаппаратом / Man with A Movie Camera (1929)</b><br />Režie: Dziga Vertov<br /><a href="http://video.google.com/videoplay?docid=-2809965914189244913&ei=KiCaS7fNL5zw2ALkq7j-DA&q=Dziga+Vertov&view=3&dur=3#docid=-7991379281115932333">http://video.google.com/videoplay?docid=-2809965914189244913&ei=KiCaS7fNL5zw2ALkq7j-DA&q=Dziga+Vertov&view=3&dur=3#docid=-7991379281115932333</a><br /><a href="http://www.imdb.com/title/tt0019760/">http://www.imdb.com/title/tt0019760/</a><br />IMBD: 8.3/10Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-84299727489973739342010-03-08T22:46:00.002+01:002010-03-08T22:51:09.843+01:00Nejhledanější slova v našeptávači Seznamu podle abecedyZ mých předchozích blogpostů je asi už poznat, že mne baví data, která o světě kolem vypovídají vyhledávače a především Google. Dnes jsem se ale zaměřil na Seznam a konkrétně na jeho službu Našeptávač. Tu Seznam sám definuje takto: <br />
<br />
"Seznam si zpracovává statistiky o hledanosti jednotlivých slov a sousloví. Zjistili jsme, že mnozí uživatelé ocení možnost místo psaní celého slova vybrat myší nebo klávesnicí dotaz, který již někdo jiný položil. Po zadání několika prvních písmen dotazu pod vyhledávacím polem proto automaticky vypisujeme nejčastěji hledané varianty s uvedeným počtem vyhledávání." Když dodává, že "Nápovědy řadíme podle kombinace různých faktorů, z nichž nejdůležitější je hledanost daného dotazu." s tím, že vynechává vulgarismy a podobně. (<a href="http://help.seznam.cz/cz/internet-naseptavac.html">zdroj</a>)<br />
<br />
Zajímalo mne, jaká jsou tedy ta nejvíc hledaná slušná slova a tak jsem i pro vás připravil jejich seznam podle abecedy (vždy maximálně prvních deset ke každému písemenu). Interpetaci ponechám na čtenářích, byť zastoupení různých způsobů jak nalézt porno je nepřehlédnutelná:-)<br />
<br />
<dl><dt><b>a</b></dt>
<dd>aukro.cz, aukro aukce online, aukro, auto kelly, autobazary, annonce.cz, atlas.cz, aha, avizo, asko nábytek, </dd>
<dt><b>b</b></dt>
<dd>bazos, blesk, bazos.cz, brigády, blesk.cz, bazar, badoo, barbie hry, babicovy dobroty recepty, bonprix katalog 2010, </dd>
<dt><b>c</b></dt>
<dd>centrum.cz, comeback, csfd, centrum, csob, ceska sporitelna cz, cestovní kanceláře, citáty, chaty a chalupy, cinestar, </dd>
<dt><b>č</b></dt>
<dd>česká spořitelna, česká televize, česká pošta, čt, česká spořitelna servis 24, čsob banka, čt 1 archiv pořadů, čt1, česká pojišťovna, čez, </dd>
<dt><b>d</b></dt>
<dd>dlouha videa, dlouha videa.cz, dlouha videa zdarma, daňové přiznání za rok 2009, divokekmeny.cz, dvd v novinách a časopisech, dlouhavidea.cz, dsl mereni rychlosti internetu, dlouhodoba predpoved pocasi, dm drogerie, </dd>
<dt><b>ď</b></dt>
<dd>ďáblova bible, ďábel nosí pradu, ďáblův advokát, ďáblova dílna, ďábel nosí pradu ke shlédnutí, ďáblova lest, ďáblice, ďábelská topinka, Ďábelská garda, ďábel medvědovitý, </dd>
<dt><b>e</b></dt>
<dd>exim tours, elektroworld, email, evropa 2, exim tours 2010, egypt, evropa 2 online, ebay.com, elektro, email.cz, </dd>
<dt><b>f</b></dt>
<dd>facebook, facebook.com, freevideo, filmy online, freefoto, free video, filmy, facebook přihlášení, facebook.cz, filmy ke shlédnutí zdarma, </dd>
<dt><b>g</b></dt>
<dd>google, google.cz, ge money bank, google překladač, ge money bank internet banka, google.com, gladiatus, google mapy, grepolis, gelové nehty, </dd>
<dt><b>h</b></dt>
<dd>hry, hry online, hry pro dívky, hry zdarma, horoskopy, hry pro nejmenší, hry ke stažení zdarma, hry pro dva, herna, hyperinzerce.cz, </dd>
<dt><b>i</b></dt>
<dd>idos, idnes, ikea, idos jízdní řády, inzerce zdarma, idos jízdní řády autobusů, icq, idnes.cz, inzerce, ikariam, </dd>
<dt><b>j</b></dt>
<dd>jízdní řády, jízdní řády autobusů, justice.cz, jobs.cz, justice, jak se staví sen, jízdní řády vlaků, jarní prázdniny 2010, jarní bundy, jízdní kola, </dd>
<dt><b>k</b></dt>
<dd>katastr nemovitostí nahlížení, katastr nemovitostí, komerční banka, kinotip.cz, kočárky, kuchyně, karaoke texty, karaoke, kurzy měn, kinotip, </dd>
<dt><b>l</b></dt>
<dd>libim se ti, libimseti.cz, lide.cz, libimseti, lide, letáky, levné pneu, lékárna, letenky, lego, </dd>
<dt><b>m</b></dt>
<dd>mimibazar, mp3 ke stazeni zdarma, mimibazar.cz, mp3, mobilní telefony, mapy.cz, motorkari.cz, motoinzerce, mp3s.nadruhou, mapy, </dd>
<dt><b>n</b></dt>
<dd>nova.cz, nokia, nova, nabídka práce, nahlížení do katastru nemovitosti, notebooky, nábytek, nokia 5230, nokia 5800, nejlevnejsipneu.cz, </dd>
<dt><b>ň</b></dt>
<dd>ňadra, ň, ňadra ivety bartošové, </dd>
<dt><b>o</b></dt>
<dd>obchodní rejstřík, online hry zdarma, o2, ordinace v růžové zahradě 2, obrázky, ordinace v růžové zahradě poslední díl, onlinovky, obrázky na profil, osobnosti.cz, o2 telefonica, </dd>
<dt><b>p</b></dt>
<dd>práce, poštovní spořitelna, počasí, prima tv, překladač, prace.cz, poslat sms zdarma, půjčky, přání k narozeninám, parfémy, </dd>
<dt><b>q</b></dt>
<dd>quelle katalog 2010, quelle, qip, quelle výprodej, queens shop, quiksilver, quelle katalog 2010 online, queens, qip download, quiksilver.cz, </dd>
<dt><b>r</b></dt>
<dd>redtube, redtube.com, recepty, rozzlobenimuzi.com, rychlost připojení k internetu, reality.cz, radio online, reality, renault.cz, raiffeisen bank, </dd>
<dt><b>ř</b></dt>
<dd>řecko, řidičský průkaz, řidiči volná pracovní místa, řím, říčky v orlických horách, řecko 2010, řemeslné živnosti, řez ovocných stromů, řez vinné révy, řidič, </dd>
<dt><b>s</b></dt>
<dd>sms zdarma, superhry, sms zdarma na o2, seznamka, stahuj.cz, sms zdarma na t mobile, superhry.cz, sms, seznamka štěstí, sportka aktualni vysledky, </dd>
<dt><b>š</b></dt>
<dd>štěstí osudová seznamka, škoda auto, škoda, škoda auto cz, škoda octavia, špindlerův mlýn, šaty, šíp, škoda fabia, šperky, </dd>
<dt><b>t</b></dt>
<dd>tv program, tn.cz, t mobile.cz, tv nova, tipsport, t mobile, tapety na plochu, tipcars.cz, tn cz nova, telefonní seznam, </dd>
<dt><b>ť</b></dt>
<dd>Ťupa, ťuhýk obecný, </dd>
<dt><b>u</b></dt>
<dd>uloz to, ulozto.cz, úřad práce, ulož to cz, uloz.to, ulozto, ulice, účesy, úřad práce ostrava, úřad práce brno, </dd>
<dt><b>v</b></dt>
<dd>vodafone.cz, vodafone sms zdarma, videa zdarma, vodafone, vtipy, vysoké školy, volná pracovní místa, volny.cz, velikonoční dekorace, velikonoce, </dd>
<dt><b>w</b></dt>
<dd>www.superhry.cz, www.facebook.com, www.aukro.cz, www.nova.cz, wikipedia, www.tn.cz, www.centrum.cz, wikipedie, www.google.cz, www.odmenazadobiti.cz, </dd>
<dt><b>x</b></dt>
<dd>xvideos.com, xvideos, xchat, xhamster.com, xchat.cz, xbox 360, xhamster, x lander, xzone, xicht.cz, </dd>
<dt><b>y</b></dt>
<dd>youtube.com, youtube, you tube, youtube broadcast yourself, youtube videa, youtube com videa, yutobe, yamaha, ytong, yahoo.com, </dd>
<dt><b>z</b></dt>
<dd>zlaté stránky, zelená úsporám, zelene imperium, zákoník práce, zlaté stránky telefonní seznam, zboží.cz, zhlednito, zakulisi, zoo praha, zákoník práce 2010, </dd>
<dt><b>ž</b></dt>
<dd>živnostenský rejstřík, životopis vzor, životopis, živnostenský zákon, žaluzie, živnostenský úřad, živnostenský list, žehlička na vlasy, žena, ženy v pokušení, </dd></dl>Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com8tag:blogger.com,1999:blog-480086847926137368.post-40583909154038800672010-03-05T22:18:00.002+01:002010-03-05T22:34:12.755+01:00Filmy zdarma na YouTubu a Google Videu - část I.K pátečnímu večeru patří buď hospoda nebo pěkný film. Do hospody dnes nejdu a proto jsem pro milovníky kvalitních filmů začal vytvářet nepravidelný seriál. Pokusím se v něm zmapovat alespoň část celovečerních snímků dostupných veřejně na serveru YouTube a Video Google. Dnes začínáme porcí německé klasiky: Leni Riefenstahl, F.W. Murnau, Fritz Lang, Robert Wiene a jejich celosvětově slavné snímky:<br /><br /><b>Triumph des Willens (1935)</b><br />Režie: Leni Riefenstahlová<br /><a href="http://www.youtube.com/watch?v=LPAxaFxjiDk">http://www.youtube.com/watch?v=LPAxaFxjiDk</a><br /><a href="http://www.imdb.com/title/tt0025913/">http://www.imdb.com/title/tt0025913/</a><br />IMDB: 7.8/10<br /><br /><b>Nosferatu (1922)</b><br />Režie: F.W. Murnau<br /><a href="http://www.youtube.com/watch?v=rcyzubFvBsA">http://www.youtube.com/watch?v=rcyzubFvBsA</a><br /><a href="http://www.imdb.com/title/tt0013442/">http://www.imdb.com/title/tt0013442/</a><br />IMDB: 8.1/10<br /><br /><b>Das Cabinet des Dr. Caligari (1920)</b><br />Režie: Robert Wiene<a href="http://www.youtube.com/watch?v=xrg73BUxJLI"><br />http://www.youtube.com/watch?v=xrg73BUxJLI</a><br /><a href="http://www.imdb.com/title/tt0010323/">http://www.imdb.com/title/tt0010323/</a><br />IMDB: 8.1/10<br /><br /><b>Faust - Eine deutsche Volkssage (1926)</b><br />Reže: F.W. Murnau<br /><a href="http://video.google.com/videoplay?docid=7688523464781787807#">http://video.google.com/videoplay?docid=7688523464781787807#</a><br /><a href="http://www.imdb.com/title/tt0016847/">http://www.imdb.com/title/tt0016847/</a><br />IMDB: 8.0/10 <br /><br /><b>M - Eine Stadt sucht einen Moerder (1931)</b><br />Režie: Fritz Lang<a href=" http://www.youtube.com/watch?v=_O_ldOK3dDE"><br />http://www.youtube.com/watch?v=_O_ldOK3dDE</a><br /><a href="http://www.imdb.com/title/tt0022100/">http://www.imdb.com/title/tt0022100/</a><br />IMDB: 8.6/10Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-8212435421553621612010-03-05T15:10:00.003+01:002010-03-05T16:23:22.895+01:00Google Chart API umí renderovat vzorce z TeXuTohle je drobnost, která potěší: Google Chart API umí renderovat vzorce zapsané v TeXu do obrázku. Podrobnosti v dokumentaci zde: <a href="http://code.google.com/intl/ja/apis/chart/docs/gallery/formulas.html">http://code.google.com/intl/ja/apis/chart/docs/gallery/formulas.html</a>Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0tag:blogger.com,1999:blog-480086847926137368.post-79803873353365441312010-03-04T13:51:00.002+01:002010-03-04T13:56:23.688+01:00Vyhledávače jako nástroje pro měření sémantické podobnosti a vzdálenosti slovNa zkoušku z informační vědy jsem se pokusil dat dohromady teoretické pozadí Mechanické Popelky a vůbec nastínit tak základní směr mé dizertační práce. Pokud to někoho zajímá, tak práce je dispozici zde: <a href=" http://bit.ly/bMJmJn">Vyhledávače jako nástroje pro měření sémantické podobnosti a vzdálenosti slov</a>. Budu rád za poznámky, nápady etc. Naopak doufám, že někomu bude text k užitku.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com2tag:blogger.com,1999:blog-480086847926137368.post-59875134822061239662010-03-02T23:18:00.003+01:002010-03-03T09:58:26.409+01:00Google našeptávač aneb o čem ženy sní<a href="http://en.wikipedia.org/wiki/Dan_Ariely">Dan Ariely</a> je můj oblibený vědec. Pokud tohoto izraelského profesora ekonomie neznáte, pak si pusťte jeho famózní <a href="http://www.ted.com/talks/lang/eng/dan_ariely_asks_are_we_in_control_of_our_own_decisions.html">TEDtalk</a> nebo kupte jeho knihu Predictably Irrational (česky vyšel dokonce její překlad pod neuvěřitelným názvem Jak drahé je zdarma?) Ariely se věnuje tzv. behavioralní ekonomii, která se zabývá nejrůznějšími faktory, které vytvářejí naše ekonomická rozhodnutí. Díky tomu se Ariely kouká často dost neobvklým směrem a využívá podivné metody. Jednou z vtipných je využití našeptávače Googlu (Google Suggest) pro určení našich preferencí.<br />
<br />
Našpetávač Googlu během psání dotazu doplňuje jeho možné varianty podle nejčastěji hledáných frází. Ariely ho využil pro hledání toho co hledají manželé a manželky o svých protějšcích a výsledky byly minálně vtipné viz jeho <a href="http://www.predictablyirrational.com/?p=732&date=1">blog</a>. Neotřelé metody se chytli další a pozoruhodné úlovky můžete najít třeba <a href="http://zingzama.com/original/google-teaches-us-how-boys-girls-think-about-relationships/">zde</a>. Ariely na blogu také upozornil na krásnou službu, která se jmenu <a href="http://hint.fm/seer/">Web Seer</a>, která nabízí vizualizaci průniku mezi dvěma napovědami. Mimochodem průnikem fraze "Obama is" a "Bush is " je fráze <a href="http://hint.fm/seer/#left=Obama%20is%20&right=Bush%20is%20">"is idiot" a "is antichrist."</a><br />
<br />
Pokud byste takovéto využití Google našeptávače považovali za lehkovážné, tak mám pro vás čtení na delší večer. Projděte si studie na toto téma na <a href="http://scholar.google.cz/scholar?hl=cs&q=search+query+google&btnG=Hledat&as_ylo=&as_vis=0">Scholar Google</a>. Uvidíte jak lze search query využívat na sto způsobů. Není to tak humorné, nicméně rozhodně důvtipné.Josef Šlerkahttp://www.blogger.com/profile/05144633079981334213noreply@blogger.com0