Vyhledavace.info
Jak se dělá a k čemu slouží klasifikační analýza klíčových slov
Analýza klíčových slov se v optimalizaci pro vyhledavače používá k několika různým účelům. V tomto článku vám ukážu analýzu, která pomáhá rozčlenit širší, obecnější téma na na užší, konkrétnější podtémata. Protože se takovému procesu říká klasifikace, nazývám i tento typ analýzy klasifikační.
Výchozí data, metody a výsledky analýzy nejlépe vyniknou na praktickém příkladu. Proto jsem pro účely článku jednu analýzu skutečně provedl a postupně vás s ní seznámím. Za téma jsem si zvolil vysavače a postupoval jsem podobně, jako kdybych o vysavačích opravdu chtěl vytvořit web, např. e-shop, který by je prodával.
Klasifikační analýza klíčových slov v 5 krocích Krok 1: posbírejte dataPlatí jednoduché pravidlo: čím víc zdrojových dat seženete, tím přesnější získáte výsledky. Zdrojovými daty myslím dotazy, kterými lidé hledají ve vyhledavačích vaše téma. Typickými zdroji těchto dat jsou:
- Nástroj na návrh klíčových slov v reklamním systému Sklik. Dat dává nyní (v minulosti to bylo jinak a může se opět změnit) opravdu hodně, ale pracuje se s ním špatně. Abyste se k němu dostali, musíte mít v Skliku účet (klidně i bez nabité Peněženky).
- Nástroj na návrh klíčových slov v reklamním systému AdWords. Pracuje se s ním výborně, dotazů ale vrací dost málo.
- Vaše vlastní statistiky návštěvnosti. Užitečné, zejména pokud inzerujete na volné shody ve vyhledávání Googlu či Seznamu a chodí vám tak návštěvníci i přes fráze, které na stránkách zatím nemáte.
- Statistika interního vyhledávání. Pokud na webu již delší dobu máte interní vyhledávání a sledujete, co jím lidé hledají (to lze i v Google Analytics), určitě tato data použijte také. Často obsahují dotazy, na které byste jinde nenarazili.
- Našeptávače a související dotazy vyhledavačů, ale ty už vám oproti předešlým zdrojům asi nic nového nepřinesou.
Já jsem použil jen nástroj na návrh klíčových slov Skliku. Zadal jsem do něj jediné výchozí slovo vysavače a kopíroval jsem všechny vrácené dotazy tak dlouho, dokud mne nerozbolela ruka. Výsledkem byla tabulka 1 580 dotazů, kterou vidíte zde:
Poznámka 1: Ve skutečnosti je unikátních dotazů jen 1 420. Nástroj Skliku totiž některé dotazy zákeřně podsouvá opakovaně. Dávejte na to v praxi pozor a duplicity včas odstraňte.
Poznámka 2: V praxi si s jediným výchozím slovem většinou nevystačíte. Nástroj sice umí skloňovat, ale jiné slovní druhy už neodvodí. Například ke slovu chorvatsko byste proto měli přidat chorvatský a plno dalších slov, kterými lidé hledají něco v Chorvatsku, aniž by slovo chorvatsko v dotazu použili.
Krok 2: data pročistěteVyhoďte nerelevantní dotazy, tj. ty, na které nechcete nebo neumíte odpovědět. A nebo je nezahazujte a jen si je dejte stranou, třeba se vám budou později hodit. V případě vysavačů jsou to jednak dotazy na různé příslušenství (pytlíky, hadice, nástavce) či služby (opravy, bazary), které můžete chtít nabízet také, a jednak dotazy na informace (recenze, testy, diskuse, porovnání, jak vybrat…), které lze i v e-shopu využít pro doplňkový informační obsah.
Sjednoťtě dotazy, které stejnými (nikoli různými!) slovy říkají totéž a liší se jen diakritikou, překlepy a pořadím slov neměnícím význam. Tomu říkám normalizace. Má-li analýza sloužit jen pro klasifikaci, můžete sjednotit i jednotná a množná čísla, ale to dá hodně práce, takže to většinou nedělám.
Pro lepší představu, např. do normalizovaného dotazu bezsáčkový vysavač jsem zahrnul varianty:
- bezsackovy vysavac,
- bezsačkovy vysavač,
- bezsačkový vysavač,
- bezsáčkový vysavač,
- bez sáčkový vysavač,
- vysavač bez sackovi,
- vysavač bezsackovy,
- vysavač bezsačkový a
- vysavač bezsáčkový
Na jednu věc se jde dívat z různých úhlů pohledu. Např. trička lze třídit podle pohlaví (pánská, dámská, unisex), barvy, velikosti, materiálu, značky výrobce apod. V informační architektuře se tomu většinou říká klasifikační schémata nebo fasety. Já tomu budu pro jednoduchost říkat dimenze.
Jak dimenze určím? Vlastně ani nevím. Prostě koukám na dotazy tak dlouho, až je v nich vidím. Někdy si už při prvním procházení dotazů možné dimenze poznamenávám na papír. U vysavačů jsem se rozhodl pro těchto 12:
- Značka: electrolux, eta, rowenta atd.
- Model: přesný model vysavače, např. sencor svc 1020.
- Princip: zahrnuje jak dominantní princip fungování (robotické, centrální, mechanické), tak nějakou důležitou vlastnost (sáčkové, bezsáčkové) či funkci navíc (s klepačem).
- K čemu (účel použití): na podlahu, do bazénu, na psí chlupy, průmyslové atd.
- Pro koho: pro domácnost, pro hotely, pro alergiky...
- Velikost: sem jsem řadil i tvar určující způsob manipulace, tj. např. ruční, stojanové, tyčové atd.
- Napětí a napájení: většinou se jedná o akumulátorové (se synonymy aku, bateriové, na baterie atd.), ale vyskytuje se i napětí (12v, 18v, 24v) a naopak síťové či prostě elektrické.
- Výkon: jak slovní vyjádření (výkonné, nejvýkonnější), tak ve watech (2000w, 1200w apod.).
- Kvalita: nejlepší, nejprodávanější, profesionální...
- Cena: levné, nejlevnější, akce...
- Místo: Praha, Brno...
- Obchod: pro dotazy, které přímo obsahují název obchodu, ve kterém chce hledající asi nakupovat.
Jestliže se vám podaří klasifikační schémata vymyslet správně, nebudou kolizní. To znamená, že jeden dotaz bude mít v jedné dimenzi jen jednu hodnotu. Lidé mohou hledat robotický vysavač na podlahu, protože robotický je v dimenzi Princip a na podlahu patří do dimenze K čemu. Neměli by ale hledat robotické bezsáčkové vysavače, protože jak robotické, tak bezsáčkové patří do stejné dimenze Princip.
Když kolize nastane v ojedinělých případech, nic se neděje. Když by k ní ale v určité dimenzi docházelo často, byl by to jasný signál, že ji máte ještě dále dělit.
Skoro vždy si musíte udělat i dimenzi Ostatní, do které budete odhazovat všechny charakteristiky, kterých je tak málo, že pro ně nemá smysl vytvářet samostatné dimenze. Nebo jich je i víc, ale ať děláte, co děláte, nedokážete takovou dimenzi nějak rozumě pojmenovat.
Krok 4: klasifikujteDotazy si zapište do tabulky, na každý řádek jeden a pro dimenze si připravte sloupce. Ke každému dotazu pak do příslušného sloupce zapište hodnotu dimenze. Má-li dotaz dimenzí víc, zapíšete hodnoty do více sloupců. Vypadá to např. takto:
Dotaz Napájení Pro koho Značka dětský vysavač dětské dětský vysavač miele dětské miele dětský vysavač na baterie na baterie dětskéPro významově stejné hodnoty používejte vždy jen jedno pojmenování. Já jsem např. sloučil na baterie a bateriové nebo dětské a pro děti. Když váháte, nechte slov víc. Já třeba kromě bateriové ponechal samostatně i aku a akumulátorové, ačkoli to asi znamená totéž.
Ostatně, teď již vám mohu ukázat celou mou vzorovou tabulku:
Skutečný dotaz je ve sloupci A, normalizovaný ve sloupci B. Do sloupce C jsem si zapsal normalizovaný dotaz bez základního slova (tj. bez slov vysavač, vysavače atd.), aby se mi na to lépe koukalo. To dělat nemusíte, jestliže to neumíte provést snadno a rychle. Ve sloupcích D až O následují dimenze a sloupec P jsem vyhradil pro vše, co jsem klasifikovat nedokázal.
Zajímavý je sloupec Q. Nazval jsem ho Modifikátor, protože modifikuje dotazy tak, že vlastně znamenají něo jiného než vysavač — příslušenství, informace atd. — a z mého pohledu se tedy zatím jedná o nerelevantní dotazy.
V posledních dvou sloupcích už jsou jen čísla, která vrací nástroj Skliku. První je hledanost (počet hledání za měsíc), druhé je průměrná cena za klik.
Krok 5: analyzujteData máme, můžeme analyzovat. Jak přesně budete analyzovat, záleží na tom, jak chcete výstupy použít. Já je kromě tohoto článku nijak použít nechci, takže ukážu jen pár základních technik.
V prvé řadě si můžete chtít ověřit, jak je která dimenze důležitá. Dobrým měřítkem je objem hledání a vhodnou formou graf. Ten může vypadat třeba takto:
Celkový počet hledání všech 1 420 dotazů je 328 302. Z toho dotazy obsahující značku jasně vedou se 103 271 hledáními (skoro třetina). Následuje 79 420 (čtvrtina) hledání dotazů obsahujících princip atd. Řádek Základní slovo reprezentuje dotazy obsahující jen varianty slova vysavač/e a už žádné další upřesnění. Jedná se o 24 520 hledání, tedy asi 7 % z celého objemu. Na řádku Modifikátor jsou ty nerelevantní dotazy, o kterých píšu výše. Tabulku s přesnými čísly máte zde:
Pokud plánujete PPC reklamu, můžete v grafu nahradit hledanost průměrnou cenou za klik a třeba najdete dimenze, které jsou méně konkurenční a inzerovat se na ně vyplatí víc než na jiné.
Kdybych měl podle této analýzy opravdu stavět web, asi bych navrhl vstupní stránky a zároveň i vhodné navigační prvky jen pro značky, principy, účely, velikosti a napájení. Ostatní už není tak významné a zřejmě bych se to pokusil přifařit k jiným dimenzím.
Musel bych ale zároveň jít víc do hloubky, protože některé dimenze mají význam jen v kombinaci s jinými. Např. místo se vyskytuje skoro jen u průmyslových a centrálních vysavačů a napájení je hodně spojené s ručními a tyčovými.
Samozřejmě jsou důležité i hodnoty dimenzí. Některé jich mají hodně a jsou rovnoměrně rozprostřeny napříč všemi dotazy. Třeba značky, kterých jsem napočítal 113. Naproti tomu drtivá většina dotazů obsahujících dimenzi Napájení hledá vysavač na baterky a zastoupení ostatních hodnot je skoro zanedbatelné.
Na základě dobré znalosti zákazníků a sortimentu musíte také demaskovat různé pasti, které bývají v datech ukryté. Např. z analýzy dimenze K čemu zjistíte přes 18 tisíc hledání vysavačů na popel, kdežto jen 580 hledání vysavačů na podlahu. Je ale jasné, že podlahu lidé neupřesňují proto, že to považují u vysavače za samozřejmost, a nikoli proto, že by většina chtěla vysávat jen popel a žádnou podlahu.
K analýze jednotlivých dimenzí se dobře hodí kontingenční tabulky. Tady máte příklad takové tabulky pro dimenzi Princip:
Jestli se chcete podívat, jak jsem vše udělal, stáhněte si celý spreadsheet, udělejte si z něj kopii (lze exportovat i do Excelu) a hrajte si.
Jak klasifikační analýzu využijete Informační architektura webuAsi nejčastěji využívám takto pojatou analýzu klíčových slov k návrhu struktury celého webu. Princip je jednoduchý. Pro každý dotaz potřebuji jednu vstupní stránku jako ideální odpověď, zároveň ale musím dotazy vhodně sdružovat, aby vstupních stránek nevzniklo neúčelně mnoho. Jedna vstupní stránka proto pokryje více dotazů.
Vhodný klíčem pro toto členění obsahu jsou právě dimenze a jejich hodnoty. Zároveň nesmím zapomenout na hledané kombinace dimenzí. Měl bych tedy mít stránky vysavačů jednotlivých značek (Miele, Rowenta apod.), jiné stránky vysavačů jednotlivých principů (robotické, bezsáčkové, cyklonové apod.) a také stránky bezsáčkových vysavačů Rowenta a cyklonových vysavačů Miele (nebijte mne, pokud takové neexistují, fakt vysavačům nerozumím).
Tímto zadáním většinou SEO končí. Konkrétní realizaci včetně vhodných navigačních prostředků by měl vymyslet informační architekt, UX designér, nebo prostě web designér, ať už si říká jakkoli. Důležité je, že dostane data, podle kterých se může v tématu správně orientovat.
Pojmenování a textyVstupní stránky musíte nějak pojmenovat (nadpisy, titulky) a mířit na ně správně otextovanými odkazy. Vezmete analýzu, vyberete dotazy odpovídající příslušné hodnotě dané dimenze a z nich ideální pojmenování odvodíte. Méně časté dotazy a vůbec všechna slova v nich pak použijete v textu stránku. To už je klasická on-page optimalizace, které se věnuji třeba v článku Kolik klíčových slov se vejde na jednu stránku.
Parametrické hledání, našeptavače a srovnávačeWeb designér také může podle této analýzy navrhnout parametrické hledání. Z důležitých dimenzí se stanou pole vyhledávacího formuláře a jejich typické hodnoty může nabízet našeptavač.
Struktura detailních popisů zbožíI detailní popis zboží (zde jednotlivých modelů vysavačů) lze strukturovat podle dimenzí. Pokud by to měl být ale jediný účel analýzy, můžete skončit už jejím třetím krokem.
PPC reklamaPokud si platíte PPC reklamu v AdWords nebo v Skliku, jsou dimenze a jejich hodnoty perfektním základem pro členění kampaní na reklamní sestavy. Základní pravidlo zní:
1 hodnota jedné dimenze = 1 reklamní setava = 1 vstupní stránka.
Nástroje, které vám pomohouHlavní problém klasifikační analýzy klíčových slov je její pracnost. Kdysi bych ukázkovou analýzu vysavačů z tohoto článku dělal několik dní, postupně jsem ale našel nástroje a techniky, kterými to zvládnu za několik hodin. Podrobnosti by byly na další článek (snad ho někdy napíšu), zde jen stručné tipy:
- Z nástroje pro návrh klíčových slov Adwords a z analýzy návštěvnosti Google Analytics lze exportovat CSV/TSV. Exportujte vše, načtěte do texťáku nebo Excelu a tam teprve rušte (či jinak ošetřujte) nerelevantní dotazy. Je to rychlejší než vyzobávat releventní přímo v nástroji.
- Z Google Analytics je někdy rychlejší vytáhnout data přes API. Dobrým výchozím bodem je třeba Data Feed Query Explorer.
- Z nástroje pro návrh klíčových slov Skliku exportovat nejde. Proto dělám copy/paste celé tabulky, stránku po stránce, do textového editoru. V něm potom pomocí pár příkazů najdi/nahraď upravím výsledek tak, aby neobsahoval hlavičky tabulky a jednotlivé dotazy byly na samostatných řádcích, se sloupci oddělenými tabelátorem. Dobře to jde např. v editorech Sublime Text nebo TextPad.
- Tabulku všech dotazů naimportuji do Google Refine. To je zázrak, o kterém určitě někdy napíšu, nebo rovnou natočím video, jak s ním pracuji. Úžasně urychluje normalizaci dotazů i jejich klasifikací.
- Data zpracovaná pomocí Google Refine přenesu do Google Spreadsheets, kde je různě agreguji jednak databázovými funkcemi a jednak kontigenčními tabulkami. V Excelu by to asi šlo stejně, ale ten nemám.
- Když jsou data na spreadsheet moc rozsáhlá, skoro stejné agregace jdou provést i ve Fusion Tables, které už jsou teď taky součástí Google Docs.
A to je vše. Žádné další nástroje na analýzu klíčových slov nepoužívám.
A teď jen pro zajímavost… Dělají to ostatní dobře?Když už jsem si s analýzou klíčových slov vysavačů dal takovou práci napadlo mne se na závěr podívat, jak si s ní poradili návrháři největších českých e-shopů.
Mall.czMall člení vysavače na akumulátorové, antibakteriální, podlahové, víceúčelové a robotické. Akumulátorové navíc na mokré i suché vysávání, nebo jen mokré, podlahové na klasické, stojaté a tyčové a víceúčelové na mokré i suché sání a šamponování. Značky pak odkazuje z detailů produktů, ale ty vedou na souhrnnou stránku výrobce, ze které je třeba se dál prokliknout na kombinaci značky a určité kategorie vysavače. Stránku pro všechny vysavače určité značky jsem nenašel.
V podkategoriích jde hledat podle parametrů, takže uživatel může např. vyhledat všechny podlahové bezsáčkové vysavače. Stránka s výsledky hledání ale asi(?) není nikde odkazovaná, takže z pohledu SEO bude mít minimální význam.
Alza.czAlza člení vysavače na sáčkové, bezsáčkové, cyklonové, stojací, ruční a robotické. Z detailu zboží vede odkaz na stránku všech vysavačů dané značky a z té pak na výše uvedené kategorie dané značky. Parametrické vyhledávání chybí.
Elektro worldNa webu Electroworld.cz se vysavače člení na bezsáčkové, multifunkční, robotické a sáčkové. Tyto skupiny jdou kombinovat se značkou, příkonem a několika dalšími parametry. Menu zde vlastně zároveň slouží jako určitá forma parametrického hledání.
Za domácí úkol si můžete porovnat řešení těchto tří obchodů s mou analýzou a jistě přijdete na to, co jim chybí a o kolik peněz tím asi přicházejí.
Poznámky a odkazy na další zdrojeTermín klasifikační analýza klíčových slov nikde nehledejte. Vymyslel jsem si ho pro potřeby tohoto článku, abych takto pojatou analýzu odlišil od jiných typů. Tradičně a asi nejčastěji se totiž dělá analýza klíčových slov jen pro určení priorit, na co optimalizovat jednotlivé stránky. Relevance a hledanost se pak posuzuje spolu s konkurenčností. Většinou z toho vyjdou nesmysly, protože relevance i konkurenčnost jsou obtížně kvantifikovatelné veličiny.
Informační architekti si asi povšimli, že se “moje” klasifikační analýza v něčem podobá tradiční inventuře obsahu (content inventory) a její výstupy trochu připomínají otevřený card sorting. Ano, tyto metody se někdy mohou zčásti zastupovat, častěji se ale doplňují. Například lze analýzou klíčových slov začít a card sortingem pak výslednou klasifikaci otestovat.
Analýzu vysavačů jsem vypracoval jen pro účely tohoto článku. Potřeboval jsem téma, které jsem nikdy nedělal pro žádného klienta. Prodáváte-li vysavače, výsledky klidně použijte, ale mějte na paměti, že jim nerozumím a určitě jsem se v jejich klasifikaci dopustil četných chyb. Abych mohl dát za analýzu ruku do ohně, musel bych si nejprve vysavače dobře prostudovat a také bych musel lépe poznat lidi, kteří je hledají a kupují.
Přečtěte si starší článek Michala Blahuta z Dobrého webu o pneumatikách. Hezky ukazuje, jak lze dobrou analýzou klíčových slov a následným uspořádáním obsahu webu získat zásadní konkurenční výhodu.
A taky si přečtěte můj předešlý článek Kolik klíčových slov se vejde na jednu stránku. Věnuje se podobné problematice, ale na úrovni jednotlivé stránky, ne celého webu.
Kolik klíčových slov se vejde na jednu stránku
Optimalizace pro vyhledavače je zamořena mnoha mýty a jedním z nich je…
Mýtus o jednom klíčovém slověZačátečníci v SEO se často ptají, na kolik klíčových slov a frází mohou či mají optimalizovat jednu stránku. A skoro vždy nacházejí tyto odpovědi:
- Každou stránku je možné optimalizovat pouze na jedno klíčové slovo nebo spojení.
- Doporučuji optimalizovat každou podstránku na co nejméně klíčových slov, ideálně pouze na jedno.
- Každou stránku optimalizujte na jedno či dvě úzce související klíčová slova.
- Pamatujte, každou stránku můžete optimalizovat pouze na jedno slovo nebo slovní spojení.
Všechny jsou doslovnými citáty z článků rádoby SEO expertů a všechny jsou… zcela špatně.
Proč špatně? Vždyť soustředíte-li se důsledně na jeden dotaz, snáze se na něj dostanete nahoru a každý přeci ví, že návštěvnost z vyhledavače je tím větší, čím výš se stránka umístí. Ano, jenže to je jenom polovina pravdy. Návštěvnost totiž roste nejen s pozicí, ale i s počtem dotazů resp. jejich celkovou hledaností.
První pozice v Googlu na 10 dotazů hledaných průměrně dvěstěkrát za měsíc zřejmě přivede dvakrát větší návštěvnost než první pozice na pouhý jeden dotaz, byť hledaný tisíckrát za měsíc.
Kolika dotazy lidé hledají počasí na KrétěPodívejte se na konkrétní příklad, stránku o počasí na Krétě Dušana Janovského. Hlavní text je dlouhý 561 slov, celá stránka včetně navigace apod. má 653 slov. Tipněte si, přes kolik různých dotazů na ni lidé z vyhledavačů přicházejí, a pak čtěte dál.
Většina začátečníků by se soustředila na dotazy [počasí kréta], [počasí na krétě] a možná ještě [kréta počasí]. Dušan na to ale šel chytřeji a napsal text pestřeji. Pokud jste tipovali desítky unikátních vstupních dotazů, mýlili jste se. Pokud stovky, jste už blíž. Konkrétně v září 2011 to bylo těchto 511 dotazů a celkem přivedly 3 512 návštěv:
Zároveň si všimněte, že nejčastější dotaz [počasí na krétě] přivedl jen necelých 16 % návštěv a 10 nejčastějších dotazů necelých 65 % návštěv. Ještě zajímavější je, že za celou sezónu, tj. od začátku července do konce října, bylo návštěv již 8 654 a unikátních dotazů 1 017. Nejhledanější si i zde drží 16% podíl návštěv, prvních 10 kleslo na 62 %.
Šla by stránka ještě vylepšit?Rychlou analýzou zjistíte, jak všechny ty stovky až tisíce dotazů vznikají. Asi polovina jde na vrub chybějící či nesprávné diakritice a překlepům. To vám při psaní textu moc nepomůže a musíte spoléhat na vyhledavač, že si s těmito tvary poradí sám. Zbytek se v případě počasí na Krétě kombinuje ze tří směrů, jakými lidé při hledání uvažují:
- Co: počasí, předpověď, teploty, vítr. S různým upřesněním pak např.: desetidenní předpověď, průměrné teploty, roční teploty, graf teplot, teplota moře, teplota vody, teplota vzduchu atd.
- Kde: Kréta samostatně, Kréta s upřesněním světovými stranami (jižní, severní, východní), polohou (u moře) a též jednotlivá místa — Heraklion, Kavros, Chania.
- Kdy: měsíce v roce s případným upřesnění (na začátku září, koncem října), roční období (na podzim, v zimě), a dále dnes, dnešní, aktuální a aktuálně.
Co, kdy a kde zde tvoří zřetelný vzorec, a pokud by chtěl Dušan ještě víc návštěvníků z vyhledavačů, měl by přemýšlet, jaké hodnoty do vzorečku zapomněl dosadit. Např. není moc pravděpodobné, že by lidé hledali desetidenní předpověď, aniž by hledali týdenní. Slovo týdenní (s variantami týden, za týden, sedmidenní apod.) ale v textu chybí a stránku tedy nyní nenajde nikdo, kdo v dotazu tato slova použije. Text neobsahuje ani slovo dnešní nebo měsíce duben a listopad (všechny měsíce jsou jen v obrázku s grafy).
Jsem přesvědčen, že kdyby Dušan chybějící slova do textu doplnil, návštěvnost z vyhledavačů by ještě o 10 až 20 procent stoupla a především by stránku našel skoro každý, komu je určena. Vysoký podíl uspokojených hledajících totiž považuji za mnohem hodnotnější výsledek než absolutní počet návštěv, protože je škoda přenechávat konurenci návštěvníka, kterého mohu stejně dobře či lépe obsloužit sám.
Jak dlouhý text je tedy potřebaDušanův text má 561 slov, což není úplně málo, ale zdaleka ne vždy je tak rozsáhlý text potřeba. Webový text má ostatně být jen tak dlouhý, jak je nezbytně nutné, a i když chcete pokrýt co nejvíc unikátních dotazů, vždy dodržujte Krugovu radu a “vynechte zbytečná slova.” Podívejte se proto na pár příkladů kratších textů.
Můj článek uvádějící mapu parkování v Praze má jen 220 slov, a přesto přivedl v březnu 2008 (tři měsíce po vydání) 1 917 návštěv přes těchto 438 unikátních dotazů:
Na jedno slovo článku tak v průměru připadlo 1,99 dotazu. Pro srovnání, na jedno slovo výše uvedeného Dušanova textu připadá 0,91 dotazu.
Jiný můj článek, který představuje online nástroje na převod videa z YouTube do MP3 pouhými 196 slovy, za letošní listopad přivedl z vyhledavačů 1 185 návštěv přes 389 dotazů a za delší období od 1. července do 30. listopadu 5 716 návštěv přes 1 220 dotazů, což představuje 6,22 unikátních dotazů na jedno slovo textu. Nejčastější dotaz při tom přivedl jen 8,41 % návštěv a deset nejčastějších dotazů 28,2 % návštěv. Dotazy, které se v daném období objevily v průměru méně než jednou denně, přivedly 5 045 návštěv, což je přes 88 %.
Někdy je text sice dlouhý, ale to neznamená, že ho musíte celý psát sami. Například článek Jakuba Boučka o tom jak odstroupit od smlouvy s Českým energetickým centrem má 632 slov, ale o dalších skoro 36 tisíc slov ho prodlužují komentáře čtenářů. Výsledkem je za listopad 8 595 návštěv z vyhledavačů přes 1 423 unikátních dotazů.
Jak si sami ověříte kolik dotazů pokrývá vaše stránkaS Google Analytics je to snadné:
- Z menu vlevo TRAFFIC SOURCES zvolte Sources – Search – Organic. Otevře se vám graf a tabulka dotazů.
- Pod grafem klikněte na Landing Page. Tabulka se naplnít adresami jednotlivých vstupních stránek.
- Klikněte na adresu vybrané stránky. Tabulka nyní bude obsahovat jen jeden řádek.
- Z rozbalovacího seznamu Select… nad tabulkou zvolte Traffic sources – Keyword. V tabulce se zobrazí vstupní dotazy vybrané stránky a jejich počet je zobrazen u stránkování vpravo nad tabulkou.
Pokud umíte pracovat s Google Analytics API, budete to mít ještě snazší.
Shrnutí a doporučení- Před tvorbou obsahu každé jednotlivé stránky si udělejte pečlivou analýzu kladených dotazů. Používejte nejen známé nástroje na návrh klíčových slov AdWords a Skliku, ale i vlastní hlavu.
- Sestavte obsah stránky tak, aby věcně na každý kladený dotaz optimálně odpovídal. Pokud to nedokážete dostatečně přehledně, jasně a stručně, zvažte rozdělení tématu na více stránek.
- Pište text jazykově co nejpestřeji a na žádné jednotlivé slovo z potenciálně hledaných frází resp. jejich vzorců nezapomeňte. Kdyby např. Dušan ve svém textu o krétském počasí zapomněl na slovo září, stálo by ho to skoro 400 návštěv.
- Nikdy nevěřte nikomu, kdo vám bude tvrdit, že jednu stránku lze optimalizovat jen na málo slov či frází a že nejdůležitější slovo se v ní má co nejčastěji opakovat. Opakuje-li se zbytečně často, stránka se čtenářům hůř čte a hlavně se vám do ní nevejdou jiná slova s podobným významem.
- Bonusový tip: Chodí-li vám na nějakou stránku návštěvy z vyhledavačů přes výrazně méně unikátních dotazů měsíčně, než kolik slov sama stránka má, zamyslete se, zda by nešla napsat lépe.
Všechna statistická data, která jsem pro tento článek posbíral, najdete v souhrnné tabulce. Kromě celkového i unikátního počtu slov hlavního textu i celé stránky a výsledků dat z Google Analytics v ní u některých stránek najdete i čísla z Google Webmaster Tools, která jsou také docela zajímavá. Až se budete dívat na konkrétní stránky, jejichž adresy jsou v tabulce také, mějte prosím na paměti, že se mohly od uzávěrky článku (17. 12. 2011) změnit.
Za poskytnutí přístupů k Analytics a GWT zdvořile děkuji:
Dušanovi Janovskému s weby kreta.rovnou.cz a dusan.pc-slany.cz,
Jackovi DeNeutovi s webem nelso.cz,
Jakubovi Boučkovi s webem jakub-boucek.cz,
Jiřímu Surovcovi s webem psds.cz,
Judovi Kaletovi s webem blog.glor.cz,
Nikolovi Tepperovi s webem kindly.cz a
Zdeňkovi Hejlovi s webem portiscio.net.
Vám všem děkuji za trpělivost při čtení a těším se, že vám budu moci ukázat další zajímavé příklady na některém z mých školení SEO. Na podobné téma, i když z širšího pohledu celého webu, si můžete též přečíst mé starší články Jak často jsou hledaná nejčastěji hledaná slova a Strategie optimalizace pro vyhledávače.
Black hat SEO a metoda doorway stránek
Black-hat SEO (česky nejspíš černokněžnické SEO) používá mnoho různých technik. Dnes vám popíšu jednu z nejrozšířenějších, založenou na tzv. doorway stránkách. Nejprve ukážu konkrétní příklad použití metody, poté prozkoumám její výsledky a nakonec shrnu její výhody a nevýhody.
Zkuste v Seznamu položit např. dotaz [slovíčka]. Na druhé pozici byste měli vidět stránku www.5d.cz/5dslovnicek/, na které ovšem nic podezřelého není. Zajímavé to začíná být na pozici páté, kde se nachází stránka z domény gwo.cz. Když na ní kliknete, ocitnete se opět na stránce www.5d.cz/5dslovnicek/. Pokud ne, nemáte v prohlížeči zapnutý JavaScript a v tom je ten vtip.
Abyste si nemuseli JavaScript vypínat, a protože některé zde popisované stránky mohou ze Seznamu po vydání článku zmizet, přikládám vzorový screenshot. Vidíte, že stránka má odshora dolů tento obsah:
- Upozornění, že hledaný výraz “slovíčka” byl přesunut, a odkaz na cílovou stránku (www.5d.cz/5dslovnicek/).
- Slovo “Slovíčka” postupně v prvcích H1, H2 a H3.
- Odstavec nesmyslného textu skládajícího se z rovné stovky zájmen, příslovcí, předložek a spojek.
- Odstavec obsahující jen samotné slovo “slovíčka”.
- 10 odkazů na 10 různých stránek na free webech. V odkazech jsou různé fráze související s výukou jazyků a za každým odkazem je slovo “slovíčka”. Každý odkaz je v samostatném odstavci.
- Další odstavec obsahující jen samotné slovo “slovíčka”.
- Odstavec nesmyslného textu s 273 slovy, převážně přídavnými a podstatnými jmény typickými pro fráze, kterými lidé hledají něco o výuce jazyků.
- Blok devíti odkazů jako v bodě 5.
- Slovo “Slovíčka” v prvcích H2 a H3.
- Další odstavec se stovkou zájmen, příslovcí, předložek a spojek.
- Další odstavec obsahující jen samotné slovo “slovíčka”.
- Další blok 10 odkazů.
- Znovu body 9, 10 a 11.
- Odstavec nejrůznějších slov a frází souvisejících s výukou jazyků.
Pokud kliknete na kterýkoli odkaz, dostanete se na velmi podobnou stránku. Bude ovšem “optimalizovaná” na frázi, která byla v textu odkazu, a automaticky generované nesmyslné texty budou trochu jiné. Takto byste mohli pokračovat téměř donekonečna. Podle mých odhadů zahrnuje konkrétně tato síť jen pár set doorway stránek, ovšem skoro nic nebrání tomu, aby jich byly tisíce či desítky tisíc, každá vyladěná na trochu jinou frázi.
Je možné, že až budete číst tento článek, zmiňované stránky již nenajdete. Proto uvádím pár dalších screenshotů (1, 2, 3, 4) a tabulku prolinkování obsahující všechny odchozí odkazy ze 4 ukázkových stránek, včetně textů odkazů a adres stránek cílových.
VýsledkyPodívejme se nyní na to, jakých výsledků se síti 5d.cz daří dosahovat ve vyhledavačích. Zkusil jsem namátkou asi 20 dotazů v Googlu i Seznamu a výsledky jsem zapsal do listu Výsledky již odkazované tabulky. Pozice jsem zjišťoval vždy jen v první desítce nalezených odkazů. Charakteristické je zejména toto:
- Na málo konkurenční fráze (např. “anglické testy jazykové”) se síti daří získat pozici (často první) v první desítce Googlu a 3 až 8 pozic (včetně první) v první desítce Seznamu.
- Na středně konkurenční fráze (např. “anglická slovíčka”) se často podaří jedna i více pozic v první desítce Seznamu, v Googlu jen výjimečně.
- Na konkurenčnější fráze (např. “jazykové kurzy”) se Google nedaří nikdy, Seznam občas.
Celková návštěvnost sítí generovaná se odhaduje těžko, nejspíš se ale bude pohybovat v řádech stovek až tisíců návštěv denně.
Výhody a nevýhodyPopisovaná metoda (a rovněž mnoho dalších technik black-hat SEO) má tyto výhody:
- Nízké náklady na vytvoření a provoz. Jedinou investicí je software na generování stránek, analýza klíčových slov a hosting (zde z velké části nahrazeno účty na free hostinzích). I náklady na údržbu a provoz jsou velmi nízké
- Velmi dobré pokrytí dlouhého ocasu (long tail) hledaných frází, srovnatelné snad jen s PPC reklamou.
- S přihlédnutím k nízkým nákladům obvykle pozitivní ROI (návratnost investic).
- Univerzálnost a škálovatelnost — v podstatně jde aplikovat na jakékoli téma a v jakémkoli rozsahu.
Zároveň je ovšem potřeba zvažovat nevýhody, které jsou taktéž typické i pro většinu ostatních black-hat metod:
- V důsledku zdokonalování ochranných mechanismů vyhledavačů proti SEO spamu může metoda přestat fungovat. Konkrétně tato zřejmě funguje docela dobře již několik let, obecně je ale životnost metody předem neodhadnutelná a může činit třeba jen pár týdnů.
- Jestliže administrátor některého vyhledavače síť doorway stránek odhalí (nebo ji některý konkurent vyhledavači nahlásí), budou pravděpodobně všechny zapojené stránky z výsledků vyhledávání na dlouho dobu vyřazeny. V závislosti na době fungování sítě mohou škody způsobené vyřazením převýšit přínosy sítí získané.
- Veřejnost může používání těchto metod považovat za neetické. Případná medializace odhalení sítě proto může poškodit jméno společnosti, která ji vytvořila nebo v jejíž prospěch byla vytvořena.
- Obchodní efekt ze získané návštěvnosti nebude nejlepší, protože příliš mnoho různých dotazů směřuje na jedinou, z principu většinou nepříliš relevantní stránku.
Porovnají-li se výhody a nevýhody, obvykle se dojde k závěru, že podobné black-hat metody mohou být vhodné pro krátkodobé projekty bez ambicí vybudovat dlouhodobě prosperující podnik. Typicky se tedy využívají ve spojení s různými affiliate programy, často na okraji seriozního podnikání (hazard, erotika, potravinové doplňky, MLM apod.). Naopak se zpravidla nehodí pro větší a známější firmy, budování značky, dlouhodobé podnikání citlivé na důvěryhodnost firmy apod.
Závěrečné poznámky- Ačkoli se nedomnívám, že je popisovaná metoda jednoznačně neetická, jsem přesvědčen, že se pro drtivou většinu webových projektů nehodí. Neberte proto, prosím, tento článek jako návod, podle kterého byste se měli řídit ve vlastní praxi SEO. Naopak vás důrazně varuji, abyste tuto a podobné metody nepoužívali. Já sám jsem je nikdy nepoužil z jiných než experimentálních důvodů (a navíc už je to dávno).
- Za normálních okolností by vydání tohoto článku způsobilo vyřazení všech stránek společnosti 5D Software (včetně jejího firemního webu) ze Seznamu. Protože nechci svým článkem způsobit společnosti 5D Software neúměrnou škodu, dohodl jsem se s Dušanem Janovským, manažerem fulltextu Seznamu, že se tak nestane. Dušan mi slíbil, že z výsledků vyhledávání vyřadí jen doorway stránky na ostatních doménách a doménu 5d.cz nevyřadí, pokud z ní budou do týdne od vydání tohoto článku všechny závadné stránky odstraněny.
Seznam má nové statistiky hledání
Seznam včera bez ohlášení spustil nové statistiky hledanosti dotazů obsahující údaje o hledaní volné i přesné shody. Statistiky se zobrazují odkazem Statistika hledaného dotazu pod výsledky hledání. Během dne se několikrát vystřídala stará a nová podoba statistik a údaje pro některé dotazy jsou zatím zjevně chybné. Zde je příklad statistiky hledání dotazu vyhledávače (screenshot).
Reklama ve vyhledávačích se netěší důvěře
The Nielsen Company zvěřejnila výsledky globálního průzkumu důvěry spotřebitelů v různé druhy reklamy. Reklama ve vyhledávačích se s 34 procenty umístila až na jedenáctém místě. Za ní už jsou jen online bannery a textová reklama v mobilních telefonech.