Audyt SEO

SEO (z ang. seo – search engine optimization) – to działania zmierzające do wypromowania danego serwisu internetowego na jak najwyższe pozycje w wynikach wyszukiwania wyszukiwarek internetowych dla wybranych wyrażeń kluczowych. Jeśli chodzi o wyszukiwarkę Google to na pozycję strony w tej wyszukiwarce wpływa ponad 200 czynników, a każdego roku wprowadzanych jest kilkaset zmian w algorytmie wyszukiwania.

Działania SEO można podzielić na dwie zasadnicze grupy:
– on-page – są to działania mające na celu optymalizację strony pod kątem
wyszukiwarek i mające wpływ na jej budowę, strukturę oraz treść.
– off-page – są to działania związane z Link Buildingiem czyli odpowiednim linkowaniem strony www. Działania te przeprowadzane są poza docelową witryną i nie mają wpływu na jej budowę czy treść.

Skupimy się na działaniach on-page. Pomimo ciągłych zmian
w algorytmie Google pewne kwestie pozostają raczej niezmienne i warto
dostosować do nich stronę już na etapie jej projektowania. Dzięki temu nawet
późniejsze dostosowanie strony www do zmieniającego algorytmu czy
wprowadzenia nowych fraz kluczowych do pozycjonowania będzie już dużo
prostsze i nie będzie wymagało np. przebudowy systemu CMS.

Nagłówki HTTP

– odpowiednie kody przekierowania 3XX – zalecane jest wykorzystywanie
przekierowań 301 (trwałe) lub 302 (tymczasowe). Przekierowania tymczasowe
stosujemy dosyć rzadko np. w sytuacji gdy strona chwilowo dostępna jest pod
innym adresem. Najczęściej stosujemy przekierowania trwałe 301.

Zalecenia:
Przekierowania 301 wykorzystać można np. do:
– wskazania preferowanej domeny np. www.domena.pl zamiast domena.pl
– po wdrożeniu nowej strony stare adresy url należy przekierować przy użyciu
przekierowań 301 na odpowiadające im nowe adresy url nowej strony.

Porada:
Aby sprawdzić jaki typ przekierowania został zastosowany można wykorzystać
narzędzie http://web-sniffer.net/

– odpowiednie kody błędów aplikacji klienta 4XX – najczęściej spotykane błędy
aplikacji to 403 (Forbidden – dostęp zabroniony) i 404 (Not Found – nie
znaleziony), który może zostać pomylony z 410 (Gone – zasób został usunięty).
404 należy stosować na nieistniejących nigdy podstronach, które nigdy nie były i
nie są nadal dostępne. Jeśli usunięto istniejącą wcześniej podstronę (bez
przenoszenia jej zawartości na nowy adres), powinna ona zwracać 410. Różnica
polega na tym, że Google może kilkakrotnie odpytywać podstronę zwracającą
404, zanim usunie ją z indeksu, ponieważ weźmie pod uwagę ewentualne
chwilowe problemy techniczne na stronie, przez które taki błąd może się pojawić.
Jeśli jednak zwrócony zostanie kod 410, będzie to oznaczało, że zasób istniejący
wcześniej został całkowicie usunięty. Tym samym, zgodnie z informacjami od
pracowników Google, zostanie on dużo szybciej wyindeksowany.

Zalecenia:
Wpisując wymyślony adres podstrony powinniśmy otrzymać nagłówek 404.
Strony błędów nie mogą zwracać nagłówka HTTP 200 (ok) gdyż będą one
indeksowane przez roboty wyszukiwarek. Dodatkowo, jeśli strona błędu o
identycznej treści będzie pojawiać się pod wieloma adresami spowoduje to
powstanie problemu duplikowania treści. Rezultatem tego będzie obniżenie
wartości zdublowanych stron witryny dla wyszukiwarek oraz pojawianie się stron
błędu w wynikach wyszukiwania.

– Kody błędu wewnętrznego 5XX – najczęstsze to 500 (Internal server error –
wewnętrzny błąd serwera), 503 (Service unavailable – serwis niedostępny) oraz
504 (Gateway timeout – przekroczony czas oczekiwania na połączenie). W tym
miejscu warto zaznaczyć, że w przypadku trwania prac nad serwisem, przez które
może on być chwilowo niedostępny, należy zwrócić kod 503. Będzie to informacja
dla wyszukiwarek, aby odwiedzić stronę ponownie w późniejszym czasie,
ponieważ jej niedostępność jest chwilowa, bo wywołana pracami technicznymi.
– wykorzystanie protokołu https– w sierpniu 2014 roku Google ogłosiło, że
certyfikat ssl/https stał się jednym z czynników rankingowych wpływających na
pozycję strony w wynikach wyszukiwania. Dlatego warto zacząć stosować to
szyfrowanie. Należy jednak pamiętać o wykonaniu przekierowań 301 z adresów
zaczynających się od http na https gdyż dla wyszukiwarki adresy
http://www.domena.pl/podstrona
https://www.domena.pl/podstrona
to dwie różne podstrony. Protokół https:// powinien być dodany do wszystkich
elementów wewnętrznych np. grafik, plików css itd. Ponadto jeśli w kodzie
występują adresy bezwzględne należy zamienić je na adresy względne.

Dostęp dla robotów wyszukiwarek

– Plik robots.txt – plik ten powinien być dostępny pod adresem
http://www.domena.pl/robots.txt Należy w nim zablokowaćdostęp do wybranych
części strony do których nie powinny miećdostępu wyszukiwarki internetowe.
– Blokada indeksacji wyników wyszukiwania – wyniki wyszukiwania w
wyszukiwarce dostępnej na stronie powinny być zablokowane przed
indeksowaniem. Wyszukiwarki nie lubią indeksować tej samej zawartości na
wielu podstronach, a wyniki wyszukiwania (podobnie jak opisane niżej
sortowanie) prezentują te same dane, jednak w innej kolejności, lub nieco bardziej zawężone.

Zalecenia:
Blokadę taką można ustawić w pliku robots.txt lub poprzez użycie następującego
zapisu w sekcji META:
<meta name=”robots” content=”noindex”>
– Blokada indeksacji wyników sortowania – taka sama sytuacja jak w blokadzie
wyników wyszukiwania.
– Blokada dostępu do wybranych podstron – oprócz opisanych już rodzajów
wyników, które nie powinny być indeksowane, może zajść potrzeba dodania
blokady dla innych podstron lub formatów plików. Dotyczy to głównie sytuacji, w
których ta sama treść może zostać zaindeksowana pod różnymi adresami, a zatem
będą to także podstrony z wersją do druku, wersją PDF do ściągnięcia itp.
Niektórzy nie chcą także indeksować plików takich jak polityka prywatności, czy
regulamin.

Inne

– Brak dostępności strony lub jej elementów pod innymi adresami – jeśli
strona występuje pod kilkoma domenami to należ zadbać o to aby były one
przekierowane (301) na domenęgłównąlub zablokowane do indeksacji. Podobnie
z podstronami – nie mogą występować podstrony z identyczną treścią, gdyż
brakuje wtedy kontroli pod jakim adresem zostanie zaindeksowana treść. W
przypadku podstron duplikujących treści należy zastosować znacznik link
canonical w celu wskazania która z podstron duplikujących treść jest stroną
kanoniczną.