Audyt SEO – krok po kroku – kwestie techniczne
SEO (z ang. seo – search engine optimization) – to działania zmierzające do wypromowania danego serwisu internetowego na jak najwyższe pozycje w wynikach wyszukiwania wyszukiwarek internetowych dla wybranych wyrażeń kluczowych. Jeśli chodzi o wyszukiwarkę Google to na pozycję strony w tej wyszukiwarce wpływa ponad 200 czynników, a każdego roku wprowadzanych jest kilkaset zmian w algorytmie wyszukiwania.
Działania SEO można podzielić na dwie zasadnicze grupy:
- on-page – są to działania mające na celu optymalizację strony pod kątem
wyszukiwarek i mające wpływ na jej budowę, strukturę oraz treść; - off-page – są to działania związane z Link Buildingiem czyli odpowiednim linkowaniem strony www. Działania te przeprowadzane są poza docelową witryną i nie mają wpływu na jej budowę czy treść.
Skupimy się na działaniach on-page. Pomimo ciągłych zmian w algorytmie Google pewne kwestie pozostają raczej niezmienne i warto dostosować do nich stronę już na etapie jej projektowania. Dzięki temu nawet późniejsze dostosowanie strony www do zmieniającego algorytmu czy wprowadzenia nowych fraz kluczowych do pozycjonowania będzie już dużo prostsze i nie będzie wymagało np. przebudowy systemu CMS.
Nagłówki HTTP
Odpowiednie kody przekierowania 3XX. Zalecane jest wykorzystywanie przekierowań 301 (trwałe) lub 302 (tymczasowe). Przekierowania tymczasowe stosujemy dosyć rzadko np. w sytuacji, gdy strona chwilowo dostępna jest pod innym adresem. Najczęściej stosujemy przekierowania trwałe 301.
ZALECENIA
Przekierowania 301 wykorzystać można np. do:
- wskazania preferowanej domeny np. www.domena.pl zamiast domena.pl;
- po wdrożeniu nowej strony stare adresy url należy przekierować przy użyciu
przekierowań 301 na odpowiadające im nowe adresy url nowej strony.
PORADA
Aby sprawdzić jaki typ przekierowania został zastosowany można wykorzystać narzędzie Web Sniffer.
Odpowiednie kody błędów aplikacji klienta 4XX . Najczęściej spotykane błędy aplikacji to 403 (Forbidden – dostęp zabroniony) i 404 (Not Found – nie znaleziony), który może zostać pomylony z 410 (Gone – zasób został usunięty). 404 należy stosować na nieistniejących nigdy podstronach, które nigdy nie były i nie są nadal dostępne. Jeśli usunięto istniejącą wcześniej podstronę (bez przenoszenia jej zawartości na nowy adres), powinna ona zwracać 410. Różnica polega na tym, że Google może kilkakrotnie odpytywać podstronę zwracającą
404, zanim usunie ją z indeksu, ponieważ weźmie pod uwagę ewentualne chwilowe problemy techniczne na stronie, przez które taki błąd może się pojawić. Jeśli jednak zwrócony zostanie kod 410, będzie to oznaczało, że zasób istniejący wcześniej został całkowicie usunięty. Tym samym, zgodnie z informacjami odpracowników Google, zostanie dużo szybciej wyindeksowany.
ZALECENIA
Wpisując wymyślony adres podstrony powinniśmy otrzymać nagłówek 404. Strony błędów nie mogą zwracać nagłówka HTTP 200 (ok) gdyż będą one indeksowane przez roboty wyszukiwarek. Dodatkowo, jeśli strona błędu o identycznej treści będzie pojawiać się pod wieloma adresami spowoduje to powstanie problemu duplikowania treści. Rezultatem tego będzie obniżenie wartości zdublowanych stron witryny dla wyszukiwarek oraz pojawianie się stron błędu w wynikach wyszukiwania.
Kody błędu wewnętrznego 5XX. Najczęstsze to 500 (Internal server error – wewnętrzny błąd serwera), 503 (Service unavailable – serwis niedostępny) oraz 504 (Gateway timeout – przekroczony czas oczekiwania na połączenie). W tym miejscu warto zaznaczyć, że w przypadku trwania prac nad serwisem, przez które może on być chwilowo niedostępny, należy zwrócić kod 503. Będzie to informacja dla wyszukiwarek, aby odwiedzić stronę ponownie w późniejszym czasie, ponieważ jej niedostępność jest chwilowa, bo wywołana pracami technicznymi.
Wykorzystanie protokołu https. W sierpniu 2014 roku Google ogłosiło, że certyfikat ssl/https stał się jednym z czynników rankingowych wpływających na pozycję strony w wynikach wyszukiwania. Dlatego warto zacząć stosować to szyfrowanie. Należy jednak pamiętać o wykonaniu przekierowań 301 z adresów zaczynających się od http na https gdyż dla wyszukiwarki adresy
http://www.domena.pl/podstrona
https://www.domena.pl/podstrona
to dwie różne podstrony. Protokół https:// powinien być dodany do wszystkich elementów wewnętrznych np. grafik, plików css itd. Ponadto jeśli w kodzie występują adresy bezwzględne należy zamienić je na adresy względne.
Dostęp dla robotów wyszukiwarek
Plik robots.txt. Plik ten powinien być dostępny pod adresem http://www.domena.pl/robots.txt Należy w nim zablokowaćdostęp do wybranych części strony do których nie powinny miećdostępu wyszukiwarki internetowe.
Blokada indeksacji wyników wyszukiwania. Wyniki wyszukiwania w wyszukiwarce dostępnej na stronie powinny być zablokowane przed indeksowaniem. Wyszukiwarki nie lubią indeksować tej samej zawartości na wielu podstronach, a wyniki wyszukiwania (podobnie jak opisane niżej sortowanie) prezentują te same dane, jednak w innej kolejności, lub nieco bardziej zawężone.
ZALECENIA
Blokadę taką można ustawić w pliku robots.txt lub poprzez użycie następującego
zapisu w sekcji META:
<meta name=”robots” content=”noindex”>
Blokada indeksacji wyników sortowania. Taka sama sytuacja jak w blokadzie wyników wyszukiwania.
Blokada dostępu do wybranych podstron. Oprócz opisanych już rodzajów wyników, które nie powinny być indeksowane, może zajść potrzeba dodania blokady dla innych podstron lub formatów plików. Dotyczy to głównie sytuacji, w których ta sama treść może zostać zaindeksowana pod różnymi adresami, a zatem będą to także podstrony z wersją do druku, wersją PDF do ściągnięcia itp. Niektórzy nie chcą także indeksować plików takich jak polityka prywatności, czy regulamin.
Brak dostępności strony lub jej elementów pod innymi adresami. Jeśli strona występuje pod kilkoma domenami to należ zadbać o to aby były one przekierowane (301) na domenę główną lub zablokowane do indeksacji. Podobnie z podstronami – nie mogą występować podstrony z identyczną treścią, gdyż brakuje wtedy kontroli pod jakim adresem zostanie zaindeksowana treść. W przypadku podstron duplikujących treści należy zastosować znacznik link canonical w celu wskazania która z podstron duplikujących treść jest stroną kanoniczną.