Roboty Google nieustannie przeszukują sieć w poszukiwaniu stron internetowych. Zbierają one informacje na ich temat i przesyłają je do indeksu, czyli bazy danych, z której później tworzone są wyniki wyszukiwania. Skanując witryny, roboty nie sprawdzają jednak wszystkich podstron od A do Z, poruszają się za pomocą linków. Mogą one znajdować je na stronach, ale możesz też je wskazać. Pozwala na to właśnie mapa witryny. To jeden z najważniejszych elementów, dzięki którym zadbasz o prawidłową indeksację. Ta część Akademii SEO poświęcona jest mapie witryny. Dowiesz się z niej, czym jest plik sitemap.xml i jak go używać. Pokażemy Ci też, w jaki sposób możesz przesłać mapę do Google.
Spis treści:
- Czym jest plik sitemap?
- Do czego służy mapa strony?
- Czy mapa witryny jest potrzebna?
- Jak wygląda mapa witryny?
- Dodatkowe znaczniki używane w pliku sitemap
- Rodzaje map strony
- Standardowy plik sitemap.xml
- Jak stworzyć plik sitemap?
- Gdzie powinna zostać umieszczona mapa strony?
- Jak przesłać plik sitemap do Google?
- Podsumowanie
Powiązane:
Czym jest plik sitemap?
Plik sitemap, czyli mapa strony, to odpowiednio sformułowana lista adresów URL Twojej witryny. Formatem tego pliku jest XML (Extensible Markup Language), czyli język pozwalający przechowywać informacje czytelne zarówno dla komputerów, jak i użytkowników. Składnia pliku sitemap opiera się na zdefiniowanych z góry znacznikach. Dzięki nim wszystkie strony mogą przekazywać informacje o adresach URL w identyczny sposób. To z kolei sprawia, że Google może bezproblemowo je przetwarzać.
W mapie Twojej witryny powinny znaleźć się wszystkie strony, które mają być widoczne w wynikach wyszukiwania. Jeśli chcesz, by dana podstrona była indeksowana, umieść ją w pliku sitemap. To sprawia, że mapa strony jest jednym z elementów pozycjonowania.
Do czego służy mapa strony?
Mapa witryny pozwala wskazać robotom Google podstrony, na których widoczności w wyszukiwarce najbardziej Ci zależy. Dzięki temu zostaną one szybciej zindeksowane.
Google nie dysponuje zasobami pozwalającymi na codzienne skanowanie każdej strony, dlatego ogranicza swoje działania, analizując witryny "po trochę". W przypadku rozbudowanych serwisów indeksacja całości może zajmować długie miesiące, a sam proces nie zawsze przebiega też hierarchicznie (od najistotniejszych do najmniej ważnych). To właśnie usprawnieniu jego przebiegu służy mapa strony internetowej. Dzięki niej możesz zadbać o to, by indeksacja i skanowanie Twojej witryny przebiegało poprawnie.
Czy mapa witryny jest potrzebna?
W przypadku niewielkich stron internetowych proces indeksacji przebiega stosunkowo szybko. Jeśli Twój serwis liczy kilkanaście lub kilkadziesiąt podstron to Googleboty powinny odnaleźć je bez problemu. Sitemap jest potrzebny przede wszystkim w serwisach mocno rozbudowanych.
Sklepy internetowe i duże strony mają często setki lub nawet tysiące podstron, a przy takich ilościach natrafienie na najważniejsze z nich może zająć robotom indeksującym nawet kilka miesięcy. Przez ten czas nie będą one widoczne w wyszukiwarce ani odświeżane, całe prowadzone na nich SEO minie się więc z celem. Mapa strony pozwala temu zapobiec.
Przy małych projektach mapa strony internetowej może nie być konieczna, mimo to warto ją stworzyć. Może ona przyspieszyć indeksowanie nowej witryny, do której nie prowadzi zbyt wiele linków zewnętrznych. Sama wiedza na temat tego pliku może też przydać się w przyszłości, gdy zaczniesz intensywnie rozbudowywać swoją stronę (co jest niezbędnym elementem SEO).
Zapamiętaj
Mapa strony będzie przydatna przy indeksacji strony internetowej w wyszukiwarkach.
Jak wygląda mapa witryny?
Plik sitemap w formacie XML ma określoną z góry strukturę, opierającą się na znacznikach. Dzięki temu wszyscy używają jednego standardu. Każdy przesyła informacje o adresach URL w ten sam sposób, a Google może poprawnie je odczytywać.
Plik sitemap opiera się na trzech najważniejszych znacznikach:
-
<urlset>
- zestaw adresów URL, w którym zamieszcza się znaczniki <url> -
<url>
- znacznik, w którym zamieszcza się informacje dotyczące konkretnego adresu URL -
<loc>
- location, czyli znacznik oznaczający lokalizację podstrony, w którym umieszcza się pełny adres URL (wraz z protokołem HTTP lub HTTPS)
Tylko one są konieczne, by mapa witryny funkcjonowała prawidłowo. Za pośrednictwem innych znaczników można jednak przekazać jeszcze dodatkowe informacje.
Dodatkowe znaczniki używane w pliku sitemap
Oprócz trzech podstawowych znaczników w pliku sitemap można zastosować wiele innych. Wszystkie z nich mają na celu wskazanie robotom dodatkowych informacji dotyczących adresów zawartych w <loc>
. Wszystkie z nich zamieszcza się też oczywiście w znacznikach <url>
.
<lastmod>
Lastmod to znacznik informujący o dacie ostatniej modyfikacji treści znajdującej się pod wskazanym adresem. Oprócz znaczników podstawowych to on jest używany najczęściej. Dzięki niemu Googlebot wie, czy strona znajdująca się pod danym adresem zmieniła swoją treść od czasu ostatniej wizyty (ostatniego skanowania).
<changefreq>
Changefreq to znacznik określający częstotliwość zmian treści znajdującej się na danej stronie. Pozwala na zamieszczenie wartości: always, hourly, daily, weekly, monthly, yearly oraz never. Jest to wskazówka dla robotów informująca o tym, jak często zmienia się zawartość strony.
Parametru "always" używa się tylko dla stron dynamicznych, zmieniających zawartość za każdym razem, gdy ktoś uzyskuje do nich dostęp. Parametr "never" powinno się stosować z kolei tylko dla adresów zarchiwizowanych.
<xhtml:link>
Znacznik <xhtml:link>
pozwala wskazać inne wersje językowe podstrony umieszczonej w znaczniku <loc>
. Stosuje się go wyłącznie w plikach sitemap stron dostępnych w różnych językach (posiadających różne wersje językowe).
<priority>
Znacznik priority pozwalał dawniej określać priorytet adresów URL w zakresie 0.1 – 1. Dzięki niemu możliwe było wskazywanie robotom, jak istotna jest dla Ciebie dana strona. Aktualnie Google go pomija, oceniając priorytet samodzielnie, m.in. na podstawie wewnętrznych linków prowadzących do skanowanych adresów.
Rodzaje map strony
W zależności od zawartości i charakteru witryny mapa strony może występować w kilku wariantach. Przy bardzo dużych serwisach powszechne jest także tworzenie kilku plików sitemap i wykazywanie ich za pomocą mapy zbiorczej, czyli pliku indeksu map witryn.
W SEO nie chodzi o to,
żeby dać się znaleźć.
Ale, żeby dać komuś to,
czego szuka.
Standardowy plik sitemap.xml
Podstawowa mapa witryny, czyli standardowy plik sitemap, jest używany najczęściej. Zawiera wszystkie adresy URL domeny. Można stosować go na dosłownie każdej stronie internetowej. Niezależnie, czy jest to niewielka firmowa strona-wizytówka czy zawierający kilka tysięcy podstron sklep internetowy.
<?xml version="1.0" encoding="UTF-8"?>>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/foo.html</loc>
<lastmod>2021-06-01<lastmod>
</url>
</urlset>
Mapa witryny z obrazami
Mapa strony z obrazami to wersja wskazująca dodatkowo zdjęcia i obrazki zawarte na stronie. Stosuje się ją we wszelkich serwisach, których główną treścią jest grafika. Ułatwia ona Google indeksowanie obrazów, których Googleboty nie są w stanie samodzielnie odczytać. Elementy takiej mapy mogą zostać dodane do podstawowego pliku sitemap lub utworzyć osobny plik.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>http://example.com/sample1.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
</image:image>
<image:image>
<image:loc>http://example.com/photo.jpg</image:loc>
</image:image>
</url>
<url>
<loc>http://example.com/sample2.html</loc>
<image:image>
<image:loc>http://example.com/picture.jpg</image:loc>
<image:caption>śmieszne zdjęcia kota jedzącego przysmak</image:caption>
<image:geo_location>Wrocław, Polska</image:geo_location>
<image:title>Jedzący kot</image:title>
<image:license>http://example.com/image-license</image:license>
</image:image>
</url>
</urlset>
Mapa witryny wideo
Mapa witryny wideo zawiera informacje o filmach umieszczonych na stronie. Używa się jej głównie w serwisach bazujących na tego rodzaju treściach. Dzięki niej roboty mogą łatwiej odnaleźć i przeskanować zawarte na stronie materiały wideo. Podobnie jak mapa witryny z obrazami, jest to rozszerzenie standardowego pliku sitemap.
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
<url>
<loc>http://www.example.com/videos/some_video_landing_page.html</loc>
<video:video>
<video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc>
<video:title>Relacja z imprezy firmowej</video:title>
<video:description>Film przedstawiający imprezę integracyjną oczami jednego pracownika</video:description>
<video:content_loc>
http://streamserver.example.com/video123.mp4</video:content_loc>
<video:player_loc>
http://www.example.com/videoplayer.php?video=123</video:player_loc>
<video:duration>600</video:duration>
<video:expiration_date>2021-11-05T19:20:30+08:00</video:expiration_date>
<video:rating>4.2</video:rating>
<video:view_count>12345</video:view_count>
<video:publication_date>2007-11-05T19:20:30+08:00</video:publication_date>
<video:family_friendly>yes</video:family_friendly>
<video:restriction relationship="allow">IE GB PL HUN</video:restriction>
<video:price currency="PLN">19.99</video:price>
<video:requires_subscription>yes</video:requires_subscription>
<video:uploader
info="http://www.example.com/users/grillymcgrillerson">Autor filmu
</video:uploader>
<video:live>no</video:live>
</video:video>
</url>
</urlset>
Mapa strony dla Wiadomości Google (Google News)
Mapa strony Google News to rozwiązanie użyteczne dla portali publikujących i dostarczających wiadomości dla systemu Wiadomości Google. Można w niej wskazać adresy URL nowo opublikowanych artykułów, które dzięki temu nie zostaną pominięte w systemie. Taki rodzaj pliku sitemap nie daje przewagi rankingowej, pozwala jednak przyspieszyć pojawienie się newsów w aplikacji.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>http://www.example.org/business/article55.html</loc>
<news:news>
<news:publication>
<news:name>Przykładowy tytuł newsa</news:name>
<news:language>pl</news:language>
</news:publication>
<news:publication_date>2018-12-23</news:publication_date>
<news:title>Wesołych Świąt</news:title>
</news:news>
</url>
</urlset>
Indeks map witryn (Sitemap XML Index)
Sitemap Index to zbiorcza mapa strony internetowej wskazująca lokalizację innych map. Stosuje się ją w celu wskazania wszystkich map zawartych w serwisie. Jej istnienie wynika bezpośrednio z ograniczeń pliku sitemap, którego rozmiar nie może przekroczyć 50 MB i nie może zawierać więcej niż 50 tys. adresów URL.
Dzięki niej duże serwisy zawierające kilkaset tysięcy podstron nie muszą przesyłać do Google kilku map. Mogą przesłać indeks, dzięki czemu wszystkie wskazane w nim mapy zostaną automatycznie uwzględnione.
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
</sitemap>
</sitemapindex>
Jak stworzyć plik sitemap?
Plik sitemap można oczywiście stworzyć ręcznie, jest to jednak czasochłonne, niepraktyczne i zwyczajnie niepotrzebne. Istnieją sposoby, dzięki którym możesz wygenerować mapę witryny w dosłownie kilka sekund. Poniżej przedstawiamy te najpopularniejsze.
Zewnętrzne generatory plików sitemap
Użycie generatora jest jednym z najszybszych i najprostszych sposobów na stworzenie pliku sitemap. Generator map witryn to łatwa w obsłudze aplikacja web. Stworzenie mapy z jego pomocą wymaga tylko wklejenia adresu URL strony głównej i jednego kliknięcia. Po przeskanowaniu witryny otrzymasz gotowy do pobrania plik sitemap. Istnieje mnóstwo generatorów, większość z nich posiada jednak ograniczenia do kilkuset adresów URL. Przy większej ilości podstron trzeba już zapłacić.
https://www.xml-sitemaps.com/ - darmowa wersja posiada ograniczenie do 500 adresów URL
https://www.mysitemapgenerator.com/ - tutaj również, za darmo przeskanujemy 500 adresów URL
https://xmlsitemapgenerator.org/sitemap-generator.aspx - w tym narzędziu można przeskanować za darmo 2000 adresów URL
Crawlery SEO
Crawlery to narzędzia służące do skanowania witryn i zbierania informacji na temat różnych ich elementów. Przechodzą one przez wszystkie adresy serwisu, co oprócz zebrania danych skutkuje powstaniem listy wszystkich podstron. Mając tę listę mogą one bardzo łatwo wygenerować plik sitemap. Przykładem takiego narzędzia jest Screaming Frog SEO Spider. Niestety, tutaj też, w darmowej wersji mamy do czynienia z ograniczeniem do 500 adresów.
Generowanie mapy witryny za pomocą CMS
Plik sitemap możesz wygenerować także za pomocą używanego przez Ciebie CMS (Content Management System, np. Wordpress lub Joomla). Praktycznie każdy popularniejszy CMS posiada funkcję generowania map witryn lub pozwala na zainstalowanie odpowiedniej, służącej do tego wtyczki.
Generując mapę strony tym sposobem, nie spotkasz się z żadnymi ograniczeniami. Co więcej, będziesz mieć możliwość dodatkowego wpływania na kształt finalnego pliku. Użycie funkcji CMS pozwala też uniknąć błędów w zbieraniu adresów, które mogą pojawić się w zewnętrznych narzędziach.
Gdzie powinna zostać umieszczona mapa strony?
Mapa strony powinna zostać zamieszczona na serwerze, na którym znajduje się Twoja strona. Jeśli dotyczy całego serwisu, zmieść ją w głównym katalogu witryny (np. example.com/sitemap.xml).
Możesz też opublikować ją w innym katalogu (np. example.com/folder/sitemap.xml). Pamiętaj jednak, że będzie ona wtedy wpływać tylko i wyłącznie na te elementy, które się w nim znajdują.
Mapa strony internetowej nie musi mieć żadnej określonej nazwy, plik może nazywać się dowolnie. Zastosowanie nazwy "sitemap" zapewni Ci jednak odnalezienie mapy przez wszystkie wyszukiwarki (a nie tylko Google).
Jak przesłać plik sitemap do Google?
By stworzony przez Ciebie plik sitemap mógł spełnić swoje zadanie, musi zostać odnaleziony przez Google. Roboty indeksujące mogą trafić na niego samodzielnie, zawsze warto jednak im w tym pomóc. Adres mapy możesz wskazać za pomocą Google Search Console lub funkcji "ping". Możesz umieścić go także w pliku robots.txt.
Zgłoszenie mapy witryny w Google Search Console
Pierwszym i najczęściej używanym sposobem wskazania adresu pliku sitemap jest dodanie go w Google Search Console. Zaloguj się do panelu, z menu po lewej stronie ekranu wybierz "mapy witryn".
Podaj adres swojej mapy i kliknij "Prześlij", to wszystko. Już chwilę po przesłaniu Google Search Console udostępni Ci informacje na temat poprawności pliku i ewentualnych błędów. W tym samym miejscu masz też możliwość sprawdzenia stanu map dodanych wcześniej.
Jeśli nie masz jeszcze dostępu do Google Search Console, sprawdź, jak dodać do niego swoją stronę w poprzedniej lekcji.
Dodanie mapy strony za pomocą funkcji "Ping" (archiwalne)
AKTUALIZACJA: Ta metoda zgłaszania plików sitemap została wycofana, co Google ogłosiło w lipcu 2023 (SEO News #90). Firma rekomenduje korzystanie z pozostałych sposobów.
Kolejny sposób zgłoszenia adresu pliku sitemap to wysłanie specjalnego zapytania do serwera Google. Możesz zrobić to poprzez wpisanie w przeglądarce poniższego adresu.
https://www.google.com/ping?sitemap=https://example.com/sitemap.xml
Sposób ten został stworzony głównie w celu umożliwienia automatycznego przesyłania map wygenerowanych np. w CMS. Nic nie stoi jednak na przeszkodzie skorzystaniu z niego "ręcznie".
Adres pliku sitemap w robots.txt
Adres, pod którym znajduje się stworzona przez Ciebie mapa strony internetowej możesz zamieścić także w pliku robots.txt. Wystarczy dodać do niego dyrektywę "Sitemap:" i wkleić pełny adres.
Sitemap: https://example.com/sitemap.xml
Dzięki tej dyrektywie Googleboty odwiedzające Twoją stronę łatwo odnajdą plik mapy i uwzględnią go w procesie indeksacji. Jeśli chcesz dowiedzieć się więcej na temat pliku robots.txt, przejdź do poprzedniej lekcji.
Podsumowanie
Mapa strony to jeden z elementów pozwalających zapanować nad procesem indeksacji i skanowania witryny. Za pomocą tego prostego pliku możesz zadbać o widoczność najważniejszych podstron Twojego serwisu w wyszukiwarce. Dzięki niemu Googleboty będą wiedzieć o ich istnieniu, a Ty będziesz pozycjonować skuteczniej.
Z tego artykułu dowiedziałeś się:
- Czym jest mapa strony i do czego ona służy
- Jak stworzyć mapę strony internetowej
- Gdzie umieścić sitemap i jak ją dodać do Google