cmsatora.pl

Screaming Frog SEO Spider - Jak znaleźć błędy, których nie widzisz?

Konstanty Wróblewski.

15 marca 2026

Panel boczny narzędzia SEO z opcją "Google Search Console" i ikoną przypominającą screaming frog seo spider.
Screaming Frog SEO Spider to jedno z najpraktyczniejszych narzędzi do technicznego audytu strony. W praktyce pokazuje, gdzie witryna traci na indeksacji, strukturze linków, przekierowaniach, duplikacji treści i błędach wdrożeniowych, zanim te problemy odbiją się na ruchu i konwersji. Poniżej zebrałem to, co naprawdę warto wiedzieć: jak działa crawler, co sprawdza, kiedy daje najlepszy efekt i gdzie ma swoje granice.

Najważniejsze informacje o audycie technicznym i pracy z crawlerem

  • Najmocniej pomaga w technicznym SEO, bo szybko wykrywa błędy indeksacji, przekierowań, meta danych i linkowania wewnętrznego.
  • Darmowa wersja pozwala przeskanować do 500 URL-i w jednym crawl'u, co wystarcza do małych serwisów i testów.
  • Wersja płatna odblokowuje większe crawl'e, zapis sesji i funkcje zaawansowane, przydatne w większych projektach.
  • Duże serwisy wymagają sensownej konfiguracji: najlepiej SSD, trybu database storage i odpowiedniej ilości RAM.
  • To nie jest zamiennik Google Search Console; crawler pokazuje stan techniczny witryny, ale nie zastępuje danych o zachowaniu Google.
  • Największą wartość daje w procesie, a nie przy jednorazowym uruchomieniu: przed migracją, po wdrożeniach i przy kontroli jakości contentu.

Czym jest to narzędzie i kiedy naprawdę się przydaje

To crawler do audytów SEO, czyli program, który przechodzi przez stronę podobnie jak robot wyszukiwarki i zbiera dane o URL-ach, nagłówkach, statusach odpowiedzi, przekierowaniach, canonicalach, meta robots, hreflangach oraz linkach wewnętrznych. W praktyce traktuję go jako szybki skaner jakości witryny: nie po to, żeby zastąpić analizę strategiczną, ale żeby bez zgadywania znaleźć techniczne wąskie gardła.

Najlepiej sprawdza się wtedy, gdy trzeba uporządkować duży serwis, zweryfikować migrację, wyłapać błędy na szablonach albo sprawdzić, czy nowe podstrony są poprawnie podpięte pod architekturę informacji. W e-commerce przydaje się do kategorii, filtrów i paginacji; w B2B do landingu i bloga; w portalach do kontroli duplikacji i skalowalności. Jeśli strona ma sensowną liczbę podstron i zależy Ci na szybkim obrazie sytuacji, to jest jedno z pierwszych narzędzi, po które sięgam.

Warto też pamiętać, że crawler daje odpowiedź na pytanie „co jest technicznie nie tak”, ale nie zawsze od razu odpowiada na pytanie „co najpierw naprawić”. Do tego dojdę później, bo właśnie priorytety zwykle robią największą różnicę.

Panel kontrolny SEO z raportami: stan strony 90%, błędy, ostrzeżenia, powiadomienia, indeksowanie 96%, HTTPS 100%. Działa jak screaming frog seo spider.

Co wykrywa podczas crawl'a i dlaczego te sygnały mają znaczenie

Największa wartość tego typu narzędzia polega na tym, że łączy w jednym raporcie problemy, które normalnie trzeba by wyłapywać ręcznie w kilku miejscach. Dzięki temu szybciej widać nie tylko pojedyncze błędy, ale też wzorce, na przykład masowe przekierowania, duplikaty tytułów w całych sekcjach albo źle zbudowaną architekturę linków.
Obszar Co pokazuje Dlaczego to ważne
Błędy odpowiedzi 4xx, 5xx, martwe linki Użytkownik trafia w ślepy zaułek, a robot traci czas na nieistniejące adresy.
Przekierowania 301, 302, łańcuchy, pętle Wydłużają ścieżkę do docelowego URL-a i rozmywają sygnały techniczne.
Meta dane Duplikaty i braki w title oraz description To wpływa na indeksację i CTR, czyli realną widoczność w wynikach.
Indeksacja noindex, canonical, blokady robots.txt Możesz przypadkiem wycinać ważne strony z indeksu albo dublować wersje treści.
JavaScript Treść i linki widoczne po renderowaniu Na stronach opartych o React, Angular czy podobne frameworki to często różnica między „widać” a „nie istnieje”.
Hreflang i wersje językowe Brakujące, błędne lub niespójne tagi W serwisach wielojęzycznych to jedna z najczęstszych przyczyn chaosu w indeksacji.
Struktura linków Głębokość kliknięć, linkowanie wewnętrzne, osierocone URL-e Pokazuje, które podstrony są zbyt daleko od homepage i które praktycznie nie dostają sygnałów wewnętrznych.
Dane strukturalne Błędy w schema.org i walidacji Pomaga wyłapać problemy, zanim odbiją się na wynikach rozszerzonych.

Najbardziej lubię w tym narzędziu to, że nie kończy się na samym „błąd wykryty”. Przy każdym problemie można zwykle dojść do źródła: szablonu, reguły przekierowania, blokady w robots, ustawienia CMS-a albo nieprawidłowego linkowania. To właśnie ten poziom szczegółowości zamienia audyt z raportu w realną listę prac dla SEO, contentu i devów.

Jeśli więc wiesz już, co crawler potrafi znaleźć, naturalne pytanie brzmi: jak go ustawić, żeby pierwszy audyt nie był przypadkowym zrzutem danych, tylko sensownym procesem.

Jak zacząć pracę z Screaming Frog SEO Spider bez marnowania czasu

Ja zwykle zaczynam od zakresu, bo to on decyduje, czy dostanę użyteczny obraz sytuacji, czy tylko hałas. Dla małych serwisów wystarczy pełny crawl domeny, ale przy większych projektach rozsądniej jest zacząć od sitemap.xml, listy najważniejszych URL-i albo konkretnego katalogu, na przykład sekcji produktowej czy blogowej.

  1. Ustal cel audytu - inaczej pracuje się przed migracją, inaczej przy optymalizacji bloga, a jeszcze inaczej przy e-commerce z tysiącami filtrów.
  2. Wybierz właściwy tryb pracy - przy mniejszych serwisach wystarczy standardowy crawl, przy większych lepiej przygotować tryb zapisujący dane na dysku.
  3. Sprawdź, czy potrzebujesz renderowania JavaScript - bez tego część treści i linków może po prostu nie zostać odczytana.
  4. Nie ignoruj robots.txt i meta robots bez powodu - czasem blokada jest celowa, a czasem ukrywa błąd wdrożenia.
  5. Po zakończeniu crawl'a eksportuj dane - same filtry w aplikacji są wygodne, ale dopiero eksport pozwala sensownie podzielić pracę między zespół SEO, content i developerów.

W dużych witrynach zwracam też uwagę na sprzęt. Według oficjalnej dokumentacji przy crawl'ach poniżej 200 tysięcy URL-i 8 GB RAM zwykle wystarcza, a do serwisów powyżej miliona adresów zalecany jest SSD i co najmniej 16 GB RAM. Przy naprawdę dużych projektach tryb database storage jest po prostu bezpieczniejszy niż próba „przepchnięcia” wszystkiego przez samą pamięć operacyjną.

W praktyce najwięcej czasu oszczędza mi jedna zasada: najpierw ustawiam crawl tak, żeby odzwierciedlał realny problem biznesowy, a dopiero potem odpalam pełny skan. To prowadzi wprost do kolejnego kroku, czyli interpretacji wyników bez złudzeń i bez paniki.

Jak czytać wyniki i ustalać priorytety napraw

Raport z crawl'a potrafi przytłoczyć, jeśli patrzy się na niego jak na listę błędów do wyczyszczenia „od góry do dołu”. Ja wolę trzymać się prostego porządku: najpierw problemy blokujące indeksację lub widoczność, potem problemy wpływające na skalę i jakość sygnałów, a dopiero na końcu rzeczy kosmetyczne.

W praktyce najważniejsze pytania są trzy: czy problem dotyczy stron strategicznych, czy powtarza się na dużą skalę i czy naprawdę wpływa na SEO albo UX. Z tego powodu pojedynczy błąd 404 na mało ważnej podstronie nie powinien wygrywać z błędnym noindex na całym szablonie kategorii. To brzmi banalnie, ale właśnie tu najczęściej pojawia się zła kolejność prac.

  • Najpierw blokady indeksacji - noindex, błędne canonicale, robots.txt, błędy serwerowe.
  • Potem przekierowania i architektura - łańcuchy, pętle, osierocone URL-e, zbyt głębokie podstrony.
  • Następnie treści i metadane - duplikaty title, opisy, nagłówki, wersje językowe.
  • Na końcu poprawki porządkowe - drobne problemy semantyczne, mniej istotne braki w znacznikach i elementy estetyczne raportu.

Dobry audyt techniczny nie kończy się na wskazaniu błędu. Ja zawsze dopisuję obok niego odpowiedź na pytanie: „co to realnie psuje?”. Jeśli nie da się połączyć problemu z wpływem na widoczność, indeksację, ruch albo konwersję, to zwykle ląduje niżej w kolejce. Taki sposób pracy oszczędza czas i chroni przed poprawianiem rzeczy, które dobrze wyglądają w raporcie, ale niewiele zmieniają w biznesie.

To naturalnie prowadzi do ograniczeń, bo żaden crawler nie widzi całej prawdy o stronie i jej pozycji w Google.

Gdzie crawler ma granice i kiedy potrzebujesz innych danych

To narzędzie świetnie pokazuje stan techniczny witryny, ale nie zastępuje danych z Google Search Console, analityki ani logów serwera. Crawlowanie mówi mi, co jest dostępne i jak wygląda od strony technicznej, natomiast Search Console pokazuje, jak Google naprawdę interpretuje część sygnałów, a logi serwera ujawniają, czego robot faktycznie próbuje odwiedzać. Te trzy źródła dopiero razem dają pełen obraz.

Najczęstszy błąd polega na tym, że ktoś traktuje każdy wynik crawl'a jak bezdyskusyjny problem. Tymczasem niektóre blokady są celowe, część stron może być ukryta za logowaniem, a niektóre sekcje po prostu nie powinny wejść do indeksu. Trzeba odróżnić błąd od decyzji projektowej. To szczególnie ważne przy serwisach z filtrami, strefami premium, landingami kampanijnymi i rozbudowanymi aplikacjami opartymi o JavaScript.

Jest jeszcze jedna rzecz, którą początkujący często przeceniają: sam crawl nie powie Ci, czy problem wpływa na sprzedaż, leady albo widoczność w najbardziej wartościowych zapytaniach. Do tego potrzebujesz połączenia techniki z biznesem. Czasem lepiej naprawić trzy strony, które generują ruch i przychód, niż sto technicznych drobiazgów na marginesie serwisu.

Dlatego właśnie crawler działa najlepiej jako część procesu, a nie jako jedyne źródło prawdy. Gdy już wiesz, co poprawiać i czego nie brać za błąd, zostaje bardzo praktyczne pytanie: czy darmowa wersja wystarczy, czy jednak trzeba inwestować w licencję.

Wersja darmowa, licencja i sprzęt, który ma znaczenie

W oficjalnym cenniku narzędzie jest darmowe do 500 URL-i w jednym crawl'u. To wystarcza do testów, małych stron, pojedynczych sekcji albo szybkiej walidacji po wdrożeniu. Jeśli jednak chcesz pracować na większym serwisie, zapisywać crawl'e, korzystać z renderowania JavaScript, custom extraction czy integracji API, potrzebna jest licencja za 199 funtów rocznie.

Wariant Dla kogo Ograniczenia Największa korzyść
Darmowy Małe strony, testy, szybka diagnoza pojedynczych sekcji Limit 500 URL-i, ograniczone funkcje zaawansowane Zero kosztu wejścia i szybki podgląd problemów
Płatny Agencje, działy SEO, większe witryny i migracje Brak istotnego limitu dla standardowej pracy, ale wymaga lepszego sprzętu przy dużej skali Pełny zakres audytu, zapis crawl'i i automatyzacje

Od strony sprzętowej sensowny punkt startu to nie tylko RAM, ale też dysk. Przy małych audytach różnica nie jest wielka, ale przy większych serwisach SSD bardzo pomaga, bo w trybie database storage program zapisuje dane na dysku i może skanować miliony URL-i przy znacznie stabilniejszej pracy. Oficjalna dokumentacja podaje, że dla crawl'i poniżej 2 milionów URL-i dobrym punktem odniesienia jest 4 GB RAM w database storage, a przy serwisach powyżej miliona URL-i rekomendowane jest 16 GB RAM lub więcej z SSD.

Ja traktuję to tak: jeśli audyty mają być częścią stałej pracy, a nie jednorazowym eksperymentem, licencja zwykle zwraca się szybciej niż się wydaje. Oszczędza czas zespołu, upraszcza raportowanie i pozwala skupić się na interpretacji danych, a nie na walce z limitem. Zostaje jeszcze ostatni, bardzo praktyczny temat: jak włączyć taki crawler do codziennej pracy SEO i contentu.

Jak włączyć crawler do stałego procesu SEO i contentu

Największy sens widzę w używaniu go jako narzędzia kontrolnego przed i po zmianach. Przed migracją pozwala porównać stan starej i nowej wersji serwisu, po wdrożeniu sprawdza, czy przekierowania i canonicale działają, a przy rozbudowie treści pokazuje, czy nowe podstrony są poprawnie podpięte do reszty witryny. To nie jest jednorazowy skaner, tylko element higieny technicznej.

W 2026 dochodzi jeszcze jeden ciekawy kierunek: najnowsze wydanie narzędzia można spinać z asystentami AI przez MCP, co ułatwia uruchamianie crawl'i, podsumowywanie wyników i automatyzację części pracy. Traktowałbym to jednak jako wsparcie, a nie zastępstwo dla decyzji SEO. AI może przyspieszyć opis problemu, ale priorytety nadal trzeba ustalać po ludzku, w kontekście biznesu i struktury witryny.

Jeśli miałbym zamknąć temat jednym zdaniem, powiedziałbym tak: to narzędzie jest najbardziej wartościowe wtedy, gdy pomaga łączyć technikę, content i rozwój produktu w jeden proces, zamiast produkować kolejny raport do szuflady. Właśnie wtedy daje realny zwrot - szczególnie przy serwisach, które rosną, zmieniają strukturę albo regularnie przechodzą większe wdrożenia.

FAQ - Najczęstsze pytania

Darmowa wersja pozwala na skanowanie do 500 adresów URL. Jest idealna dla małych stron lub testowania konkretnych sekcji. Oferuje dostęp do podstawowych danych, takich jak kody odpowiedzi, meta tagi czy analiza linkowania wewnętrznego.

Narzędzie to pokazuje stan techniczny witryny z perspektywy crawlera, podczas gdy GSC dostarcza danych o rzeczywistej indeksacji przez Google i błędach widzianych bezpośrednio przez wyszukiwarkę. Oba źródła danych wzajemnie się uzupełniają.

Licencja jest niezbędna przy serwisach powyżej 500 URL-i. Odblokowuje funkcje takie jak renderowanie JavaScript, zapisywanie sesji oraz integrację z Google Analytics i Search Console, co jest kluczowe przy profesjonalnych audytach i migracjach.

Przy dużych projektach zaleca się korzystanie z trybu Database Storage, dysku SSD oraz minimum 16 GB pamięci RAM. Pozwala to na stabilną pracę i uniknięcie problemów z wydajnością podczas skanowania milionów adresów URL.

Oceń artykuł

Ocena: 0.00 Liczba głosów: 0
rating-outline
rating-outline
rating-outline
rating-outline
rating-outline

Tagi

audyt techniczny strony screaming frogscreaming frog seo spiderscreaming frog seo spider jak używaćscreaming frog wersja darmowa ograniczeniajak czytać raporty screaming frogscreaming frog konfiguracja dla dużych serwisów
Autor Konstanty Wróblewski
Konstanty Wróblewski
Jestem Konstanty Wróblewski, doświadczonym analitykiem w dziedzinie nowoczesnych technologii, IT i chmury. Od ponad dziesięciu lat zajmuję się badaniem rynku oraz pisaniem o innowacjach technologicznych, co pozwoliło mi zgromadzić szeroką wiedzę na temat aktualnych trendów oraz najlepszych praktyk w branży. Moje zainteresowania koncentrują się na analizie danych, rozwoju oprogramowania oraz zjawiskach związanych z chmurą obliczeniową. Moim celem jest uproszczenie złożonych zagadnień technologicznych i dostarczenie czytelnikom obiektywnej analizy, która pomoże im zrozumieć dynamicznie zmieniający się świat IT. Dokładam wszelkich starań, aby moje artykuły były rzetelne, aktualne i oparte na sprawdzonych informacjach, co pozwala mi budować zaufanie wśród odbiorców. Wierzę, że dzielenie się wiedzą jest kluczowe, aby wspierać rozwój technologiczny i innowacyjność w Polsce.

Napisz komentarz