Najważniejsze informacje o audycie technicznym i pracy z crawlerem
- Najmocniej pomaga w technicznym SEO, bo szybko wykrywa błędy indeksacji, przekierowań, meta danych i linkowania wewnętrznego.
- Darmowa wersja pozwala przeskanować do 500 URL-i w jednym crawl'u, co wystarcza do małych serwisów i testów.
- Wersja płatna odblokowuje większe crawl'e, zapis sesji i funkcje zaawansowane, przydatne w większych projektach.
- Duże serwisy wymagają sensownej konfiguracji: najlepiej SSD, trybu database storage i odpowiedniej ilości RAM.
- To nie jest zamiennik Google Search Console; crawler pokazuje stan techniczny witryny, ale nie zastępuje danych o zachowaniu Google.
- Największą wartość daje w procesie, a nie przy jednorazowym uruchomieniu: przed migracją, po wdrożeniach i przy kontroli jakości contentu.
Czym jest to narzędzie i kiedy naprawdę się przydaje
To crawler do audytów SEO, czyli program, który przechodzi przez stronę podobnie jak robot wyszukiwarki i zbiera dane o URL-ach, nagłówkach, statusach odpowiedzi, przekierowaniach, canonicalach, meta robots, hreflangach oraz linkach wewnętrznych. W praktyce traktuję go jako szybki skaner jakości witryny: nie po to, żeby zastąpić analizę strategiczną, ale żeby bez zgadywania znaleźć techniczne wąskie gardła.
Najlepiej sprawdza się wtedy, gdy trzeba uporządkować duży serwis, zweryfikować migrację, wyłapać błędy na szablonach albo sprawdzić, czy nowe podstrony są poprawnie podpięte pod architekturę informacji. W e-commerce przydaje się do kategorii, filtrów i paginacji; w B2B do landingu i bloga; w portalach do kontroli duplikacji i skalowalności. Jeśli strona ma sensowną liczbę podstron i zależy Ci na szybkim obrazie sytuacji, to jest jedno z pierwszych narzędzi, po które sięgam.
Warto też pamiętać, że crawler daje odpowiedź na pytanie „co jest technicznie nie tak”, ale nie zawsze od razu odpowiada na pytanie „co najpierw naprawić”. Do tego dojdę później, bo właśnie priorytety zwykle robią największą różnicę.

Co wykrywa podczas crawl'a i dlaczego te sygnały mają znaczenie
Największa wartość tego typu narzędzia polega na tym, że łączy w jednym raporcie problemy, które normalnie trzeba by wyłapywać ręcznie w kilku miejscach. Dzięki temu szybciej widać nie tylko pojedyncze błędy, ale też wzorce, na przykład masowe przekierowania, duplikaty tytułów w całych sekcjach albo źle zbudowaną architekturę linków.| Obszar | Co pokazuje | Dlaczego to ważne |
|---|---|---|
| Błędy odpowiedzi | 4xx, 5xx, martwe linki | Użytkownik trafia w ślepy zaułek, a robot traci czas na nieistniejące adresy. |
| Przekierowania | 301, 302, łańcuchy, pętle | Wydłużają ścieżkę do docelowego URL-a i rozmywają sygnały techniczne. |
| Meta dane | Duplikaty i braki w title oraz description | To wpływa na indeksację i CTR, czyli realną widoczność w wynikach. |
| Indeksacja | noindex, canonical, blokady robots.txt | Możesz przypadkiem wycinać ważne strony z indeksu albo dublować wersje treści. |
| JavaScript | Treść i linki widoczne po renderowaniu | Na stronach opartych o React, Angular czy podobne frameworki to często różnica między „widać” a „nie istnieje”. |
| Hreflang i wersje językowe | Brakujące, błędne lub niespójne tagi | W serwisach wielojęzycznych to jedna z najczęstszych przyczyn chaosu w indeksacji. |
| Struktura linków | Głębokość kliknięć, linkowanie wewnętrzne, osierocone URL-e | Pokazuje, które podstrony są zbyt daleko od homepage i które praktycznie nie dostają sygnałów wewnętrznych. |
| Dane strukturalne | Błędy w schema.org i walidacji | Pomaga wyłapać problemy, zanim odbiją się na wynikach rozszerzonych. |
Najbardziej lubię w tym narzędziu to, że nie kończy się na samym „błąd wykryty”. Przy każdym problemie można zwykle dojść do źródła: szablonu, reguły przekierowania, blokady w robots, ustawienia CMS-a albo nieprawidłowego linkowania. To właśnie ten poziom szczegółowości zamienia audyt z raportu w realną listę prac dla SEO, contentu i devów.
Jeśli więc wiesz już, co crawler potrafi znaleźć, naturalne pytanie brzmi: jak go ustawić, żeby pierwszy audyt nie był przypadkowym zrzutem danych, tylko sensownym procesem.
Jak zacząć pracę z Screaming Frog SEO Spider bez marnowania czasu
Ja zwykle zaczynam od zakresu, bo to on decyduje, czy dostanę użyteczny obraz sytuacji, czy tylko hałas. Dla małych serwisów wystarczy pełny crawl domeny, ale przy większych projektach rozsądniej jest zacząć od sitemap.xml, listy najważniejszych URL-i albo konkretnego katalogu, na przykład sekcji produktowej czy blogowej.
- Ustal cel audytu - inaczej pracuje się przed migracją, inaczej przy optymalizacji bloga, a jeszcze inaczej przy e-commerce z tysiącami filtrów.
- Wybierz właściwy tryb pracy - przy mniejszych serwisach wystarczy standardowy crawl, przy większych lepiej przygotować tryb zapisujący dane na dysku.
- Sprawdź, czy potrzebujesz renderowania JavaScript - bez tego część treści i linków może po prostu nie zostać odczytana.
- Nie ignoruj robots.txt i meta robots bez powodu - czasem blokada jest celowa, a czasem ukrywa błąd wdrożenia.
- Po zakończeniu crawl'a eksportuj dane - same filtry w aplikacji są wygodne, ale dopiero eksport pozwala sensownie podzielić pracę między zespół SEO, content i developerów.
W dużych witrynach zwracam też uwagę na sprzęt. Według oficjalnej dokumentacji przy crawl'ach poniżej 200 tysięcy URL-i 8 GB RAM zwykle wystarcza, a do serwisów powyżej miliona adresów zalecany jest SSD i co najmniej 16 GB RAM. Przy naprawdę dużych projektach tryb database storage jest po prostu bezpieczniejszy niż próba „przepchnięcia” wszystkiego przez samą pamięć operacyjną.
W praktyce najwięcej czasu oszczędza mi jedna zasada: najpierw ustawiam crawl tak, żeby odzwierciedlał realny problem biznesowy, a dopiero potem odpalam pełny skan. To prowadzi wprost do kolejnego kroku, czyli interpretacji wyników bez złudzeń i bez paniki.
Jak czytać wyniki i ustalać priorytety napraw
Raport z crawl'a potrafi przytłoczyć, jeśli patrzy się na niego jak na listę błędów do wyczyszczenia „od góry do dołu”. Ja wolę trzymać się prostego porządku: najpierw problemy blokujące indeksację lub widoczność, potem problemy wpływające na skalę i jakość sygnałów, a dopiero na końcu rzeczy kosmetyczne.
W praktyce najważniejsze pytania są trzy: czy problem dotyczy stron strategicznych, czy powtarza się na dużą skalę i czy naprawdę wpływa na SEO albo UX. Z tego powodu pojedynczy błąd 404 na mało ważnej podstronie nie powinien wygrywać z błędnym noindex na całym szablonie kategorii. To brzmi banalnie, ale właśnie tu najczęściej pojawia się zła kolejność prac.
- Najpierw blokady indeksacji - noindex, błędne canonicale, robots.txt, błędy serwerowe.
- Potem przekierowania i architektura - łańcuchy, pętle, osierocone URL-e, zbyt głębokie podstrony.
- Następnie treści i metadane - duplikaty title, opisy, nagłówki, wersje językowe.
- Na końcu poprawki porządkowe - drobne problemy semantyczne, mniej istotne braki w znacznikach i elementy estetyczne raportu.
Dobry audyt techniczny nie kończy się na wskazaniu błędu. Ja zawsze dopisuję obok niego odpowiedź na pytanie: „co to realnie psuje?”. Jeśli nie da się połączyć problemu z wpływem na widoczność, indeksację, ruch albo konwersję, to zwykle ląduje niżej w kolejce. Taki sposób pracy oszczędza czas i chroni przed poprawianiem rzeczy, które dobrze wyglądają w raporcie, ale niewiele zmieniają w biznesie.
To naturalnie prowadzi do ograniczeń, bo żaden crawler nie widzi całej prawdy o stronie i jej pozycji w Google.
Gdzie crawler ma granice i kiedy potrzebujesz innych danych
To narzędzie świetnie pokazuje stan techniczny witryny, ale nie zastępuje danych z Google Search Console, analityki ani logów serwera. Crawlowanie mówi mi, co jest dostępne i jak wygląda od strony technicznej, natomiast Search Console pokazuje, jak Google naprawdę interpretuje część sygnałów, a logi serwera ujawniają, czego robot faktycznie próbuje odwiedzać. Te trzy źródła dopiero razem dają pełen obraz.Najczęstszy błąd polega na tym, że ktoś traktuje każdy wynik crawl'a jak bezdyskusyjny problem. Tymczasem niektóre blokady są celowe, część stron może być ukryta za logowaniem, a niektóre sekcje po prostu nie powinny wejść do indeksu. Trzeba odróżnić błąd od decyzji projektowej. To szczególnie ważne przy serwisach z filtrami, strefami premium, landingami kampanijnymi i rozbudowanymi aplikacjami opartymi o JavaScript.
Jest jeszcze jedna rzecz, którą początkujący często przeceniają: sam crawl nie powie Ci, czy problem wpływa na sprzedaż, leady albo widoczność w najbardziej wartościowych zapytaniach. Do tego potrzebujesz połączenia techniki z biznesem. Czasem lepiej naprawić trzy strony, które generują ruch i przychód, niż sto technicznych drobiazgów na marginesie serwisu.
Dlatego właśnie crawler działa najlepiej jako część procesu, a nie jako jedyne źródło prawdy. Gdy już wiesz, co poprawiać i czego nie brać za błąd, zostaje bardzo praktyczne pytanie: czy darmowa wersja wystarczy, czy jednak trzeba inwestować w licencję.
Wersja darmowa, licencja i sprzęt, który ma znaczenie
W oficjalnym cenniku narzędzie jest darmowe do 500 URL-i w jednym crawl'u. To wystarcza do testów, małych stron, pojedynczych sekcji albo szybkiej walidacji po wdrożeniu. Jeśli jednak chcesz pracować na większym serwisie, zapisywać crawl'e, korzystać z renderowania JavaScript, custom extraction czy integracji API, potrzebna jest licencja za 199 funtów rocznie.
| Wariant | Dla kogo | Ograniczenia | Największa korzyść |
|---|---|---|---|
| Darmowy | Małe strony, testy, szybka diagnoza pojedynczych sekcji | Limit 500 URL-i, ograniczone funkcje zaawansowane | Zero kosztu wejścia i szybki podgląd problemów |
| Płatny | Agencje, działy SEO, większe witryny i migracje | Brak istotnego limitu dla standardowej pracy, ale wymaga lepszego sprzętu przy dużej skali | Pełny zakres audytu, zapis crawl'i i automatyzacje |
Od strony sprzętowej sensowny punkt startu to nie tylko RAM, ale też dysk. Przy małych audytach różnica nie jest wielka, ale przy większych serwisach SSD bardzo pomaga, bo w trybie database storage program zapisuje dane na dysku i może skanować miliony URL-i przy znacznie stabilniejszej pracy. Oficjalna dokumentacja podaje, że dla crawl'i poniżej 2 milionów URL-i dobrym punktem odniesienia jest 4 GB RAM w database storage, a przy serwisach powyżej miliona URL-i rekomendowane jest 16 GB RAM lub więcej z SSD.
Ja traktuję to tak: jeśli audyty mają być częścią stałej pracy, a nie jednorazowym eksperymentem, licencja zwykle zwraca się szybciej niż się wydaje. Oszczędza czas zespołu, upraszcza raportowanie i pozwala skupić się na interpretacji danych, a nie na walce z limitem. Zostaje jeszcze ostatni, bardzo praktyczny temat: jak włączyć taki crawler do codziennej pracy SEO i contentu.
Jak włączyć crawler do stałego procesu SEO i contentu
Największy sens widzę w używaniu go jako narzędzia kontrolnego przed i po zmianach. Przed migracją pozwala porównać stan starej i nowej wersji serwisu, po wdrożeniu sprawdza, czy przekierowania i canonicale działają, a przy rozbudowie treści pokazuje, czy nowe podstrony są poprawnie podpięte do reszty witryny. To nie jest jednorazowy skaner, tylko element higieny technicznej.
W 2026 dochodzi jeszcze jeden ciekawy kierunek: najnowsze wydanie narzędzia można spinać z asystentami AI przez MCP, co ułatwia uruchamianie crawl'i, podsumowywanie wyników i automatyzację części pracy. Traktowałbym to jednak jako wsparcie, a nie zastępstwo dla decyzji SEO. AI może przyspieszyć opis problemu, ale priorytety nadal trzeba ustalać po ludzku, w kontekście biznesu i struktury witryny.
Jeśli miałbym zamknąć temat jednym zdaniem, powiedziałbym tak: to narzędzie jest najbardziej wartościowe wtedy, gdy pomaga łączyć technikę, content i rozwój produktu w jeden proces, zamiast produkować kolejny raport do szuflady. Właśnie wtedy daje realny zwrot - szczególnie przy serwisach, które rosną, zmieniają strukturę albo regularnie przechodzą większe wdrożenia.
