08.12.2025#Crawling

Robots.txt - Kompletny przewodnik z przykładami

Shopify API

Ekspert SEO

Spis tresci

Robots.txt kontroluje crawlowanie strony przez boty. Źle skonfigurowany może zablokować indeksację lub marnować crawl budget.

Czym jest robots.txt

Robots.txt to plik tekstowy w root domeny (example.com/robots.txt) zawierający instrukcje dla crawlerów.

Podstawowa składnia

# Komentarz
User-agent: *
Disallow: /admin/
Allow: /admin/public/
Sitemap: https://example.com/sitemap.xml

Dyrektywy

Dyrektywa	Znaczenie
User-agent	Dla którego bota są reguły
Disallow	Blokuj crawlowanie
Allow	Zezwól (override Disallow)
Sitemap	Lokalizacja sitemap
Crawl-delay	Opóźnienie między requests (nie Google)

User-agents

Główne crawlery

Googlebot - główny crawler Google
Googlebot-Image - crawler obrazów
Bingbot - Microsoft Bing
facebookexternalhit - Facebook sharing
Twitterbot - Twitter cards
* - wszystkie boty

Przykłady robots.txt

E-commerce (Shopify)

User-agent: *
Disallow: /admin
Disallow: /cart
Disallow: /checkout
Disallow: /account
Disallow: /search
Disallow: /*?*sort=
Disallow: /*?*filter=
Disallow: /*?*variant=
Disallow: /collections/*+*
Allow: /collections/
Allow: /products/

Sitemap: https://example.com/sitemap.xml

WordPress

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/cache/
Disallow: /author/
Disallow: /tag/
Disallow: /*?s=
Disallow: /*?p=
Disallow: /page/

Sitemap: https://example.com/sitemap_index.xml

Wildcard patterns

"Google obsługuje * (wildcard) i $ (end of URL) w robots.txt." - Google Developers

Pattern	Znaczenie
/folder/	Wszystko zaczynające się od /folder/
/*?	URL z parametrami query
/*.pdf$	Pliki PDF
/*/feed/	Wszystkie feedy RSS

Typowe błędy

1. Blokowanie CSS/JS

NIE RÓB:

Disallow: /wp-content/
Disallow: /assets/

Google potrzebuje CSS/JS do renderowania!

2. Blokowanie całej strony

User-agent: *
Disallow: /

Blokuje WSZYSTKO - używaj ostrożnie.

3. Mieszanie Disallow i noindex

Disallow ≠ noindex!

Disallow - blokuje crawlowanie, ale strona może być w indeksie
noindex - usuwa z indeksu, ale wymaga crawlowania

Testowanie robots.txt

Narzędzia

Google Search Console - robots.txt Tester (legacy)
robots.txt validator - technicalseo.com
Screaming Frog - Configuration > robots.txt

Allow vs Disallow precedence

Google używa most specific rule:

Disallow: /folder/
Allow: /folder/allowed-page

/folder/allowed-page będzie crawlowane.

Crawl-delay

Nie wspierany przez Google, ale przez Bing:

User-agent: Bingbot
Crawl-delay: 10

Google używa GSC > Settings > Crawl rate.

Dynamiczny robots.txt

Można serwować różny robots.txt na podstawie:

Environment (staging vs production)
Kraju
User-agent

Ale zachowaj ostrożność - może wprowadzić w błąd.

Podsumowanie

Robots.txt to potężne narzędzie kontroli crawlowania. Używaj dla crawl budget optimization, ale pamiętaj: Disallow ≠ noindex.

Aktualności

AI Overviews Wygrywa tylko z Long-Tailem: Dlaczego to nowa era SEO (Dane GSC)

13% zapytan w Google wyswietla AI Overview - ale tylko te, ktore AI umie cytowac. Krotkie frazy umieraja. Long-tail z...

21.12.2025Arkadiusz Kotlinski

Czytaj więcej

Aktualności

December 2025 Core Update - Google Potwierdza Ongoing Updates

10 grudnia 2025 Google po cichu zaktualizowal dokumentacje core updates. Dwa dni pozniej wystartowal December 2025 ...

17.12.2025Arkadiusz Kotlinski

Czytaj więcej

Aktualności

SEO 2025 Podsumowanie - Co Działało, Co Nie i Prognozy na 2026

2025 rok przeszedł do historii jako rok, w którym AI na dobre weszło do SEO. Trzy Core Update'y, AI Overviews w 13%...

16.12.2025Arkadiusz Kotlinski

Czytaj więcej

Zobacz wszystkie artykuły

Skaluj Biznes

Potrzebujesz wsparcia SEO?

Umów się na bezpłatną konsultację

Zaczynamy!

Kontakt

30 dni gwarancji

Your cart

Your cart is empty

Your cart

Estimated total

Robots.txt - Kompletny przewodnik z przykładami

Shopify API

Czym jest robots.txt

Podstawowa składnia

Dyrektywy

User-agents

Główne crawlery

Przykłady robots.txt

E-commerce (Shopify)

WordPress

Wildcard patterns

Typowe błędy

1. Blokowanie CSS/JS

2. Blokowanie całej strony

3. Mieszanie Disallow i noindex

Testowanie robots.txt

Narzędzia

Allow vs Disallow precedence

Crawl-delay

Dynamiczny robots.txt

Podsumowanie

Czytaj także

AI Overviews Wygrywa tylko z Long-Tailem: Dlaczego to nowa era SEO (Dane GSC)

December 2025 Core Update - Google Potwierdza Ongoing Updates

SEO 2025 Podsumowanie - Co Działało, Co Nie i Prognozy na 2026

Potrzebujesz wsparcia SEO?

Zaczynamy!