Perplexity wylatuje z programu Verified Bots od Cloudlfare i nie może indeksować ich stron. Konwersacje z ChataGPT nie będą już indeksowane w Google, bo pojawiły się problemy z prywatnością użytkowników i rozmów. Google przygotowuje wydawców do nadejścia reklam w AI Mode. Poza tym: Ahrefs bada, czy wyszukiwarki AI wolą starsze czy nowsza źródła, a także kilka słów o (częściowo) zamykanej usłudze goo.gl.
1. Cloudflare blokuje Perplexity dostęp do stron
Nie da się ukryć, że lekko się zagotowało na linii Cloudlfare-Perplexity. Pojawiły się oskarżenia o stosowanie nieczystych praktyk i naruszenie zasad w zakresie zweryfikowanych botów indeksujących.
O co poszło?
Cloudflare podjął kroki przeciwko Perplexity AI w odpowiedzi na skargi klientów, którzy twierdzili, że mimo zastosowania reguł robots.txt i zapór blokujących oficjalne boty Perplexity (PerplexityBot i Perplexity‑User) system nadal miał dostęp do treści na ich stronach.
W kolejnych testach Cloudflare wykazał, że Perplexity zignorowało wyraźny zakaz crawlingu i pobierania danych ze stron. Narzędzie odpowiadało na pytania o zupełnie nowe, zamknięte domeny, które nigdy nie były publicznie udostępniane ani indeksowane.

Ciekawie robi się w momencie, gdy czytamy o metodach stosowanych rzekomo przez Perplexity i ich boty:
- Rotowanie adresów IP i zmiany ASN-ów (numerów, które identyfikują sieci danych operatorów) – oficjalnie używano adresów IP dla zadeklarowanych botów (generujących około 20–25 milionów żądań każdego dnia), lecz gdy ten bot był blokowany, korzystano podobno z alternatywnych adresów, co generowało dodatkowe 3-6 mln żądań.
- Fałszowanie User-Agent – Perplexity sprawiało wrażenie zweryfikowanego bota, ale przy blokadach przełączało się na stealth user-agenta, który udawał przeglądarkę Chrome na macOS.
Efekt? Cloudflare usunął Perplexity ze swojego programu Verified Bots, co oznacza koniec traktowania ich crawlerów jako zaufanych – teraz są one blokowane automatycznie.
Widać, że Cloudflare się nie patyczkuje i zależy im na skutecznej ochronie danych klientów oraz gwarancji większej kontroli nad ich stronami. Nie tak dawno pisałem, że uruchomili oni narzędzie Pay Per Crawl umożliwiające właścicielom witryn blokowanie oraz monetyzowanie dostępu dla robotów AI.
Przedstawiciele Perplexity uważają całą sytuację za publiczny atak – zaprzeczyli, że ich boty uzyskały dostęp do zablokowanych treści.
Twierdzą, iż asystenci AI działają na żądanie użytkownika, a systemy Cloudflare są najwyraźniej niewystarczająco rozbudowane, żeby odróżnić realny problem od (według nich) zmyślonego.
2. ChatGPT wyłącza możliwość indeksowania konwersacji w Google
Wiedzieliście, że w ogóle była taka opcja?
Okazuje się, że Google mogło bez problemu indeksować czaty (udostępniane za pomocą linków z ChatGPT) – za wyjątkiem konwersacji użytkowników korzystających z planu Enterprise.
Jakiś czas temu w branży zrobiło się dość głośno o przypadku jednego z konsultantów z firmy Deloitte. W trakcie rozmowy z AI ujawnił on prywatne informacje o sobie i miejscu pracy, m.in. swój wiek i precyzyjny opis stanowiska.
Te i inne informacje były dostępne dla każdego, kto wpisał w Google odpowiednią komendę. Wyglądała ona tak – “site:chatgpt.com/share + [słowo kluczowe]”.
Użytkownicy mogli w ten sposób przeglądać setki czy nawet tysiące czatów, które wcześniej były udostępniane przez inne osoby – a w nich sprawdzać prompty, odpowiedzi itd.
To tworzyło ogromną lukę w prywatności i zagrożenie dla bezpieczeństwa danych firmowych. Konkurencja mogła przecież zbić na tych informacjach potężny kapitał i wykorzystać je do swoich celów.
Wygląda jednak na to, że OpenAI postanowiło z tym skończyć.
Twórcy ChataGPT ogłosili, że funkcja publicznego udostępniania swoich rozmów zostaje usunięta z narzędzia.

Napisali oni, że był to jedynie „krótkotrwały eksperyment” – w praktyce wprowadził on zbyt wiele opcji przypadkowego udostępniania informacji, którymi użytkownicy często wcale nie chcieli się dzielić.
Podkreślono też, że ryzyko wycieku danych przeważało nad potencjalnymi korzyściami – czyli możliwością odkrywania nowych, przydatnych konwersacji.

3. Google reklamuje… reklamy w AI Mode
Google przygotowuje się najwyraźniej do szerszego wdrożenia Trybu AI (który jest już dostępny w UK) – w tym formatów reklamowych.
Po sieci krążą slajdy i pierwsze informacje o planowanych nowościach, m.in. o tym, jak w praktyce będzie działać płatne wyszukiwanie w AI Mode.

Dowiadujemy się, że reklamy będą dostępne w formie tekstowej i produktowej w wyszukiwarce Google, Google Shopping oraz kampaniach Performance Max. Początkowo wyświetlać się będą wyłącznie po angielsku.
Zobaczą je użytkownicy zarówno komputerów osobistych, jak i urządzeń mobilnych.
Aby wyświetlać reklamy w Trybie AI, potrzebne będą rozwiązania targetowania oparte na AI, w tym dopasowania przybliżone w kampaniach w wyszukiwarce oraz AI Max for Search (wersja beta), Performance Max i reklamach Google Shopping.
Oprócz tego możemy sprawdzić, jak w ogóle działa Tryb AI w Google. Dostaliśmy też garść porad w kontekście pozycjonowania i widoczności, ale są one raczej oczywiste: skupienie się na wartościowych treściach, upewnienie się, czy systemy Google mają pełny dostęp do strony itd.

4. Asystenci AI wolą cytować świeższy content
Ahrefs przeanalizował 17 mln cytowań z kilku różnych wyszukiwarek AI (ChatGPT, Perplexity, Gemini, Copilot, Google AI Overviews), żeby sprawdzić, czy częściej odwołują się one do nowszych czy starszych treści – i jak to wypada w porównaniu ze standardowymi SERP-ami.
Zbadano średnią liczbę dni od publikacji cytowanej treści oraz średnią liczbę dni od ostatniej aktualizacji.
Główna obserwacja jest taka, że AI lubi nowy content – średni wiek cytowanych treści to niecałe 3 lata (dokładnie 1064 dni). Dla porównania, Google w swoim klasycznym wydaniu pokazuje wyniki starsze o niemal rok (średnio 1432 dni). To daje różnicę na poziomie 25,7%.

Najbardziej na czasie jest ChatGPT, który najchętniej linkuje treści mające 3 lata, a czasem nawet mniej. Google AI Overviews – paradoksalnie – wcale nie faworyzuje nowości. Zdarza mu się wyświetlać rzeczy jeszcze starsze niż klasyczne wyniki.

A jak z aktualizacjami starszych wpisów?
Narzędzia AI wolą treści, które są odświeżane częściej, choć różnica nie jest aż tak duża jak w przypadku zupełnie nowych artykułów.
Z ciekawszych wniosków warto wspomnieć jeszcze o zaobserwowanym wzorcu cytowania, który porządkuje źródła od najnowszych do najstarszych.
Taki schemat najczęściej pojawiał się w przypadku wyników z ChataGPT oraz Perplexity.
Pozostałe narzędzia (np. Gemini) wykazywały negatywną korelację między cytowaniem a wiekiem treści. Innymi słowy, działało to raczej w drugą stronę – starszy content zazwyczaj był wyświetlany jako pierwszy.
Łapcie link do pełnego badania: New Study: AI Assistants Prefer to Cite “Fresher” Content (17 Million Citations Analyzed).
5. Google nadal będzie wspierać usługę skracania adresów URL
Google częściowo wycofuje się z decyzji o zamknięciu usługi skracania linków “goo.gl”, uruchomionej jeszcze w 2010 roku. Pierwotnie zakładano, że wszystkie te odnośniki przestaną działać do 25 sierpnia tego roku.
Opcja tworzenia skróconych URL-i została wstrzymana w 2019 r., a w zeszłym roku zapowiedziano, że funkcja będzie całkowicie usunięta, bo podobno 99% tych linków było nieaktywnych.
Jednak po fali krytyki ze strony użytkowników i firm (które mają luźno osadzone linki w dokumentach, wideo czy postach) Google postanowił lekko zmienić plany. Niektóre linki przetrwają – jakie?
Wyłącznie aktywne – czyli te, które wykazywały ruch pod koniec 2024 roku. Te linki będą działać także po 25 sierpnia b.r.
Jeśli korzystacie z linków goo.gl, warto sprawdzić ich bieżący status – a w przypadku jakichkolwiek wątpliwości pomyśleć o migracji do innych usług, np. bit.ly czy ow.ly.