Duplicate Content – jak Google rozpoznaje zduplikowane treści?

1
4131

Google nie lubi duplikatów, treści kopiowanych czy opisów powielanych na wielu stronach. Specjaliści SEO powtarzają to jak mantrę i mają w tym słuszność. Jednak skąd Google wie, która treść jest kopiowana, a która oryginalna, spośród stu stron o tej samej treści? No i dużo ważniejsze pytanie – którą z tych stu stron Google wskaże użytkownikowi na jego zapytanie? Odpowiedź brzmi: nie pierwszą, a najlepszą!

Czym jest duplicate content?

Wyobraź sobie, że jesteś na przyjęciu urodzinowym i dostajesz dwa identyczne prezenty od dwóch różnych osób. Oba prezenty wyglądają dokładnie tak samo i mają te same rzeczy w środku. Wtedy zaczynasz się zastanawiać, który prezent jest prawdziwy i który jest podróbką. To właśnie podobnie działa w świecie wyszukiwarek internetowych, takich jak Google, gdy chodzi o duplikowany content.

Duplicate content to sytuacja, w której ta sama treść lub bardzo podobna treść pojawia się na różnych stronach internetowych. To trochę jakby dwie strony internetowe miały te same słowa i obrazy.

Nowe wezwanie do działania

Dlaczego duplicate content jest problemem?

Google i inne wyszukiwarki chcą pokazywać użytkownikom różnorodne i wartościowe wyniki. Jeśli wiele stron ma dokładnie taką samą treść, to może być mylące dla użytkowników. Wyszukiwarki chcą uniknąć pokazywania tych samych informacji w wielu wynikach.

Aby znaleźć powieloną treść na swojej stronie www, możesz wykorzystać jeden z poniższych sposobów:

  1. Narzędzia do sprawdzania podobieństwa treści – skorzystaj z narzędzi online dostępnych do sprawdzania podobieństwa tekstu, np. Copyscape. Takie narzędzia porównują treść witryny do innych stron internetowych, pomagając zlokalizować potencjalne przypadki zduplikowanej zawartości.
  2. Wyszukiwarki internetowe – skorzystaj z wyszukiwarek internetowych, wpisując fragmenty tekstu ze swojej strony w cudzysłowach. W ten sposób możesz sprawdzić, czy inne strony zawierają tę samą lub bardzo podobną treść.
  3. Google Search Console – jeśli masz zarejestrowane swoje strony w Google Search Console, możesz użyć tego narzędzia do zidentyfikowania potencjalnych problemów zduplikowanej treści na Twojej stronie. Wejdź w zakładkę Strony, a następnie odnajdź błędy związane z duplikatami w sekcji “Dlaczego strony nie są zindeksowane“.
Przeczytaj również:  Dlaczego warto odświeżać treści na swojej stronie WWW?

Co może się stać, jeśli mam powielony content na swojej stronie?

Jeśli twoja strona ma dużo powtarzającej się treści, Google może mieć problem z określeniem, która strona jest “oryginalna” i w którą warto kierować użytkowników. To może spowodować, że twoja strona będzie gorzej widoczna w wynikach wyszukiwania lub nawet zostanie całkowicie pominięta.

Czy to oznacza, że nie można mieć żadnych podobnych treści na stronie?

Nie do końca. Trochę podobieństwa między stronami nie jest problemem. Chodzi o to, aby unikać dosłownego kopiowania całych bloków tekstu lub stron w 100%. Lepiej jest tworzyć unikalne treści i prezentować informacje w swój sposób.

Jak uniknąć problemów z duplicate content?

Tworzenie oryginalnych treści to klucz. Jeśli masz podobne treści na różnych stronach, postaraj się dostosować je tak, aby były wyjątkowe i dodawały wartość dla użytkowników. Możesz też korzystać z odpowiednich oznaczeń, takich jak kanoniczne linki, aby wskazać, która wersja strony jest główna.

Jeśli jednak znalazłeś duplikaty zewnętrzne lub wewnętrzne na swojej stronie, powinieneś podjąć odpowiednie kroki:

  1. Usuwanie lub redagowanie – jeśli zauważysz, że twoja strona zawiera zduplikowaną treść, najlepiej jest ją usunąć lub zmienić tak, aby była unikalna. Możesz też rozważyć połączenie różnych wersji zduplikowanych stron w jedną, bardziej kompleksową stronę.
  2. Skorzystanie z kanonicznego tagu – w przypadku, gdy nie możesz usunąć zduplikowanej treści (np. na stronach e-commerce z produktami o podobnym opisie), możesz dodać tag kanoniczny (canonical). Jest to wskazanie dla wyszukiwarek, która wersja strony jest główna i powinna być preferowana w wynikach wyszukiwania.
  3. Odmowa indeksowania – w pliku robots.txt możesz zadeklarować, że niektóre części strony nie powinny być indeksowane przez wyszukiwarki. To przydatne, gdy chcesz uniknąć indeksowania zduplikowanej treści, np. na stronach z wersjami językowymi.
  4. Wniosek o usunięcie – jeśli inna strona internetowa zawiera twoją zduplikowaną treść i jest to naruszenie praw autorskich, możesz poprosić właściciela witryny o usunięcie treści. W skrajnych przypadkach możesz skorzystać z narzędzi do zgłaszania naruszeń w wyszukiwarkach.
  5. Ustalenie priorytetów – jeśli masz wiele przypadków zduplikowanej treści, zidentyfikuj te o największym znaczeniu dla witryny i najpierw zajmij się nimi.
Przeczytaj również:  Błąd 404 – czym on jest?
Zrób audyt SEO

Oryginalność i unikalność w cenie!

Po pierwsze Google zawsze chętniej podpowie stronę, która ma treść unikalną i oryginalną – to wiemy od zawsze. Czyli samodzielnie stworzona treść opisująca np. usługę jest chętniej pokazywana w wynikach wyszukiwania, niż treść skopiowana z czyichś materiałów marketingowych. Widzimy jednak w Internecie, szczególnie w e-sklepach treści skopiowane, które mimo wszystko pojawiają się w wynikach wyszukiwania. Google woli treści oryginalne, ale na strony i content kopiowany również znalazł sposób.

duplicate content pozycjonowanie

Kto jeszcze stosuje kopiowane treści?

W kontekście prowadzenia bloga, czy strony WWW firm – kopiowanie treści od innych narusza prawo autorskie i prawa pokrewne, dlatego też nie jest często spotykane. Wróćmy jednak do przykładu z e-sklepami. Wszystkie księgarnie internetowe otrzymują te same materiały marketingowe z opisem książki, którą mają wprowadzić do swojej oferty. Kilka księgarń napisało własny autorski opis książki, a pozostałe skopiowały całą treść lub fragment, z otrzymanych materiałów. W efekcie tego na kilkudziesięciu podstronach pojawia się ta sama treść. Co więc Google bierze pod uwagę, by zadecydować, którą z tych niemalże identycznych stron zaprezentować na zapytanie użytkownika o konkretną książkę?

Przeczytaj również:  Społeczności w Google Plus

Wybór najlepszej “kopii”

Google ocenia najpierw wiarygodność każdej kopii: źródła, prawa do publikacji, licencje, informacje o zawartych w treści cytatach, słowa kluczowe, ranking strony, autorstwo treści, tytuł, wydawcę, miejsce opublikowania, datę opublikowania, język i wiele innych. Drugim krokiem jest ocena różnych wersji tej samej treści i pomiar długości oryginalnego tekstu. Na podstawie tych dwóch wskaźników Google jest w stanie zróżnicować i ocenić kilkadziesiąt stron z niemalże identyczną treścią a nawet więcej: wybrać najlepszą, która jego zdaniem cechuje się największą wiarygodnością i użytecznością dla użytkownika.

Google nie chce, żeby użytkownik w wynikach wyszukiwania trafił na kilka wyników z rzędu, które zawierają tę samą treść i przedzierał się przez nie, dlatego też wykonuje tę pracę za niego. Serwuje najpierw wyniki niekopiowane, a potem najlepsze strony z tych skopiowanych. Warto zauważyć, że data publikacji jest tylko jednym z wielu wyznaczników wyboru najlepszej kopii, dlatego często to nie pierwszy tekst jest wyświetlany przez Google w wynikach wyszukiwania.

Koniec końców kopiowanie treści – poza tym, że jest nieetyczne i nie sprzyja optymalizacji strony – szkodzi zarówno kopiującym jak i kopiowanym.

Po więcej informacji zapraszam na SeobytheSea: http://www.seobythesea.com/2018/10/how-google-might-identify-primary-versions-of-duplicate-pages/

e-book SEO lokalne od A do Z
5/5 - (4 votes)

1 KOMENTARZ

ZOSTAW ODPOWIEDŹ

Please enter your comment!
Please enter your name here