Trùng lặp nội dung, 10+ nguyên nhân và cách kiểm tra

Rate this post

Trùng lặp nội dung là một trong những lỗi cơ bản nhất và phổ biến nhất trong SEO. Trong mọi bài viết liên quan tới thủ thuật SEO chắc hẳn bạn đều thấy mục tránh trùng lặp nội dung trên website. Làm thế nào để tránh lỗi này ? Kiểm tra chúng như thế nào ?

Trùng lặp nội dung ( duplicate content ) là gì ?

Trùng lặp nội dung là hiện tượng có cùng nội dung trên 2 đường dẫn URL khác nhau. Cho dù nó trên một website hay trên các website khác nhau, thì đều bị coi là trùng lặp nội dung.
Tác hại của trùng lặp nội dung thì rất kinh khủng. Mình có thể liệt kê ra đây 2 vấn đề cơ bản nhất:

Với máy tìm kiếm

Như Google chẳng hạn, việc trùng lặp nội dung với một website khác nhau hay với chính website của bạn làm cho nội dung bị đánh dấu tệ. Từ khóa trong bài viết trùng lặp không thể lên top hoặc có lên thì cũng có nguy cơ xuống trong nay mai.
Duplicate content ( trùng lặp nội dung ) làm thứ hạng từ khóa bị tụt
Google đánh dấu các nội dung trùng lặp là nội dung tệ, copy, nghèo nàn… Và xu hướng SEO 2019 tới đây sẽ không có trùng lặp nội dung kể cả chúng là từ đồng nghĩa.
Và lý do cô đọng lại là:

  1. Nó không biết trang nào nên bỏ qua
  2. Nó không biết nên cho bài viết nào lên
  3. Nó không thích nội dung y hệt trên top 10 đắt giá của mình. Điều đó làm người dùng tức giận

Với trải nghiệm người dùng

Chẳng ai thích thú gì việc đọc một nội dung giống y hệt nhau từ trang này qua trang khác, hay từ tên miền này qua tên miền khác. Họ mong chờ ở bạn những kiến thức, thông tin khác cơ. Càng đa dạng càng tốt.

Lý do khiến website của bạn bị trùng lặp nội dung

Với mỗi một đường dẫn URL khác nhau phải có nội dung khác nhau. ĐIều đó mới đem lại giá trị trong mắt cỗ máy tìm kiếm. Các lý do sau đây sẽ dẫn tới website của bạn bị trùng lặp nội dung:

WWW và không-www trên tên miền

Như bạn biết đó, nhiều trang mặc định khi bạn truy cập sẽ chuyển hướng về www.domain.com ! Nhưng một số trang lại có thể truy cập cả domain.com và www.domain.com ! Google coi đó là trùng lặp nội dung. Rõ ràng www chỉ là subdomain cho domain.com mà thôi !
Để tránh điều này, bạn nên chuyển hướng www sang không-www hoặc ngược lại bằng lệnh trong htaccess:
RewriteEngine On RewriteCond %{HTTP_HOST} !^www. [NC] RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]

Biến thể URL khác nhau

Nhiều khi copy đường dẫn, họ quên một dấu chấm hỏi gì đó trên đó thôi là có thể gặp vấn đề với trùng lặp nội dung. Ví dụ như:
domain.com/category.php?id=1&s=n domain.com/category.php?id=1&s=n&u
Nếu cả hai đường dẫn trên đều trỏ về một nội dung duy nhất thì bạn đã bị trùng lặp nội dung. Các máy tìm kiếm thường đi theo mọi liên kết để lập chỉ mục. Nó sẽ đi theo đường dẫn lỗi đó và cho rằng bạn bị trùng lặp nội dung.
Cách sửa: Sử dụng thẻ Rel Canonical để luôn khai báo nội dung gốc của một URL gốc. Từ đó nếu các đường dẫn vô tình bị phái sinh thì chúng không bị trùng lặp !
Ví dụ:
 
Nếu bạn dùng WordPress thì Yoast SEO sẽ giúp bạn làm việc đó một cách tự động !

Vô tình viết bài trùng lặp chủ đề và nội dung

Nhiều trường hợp không xác định/nhớ được mình đã viết hay chưa. Thay vì kiểm tra, các bạn viết bài đó luôn. Và bài viết đó tới bài viết cũ sẽ bị trùng lặp nội dung.
Nếu trong trường hợp 2 bài viết có nhiều backlink hoặc nhận được nhiều lượng truy cập từ đâu đó. Bạn có thể dùng cách chuyển hướng 301 là ngon nhất. Vừa bảo vệ được backlink vừa vẫn giữ được truy cập vào !
Ngoài ra bạn cũng có thể sử dụng rel canonical để khai báo nội dung gốc !
Còn, nếu bạn muốn giữ lượng truy cập nhưng không muốn máy tìm kiếm lập chỉ mục. Bạn có thể noindex bài viết kém chất lượng hơn, ít backlink hơn để không bị trùng lặp nội dung.

Các công cụ giúp kiểm tra phát hiện trùng lặp nội dung

Trong một vài trường hợp bạn cần kiểm tra xem một đoạn nào đó trong bài viết của bạn có bị trùng lặp với các bài viết khác trên các trang khác hay không. Hoặc bạn muốn xem ai đã copy đoạn trong bài viết của bạn, cũng cần phải sử dụng các công cụ kiểm tra cho nó nhanh gọn. Bài viết này tôi xin chia sẻ hai tool mà tôi hay dùng để kiểm tra trùng lặp nội dung website để SEO tốt hơn nhé !
Trước hết, các bạn cần hiểu về vai trò của nó. Các tool này sẽ giúp các bạn kiểm tra các đoạn văn bạn đang muốn đăng có trùng lặp hay không để có hướng xử lý để tránh bị kiện. Trường hợp trùng lặp 100% sẽ bị Google cho vào Sanbox hoặc dính các thuật toán. Trường hợp khác là bạn cần né bản quyền, ai đó thấy đoạn văn của bạn giống họ, họ có thể kiện bạn theo luật DMCA và bạn viết bài đó dù hay tới mấy thì cũng mắc công không !

Google Search Console

Các bạn có thể sử dụng Google Search Console để phát hiện chúng. Thường thì Google tốt bụng sẽ phát hiện tự động và báo cho chúng ta biết.
Cảnh báo trùng lặp nội dung trên Google Search Console

Plagiarism Checker

Công cụ này cực tốt để kiểm tra đoạn văn của bạn có câu nào bị trùng lặp  trên Internet hay không. Công cụ này có hỗ trợ tiếng Việt ! Tuy nhiên nó hạn chế bạn kiểm tra quá nhiều, bạn phải mua gói Premium.
Xem thêm tại đây: http://smallseotools.com/plagiarism-checker/

CopyScape

Công cụ này cho phép các bạn kiểm tra toàn đoạn văn trong một URL nào đó, rất tiện và có hỗ trợ tiếng Việt ! Sau khi bấm Go, công cụ sẽ quét hết các nội dung trên Google và báo cho bạn biết các trang có nội dung tương tự như của bạn ! Cái này tiện lợi khi các bạn muốn Edit một bài viết nào đó trên trang và có thể tránh trùng lặp nội dung với các trang còn lại !
Xem thêm tại đây: http://www.copyscape.com
Tôi có thử nhiều công cụ nhưng thấy một là các công cụ khác chậm chạp, hai là chúng không hỗ trợ tiếng Việt nên không giới thiệu cho các bạn. Với hai công cụ trên có thể đủ cho các bạn kiểm tra trùng lặp nội dung roài !
Hãy cố gắng không trùng lặp nội dung với các website khác bạn nhé, nó vừa ảnh hưởng cho SEO lại vừa dễ ăn kiện bản quyền bài viết !
Xem thêm cách kiểm tra vi phạm bản quyền cho bài viết của bạn !

Các câu hỏi khác liên quan

Nếu tất thảy những vướng mắc này chưa thỏa mãn bạn. Đừng ngại comment nhé.
Có trùng lặp nội dung giữa category, tag và bài viết hay không ?
Có các bạn nha ! Category và Tag rất rất rất hay bị trùng lặp nội dung. Nhiều bạn hiểu nhầm tag là từ khóa và đánh hồn nhiên hàng trăm cái tag. Tag cũng đánh trùng cả sang Category nữa. Đây được coi là trùng lặp nội dung. Ví dụ Bạn có Category là “Làm SEO” thì đừng bao giờ đánh tag là “Làm SEO” nữa.
Trùng lặp nội dung một đoạn văn thôi có sao không ?
Bất cứ sự trùng lặp nào cũng có vấn đề nếu nó trùng với một bài viết khác tới quá 40%. Nhiều SEOer tin rằng copy cái gì đó dưới 40% là an toàn. Còn lớn hơn nữa thì bài viết không thể lên được !
Ai đó copy bài viết của tôi, trùng lặp rồi ?
Ai viết trước và được Google index trước thì người ấy làm bố. Ai copy lại thì khó lên lắm nha. Hay đúng hơn là không thể lên được !
Trùng lặp tựa đề nhưng khác nội dung có phải là trùng lặp ?
Ồ có nha các bạn ! Tuy “tội” không quá nặng nhưng chính vì tựa đề trùng lặp mà máy tìm kiếm không biết nên cho bài nào lên top. Hãy cố gắng sử dụng các từ biến thể, đồng nghĩa nếu bất khả kháng.
website của tôi có nhiều bài viết trùng lặp ?
Họ gọi đó là một website nội dung mỏng ( thin content ). Những website này thường có rất ít từ khóa lên top. Bạn nên xóa bớt bài viết trùng lặp, noindex chúng hoặc chuyển hướng 301 nha !
Giờ thì, đừng quên tham khảo thêm 12 cách để có một bài viết thú vị, viết bài chuẩn SEO
Nếu bạn thông thạo tiếng Anh, có thể truy cập bài viết này để đọc về duplicate content trên blog của Google.
Chúc các bạn vui vẻ !
trùng lặp nội dung
trùng lặp nội dung website
check trùng lặp nội dung
check trùng lặp nội dung trong excel
lỗi trùng lặp nội dung
kiểm tra trùng lặp nội dung website
sửa lỗi trùng lặp nội dung
kiểm tra độ trùng lặp nội dung
nội dung trùng lặp youtube
Nguồn tin: Sưu tầm.

NotePad24h tạo ghi chú miễn phí và lưu trữ vĩnh viễn

Comment của bạn

avatar
  Theo Dõi  
Thông báo