Nội dung trùng lặp là gì?
Về cơ bản, nội dung trùng lặp là nội dung xuất hiện ở nhiều nơi trên Internet. Khi nghĩ về nội dung trùng lặp, điều quan trọng cần nhớ là nó không chỉ là những gì khách truy cập nhìn thấy khi họ truy cập vào trang web của bạn và so sánh hai trang. Nó còn thể hiện những gì công cụ tìm kiếm và trình thu thập thông tin thấy, khi họ truy cập các trang đó.
Vì họ không thể nhìn thấy trang được hiển thị như thế nào, nên họ thường đi ra khỏi mã nguồn của trang và nếu mã đó quá giống nhau, trình thu thập thông tin có thể nghĩ rằng nó đang xem hai phiên bản của cùng một trang.
Việc này giống như khi bạn đi đến một tiệm bánh và có hai chiếc bánh nướng nhỏ trước mặt bạn trông gần như giống hệt nhau. Họ không có bất kỳ dấu hiệu nào. Làm thế nào để bạn biết cái nào bạn muốn? Đó là những gì sẽ xảy ra khi một công cụ tìm kiếm gặp hai trang quá giống nhau.
Sự nhầm lẫn này giữa các phần nội dung có thể gây ảnh hưởng đến vị trí xếp hạng của Websites, bởi vì các công cụ tìm kiếm có thể không tìm ra được trang nào họ nên xếp hạng hoặc đôi khi họ có thể xếp hạng một trang không chính xác.
Các giải pháp
Dưới đây là một số cách khác nhau giúp bạn có thể giải quyết nội dung trùng lặp.
Chuyển hướng 301
Đầu tiên là tùy chọn triển khai chuyển hướng 301. Tùy chọn này sẽ tương tự như có một bản sao VHS của một bộ phim, có thể không còn phù hợp nữa. Vì vậy, bạn muốn đảm bảo cung cấp cho mọi người phiên bản kỹ thuật số phát trực tuyến, với chất lượng tốt nhất.
Tương tự, Trên trang web của mình, bạn có thể chuyển hướng các phiên bản nội dung cũ hơn của trang sang các phiên bản có nội dung cập nhật, và mới.
Rel = canonicals
Tiếp theo là tùy chọn để triển khai rel = canonicals trên trang của bạn. Giả sử bạn đang ở một cửa hàng bán đồ nướng và bạn mang theo hai loại bánh quy, đường và sô cô la chip. Bạn coi cookie đường của bạn là hàng đầu. Vì vậy, khi mọi người hỏi bạn rằng họ nên thử loại nào, bạn sẽ chỉ họ vào bánh quy đường mặc dù họ vẫn có quyền thử sô cô la chip.
Trên trang web của bạn, điều này sẽ tương tự như việc có hai mặt hàng được rao bán có màu sắc khác nhau. Bạn muốn khách truy cập có thể nhìn thấy và truy cập cả hai màu, nhưng bạn sẽ sử dụng thẻ chuẩn để cho trình thu thập thông tin biết đâu là trang phù hợp hơn để xếp hạng.
Meta noindex
Bạn cũng có tùy chọn đánh dấu các trang là meta noindex.
Ví dụ: bạn có thể có hai ấn bản của cuốn sách yêu thích của mình. Bạn sẽ đọc và tham khảo ấn bản thứ hai vì nó là ấn bản mới nhất và phù hợp nhất. Nhưng bạn vẫn muốn có thể đọc và truy cập ấn bản một nếu bạn cần.
Thẻ meta lúc này giúp ngăn lập chỉ mục cho trình thu thập thông tin. Nó cho biết rằng họ vẫn có thể thu thập dữ liệu trang trùng lặp đó, nhưng họ không nên đưa trang đó vào chỉ mục của mình. Điều này có thể giúp giải quyết các vấn đề về nội dung trùng lặp do những thứ như phân trang.
Thêm nội dung
Nhưng nếu bạn có hai trang thực sự không trùng lặp với nhau thì sao? Chúng nói về các chủ đề khác nhau và chúng nên được coi như các phần nội dung riêng biệt. Trong trường hợp này, bạn có thể chọn thêm nhiều nội dung hơn vào mỗi trang này để ít gây nhầm lẫn cho trình thu thập thông tin.
Điều này giúp tạo ra sự khác biệt giữa hai trang, giúp bạn có thể giải quyết việc trùng lặp nội dung, đồng thời thu hút thêm nhiều khách hàng mới.
Sử dụng Moz Pro để giúp xác định và giải quyết nội dung trùng lặp
Nếu bạn cần trợ giúp để xác định những trang nào trên trang web của mình có thể được coi là trùng lặp của nhau, thì Moz Pro Site Crawl và On-Demand Crawl có thể giúp bạn.
Trong cả hai công cụ này, họ sẽ gắn cờ các trang nào được coi là trùng lặp của nhau và bạn thậm chí có thể xuất dữ liệu đó sang CSV để bạn có thể phân tích nó bên ngoài công cụ. Đặc biệt, trong quá trình xuất CSV của dữ liệu đó, nhóm nội dung trùng lặp sẽ cho bạn biết những trang nào được coi là trùng lặp của nhau.
KẾT LUẬN:
Đây hoàn toàn không phải là danh sách đầy đủ về các cách bạn có thể giải quyết nội dung trùng lặp, nhưng tôi hy vọng rằng nó sẽ giúp chỉ cho bạn đúng hướng khi giải quyết vấn đề này. Chúc bạn giải quyết vấn đề trùng lặp nội dung thành công!!!
Bài viết được dịch trên MOZ đăng tải duy nhất lên SEOMxh.com
NGUỒN: https://moz.com/blog/resolve-duplicate-content