Gary Illyes của Google mô tả các tín hiệu mà nó sử dụng để chọn các trang chuẩn và chia sẻ lý do tại sao các trang trùng lặp có thể quan trọng đối với SEO

Trong một video của Trung tâm Google Tìm kiếm, Gary Illyes của Google đã giải thích một phần của việc lập chỉ mục trang web bao gồm việc chọn trang chuẩn, giải thích ý nghĩa của trang chuẩn đối với Google, giải thích hình thu nhỏ về các tín hiệu trang web. Anh ấy đề cập đến phần trung tâm của một trang và cho biết trang đó làm gì với các trang trùng lặp. hàm ý một cách nghĩ mới về chúng.

Trang web Canonical là gì?

Có một số cách để xem xét ý nghĩa của chuẩn , quan điểm của nhà xuất bản và SEO từ phía chúng tôi về hộp tìm kiếm và ý nghĩa của chuẩn từ phía Google.

Các nhà xuất bản xác định những gì họ cảm thấy là trang web “gốc” và quan niệm của SEO về chuẩn là chọn phiên bản “mạnh nhất” của trang web cho mục đích xếp hạng.

Canonicalization cho Google là một điều hoàn toàn khác với những gì các nhà xuất bản và SEO nghĩ về nó nên thật vui khi được nghe điều đó từ một nhân viên Google như Gary Illyes.

Tài liệu chính thức của Google về chuẩn hóa sử dụng tính năng loại bỏ trùng lặp từ để tham chiếu quá trình chọn trang chuẩn và liệt kê năm lý do điển hình giải thích tại sao một trang web có thể có các trang trùng lặp.

Năm lý do cho các trang trùng lặp

1. “Các biến thể khu vực: ví dụ: một phần nội dung dành cho Hoa Kỳ và Vương quốc Anh, có thể truy cập được từ các URL khác nhau, nhưng về cơ bản là cùng một nội dung trong cùng một ngôn ngữ
2. Các biến thể của thiết bị: ví dụ: một trang có cả phiên bản dành cho thiết bị di động và máy tính để bàn
3. Các biến thể giao thức: ví dụ: phiên bản HTTP và HTTPS của một trang web
4. Chức năng của trang web: ví dụ: kết quả của chức năng sắp xếp và lọc của một trang danh mục
5. Các biến thể ngẫu nhiên: ví dụ: phiên bản demo của trang web vô tình bị trình thu thập thông tin truy cập”
 

Canonicals có thể được xem xét theo ba cách khác nhau và có ít nhất năm lý do dẫn đến các trang trùng lặp.

Gary mô tả một cách nữa để nghĩ về kinh điển.

Tín hiệu được sử dụng để chọn Canonicals

Ilyes chia sẻ thêm một định nghĩa nữa về trang chuẩn, lần này là từ quan điểm lập chỉ mục và nói về các tín hiệu được sử dụng để chọn trang chuẩn.

Gary giải thích:

“Google xác định xem trang này có phải là bản sao của một trang khác đã được biết đến hay không và phiên bản nào sẽ được giữ trong chỉ mục, phiên bản chuẩn.

Nhưng trong bối cảnh này, phiên bản chuẩn là trang từ một nhóm các trang trùng lặp đại diện tốt nhất cho nhóm theo các tín hiệu mà chúng tôi đã thu thập về từng phiên bản.”

Gary dừng lại để giải thích về việc phân cụm trùng lặp và sau đó quay lại nói về các tín hiệu một lúc sau.

Anh ấy tiếp tục:

“Phần lớn, chỉ các trang chuẩn mới xuất hiện trong kết quả Tìm kiếm. Nhưng làm thế nào để chúng ta biết trang nào là trang chuẩn?

Vì vậy, khi Google có nội dung trang của bạn hoặc cụ thể hơn là nội dung chính hoặc phần trung tâm của trang, Google sẽ nhóm nội dung đó với một hoặc nhiều trang có nội dung tương tự, nếu có. Đây là sự phân cụm trùng lặp.”

Tôi chỉ muốn dừng ở đây để lưu ý rằng Gary coi nội dung chính là “trung tâm của trang”, điều này thật thú vị vì có một khái niệm do Martin Splitt của Google giới thiệu được gọi là Chú thích trung tâm. Anh ấy không thực sự giải thích Chú thích trung tâm là gì nhưng điều mà Gary chia sẻ rất hữu ích.

Sau đây là một phần của video mà Gary nói về tín hiệu thực sự là gì.

Illyes giải thích “tín hiệu” là gì:

“Sau đó, nó so sánh một số tín hiệu đã được tính toán cho mỗi trang để chọn phiên bản chuẩn.

Tín hiệu là những mẩu thông tin mà công cụ tìm kiếm thu thập về các trang và trang web, được sử dụng để xử lý thêm.

Một số tín hiệu rất đơn giản, chẳng hạn như chú thích của chủ sở hữu trang web trong HTML như rel=”canonical”, trong khi những tín hiệu khác, như tầm quan trọng của một trang riêng lẻ trên internet, thì ít đơn giản hơn”.

Các cụm trùng lặp có một Canonical

Tiếp theo, Gary giải thích rằng một trang được chọn để đại diện cho trang chuẩn cho từng cụm trang trùng lặp trong kết quả tìm kiếm. Mỗi cụm trùng lặp có một chuẩn.

Ông tiếp tục:

“Mỗi cụm trùng lặp sẽ có một phiên bản nội dung duy nhất được chọn làm phiên bản chuẩn.

Phiên bản này sẽ thể hiện nội dung trong kết quả Tìm kiếm cho tất cả các phiên bản khác.

Các phiên bản khác trong cụm trở thành phiên bản thay thế có thể được phân phát trong các ngữ cảnh khác nhau, chẳng hạn như khi người dùng đang tìm kiếm một trang rất cụ thể từ cụm.”

Phiên bản thay thế của trang web

Phần cuối cùng thực sự thú vị và quan trọng cần xem xét vì nó có thể hữu ích để có thể xếp hạng cho nhiều biến thể của một từ khóa, đặc biệt đối với các trang web thương mại điện tử.

Đôi khi hệ thống quản lý nội dung ( CMS ) tạo các trang web trùng lặp để tính đến các biến thể của sản phẩm như kích thước hoặc màu sắc của sản phẩm, sau đó có thể ảnh hưởng đến mô tả. Google có thể chọn các biến thể đó để xếp hạng trong kết quả tìm kiếm khi trang biến thể đó đóng vai trò phù hợp hơn với truy vấn tìm kiếm.

Điều này rất quan trọng để suy nghĩ vì bạn có thể muốn chuyển hướng các trang web biến thể noindex để loại chúng ra khỏi chỉ mục tìm kiếm vì lo ngại vấn đề ăn thịt từ khóa (không tồn tại). Việc thêm noindex vào các trang là biến thể của một trang có thể phản tác dụng vì có những trường hợp trong đó các trang biến thể đó là trang tốt nhất để xếp hạng cho truy vấn tìm kiếm có nhiều sắc thái hơn chứa màu sắc, kích thước hoặc số phiên bản khác với trên trang chuẩn.

Những điều rút ra hàng đầu về Canonicals (và hơn thế nữa) cần nhớ

Có rất nhiều thông tin được gói gọn trong cuộc thảo luận về kinh điển của Gary, bao gồm một số chủ đề phụ về nội dung chính.

Dưới đây là bảy điều cần xem xét:

  1. Nội dung chính được gọi là Centerpiece
  2. Google tính toán “một số tín hiệu” cho mỗi trang mà nó phát hiện.
  3. Tín hiệu là dữ liệu được sử dụng để “xử lý thêm” sau khi phát hiện ra các trang web.
  4. Một số tín hiệu do nhà xuất bản kiểm soát, như gợi ý (và có lẽ là chỉ thị). Gợi ý mà Illyes đề cập chính là thuộc tính liên kết rel=canonical.
  5. Các tín hiệu khác nằm ngoài tầm kiểm soát của nhà xuất bản, như tầm quan trọng của trang này trong bối cảnh Internet.
  6. Một số trang trùng lặp có thể đóng vai trò là phiên bản thay thế
  7. Các phiên bản thay thế của trang web vẫn có thể xếp hạng và hữu ích cho Google (và nhà xuất bản) vì mục đích xếp hạng.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

message zalo
0963488776
zalo logo
messenger logo