Google SearchLiaison đưa ra giải thích rõ ràng về cách hệ thống nội dung hữu ích chấm điểm chất lượng cho các website.
Google SearchLiaison đã làm rõ một đoạn khó hiểu trong hướng dẫn Hệ thống nội dung hữu ích của họ dường như có khả năng gây ra sự cố vô ý cho các nhà xuất bản vô tội.
Hệ thống nội dung hữu ích
Hệ thống nội dung hữu ích của Google dựa trên mô hình machine learning (Học Máy) sử dụng bộ phân loại để tạo ra tín hiệu, sau đó được hệ thống xếp hạng của Google sử dụng để loại bỏ nội dung chất lượng thấp.
Trình phân loại là một thuật toán trong mô hình học máy gán nhãn cho đầu vào. Trong ngữ cảnh của Hệ thống nội dung hữu ích, mô hình máy học đang gán nhãn cho nội dung website, từ đó tạo ra một tín hiệu, chẳng hạn như không thích.
Tín hiệu đó cũng có trọng số, có nghĩa là một website chỉ có một ít nội dung không hữu ích sẽ nhận được lượt không thích nhỏ hơn so với một website có nhiều nội dung không hữu ích sẽ có lượt không thích lớn hơn.
Hệ thống nội dung hữu ích tạo ra tín hiệu, là một trong hàng trăm hoặc hàng nghìn tín hiệu khác được sử dụng để xếp hạng một website (như liên kết, mức độ liên quan, v.v.).
Hướng dẫn của Google vô tình không rõ ràng
Google đã cập nhật hướng dẫn của họ dành cho hệ thống nội dung hữu ích gần đây nhất nhằm giúp làm rõ hơn tín hiệu này là gì để nhà xuất bản và người làm SEO có thể hiểu lý do tại sao các website bị mất thứ hạng.
Từ “opaque” có nghĩa là điều gì đó thiếu rõ ràng hoặc minh bạch. Và thật không may, có một phần của hướng dẫn đó dường như vô tình không rõ ràng và do đó gây nhầm lẫn.
Đây là đoạn văn được đề cập:
“Bạn có đang thay đổi ngày tháng của các trang để làm cho chúng có vẻ mới mẻ khi nội dung không có thay đổi đáng kể không?”
Đoạn văn đó nhằm vào một số người dùng đang cố gắng đánh lừa thuật toán làm mới của Google bằng cách thực hiện một thay đổi tương đối nhỏ đối với nội dung, sau đó cập nhật ngày xuất bản để đánh lừa Google nghĩ rằng nội dung cũ là một website mới được xuất bản.
Nhưng vấn đề là nhiều người quay lại website và thực hiện những thay đổi nhỏ về nội dung:
- Sửa lỗi chính tả
- Thay thế hoặc thêm một từ để làm cho từ đó đúng ngữ pháp hoặc rõ ràng hơn
- Thay đổi từ ngữ để làm cho nội dung rõ ràng hơn
- Có nhiều thay đổi hợp pháp nhưng nhỏ mà nhiều người thực hiện đối với nội dung.
Hướng dẫn dường như cấm thực hiện những thay đổi nhỏ dẫn đến thay đổi ngày đã tạo ra tình huống trong đó một cải tiến nhỏ hiện có khả năng góp phần khiến hệ thống nội dung hữu ích đánh giá tiêu cực.
Đây chính xác là vấn đề được gắn cờ trên X (trước đây là Twitter).
Luke Jordan đã chia sẻ mối quan ngại chính đáng của họ:
“Google không hiểu đủ rõ về sắc thái để đưa ra các quy tắc chung
Nó trừng phạt các website sử dụng ngày ‘cập nhật lần cuối’ cho những thay đổi “nhỏ”
Nhưng trong chơi game, một bản vá/cập nhật có thể đơn giản như một bản nâng cấp trị giá 5 điểm lên 6 điểm.
Và sự gia tăng nhỏ bé đó có thể thay đổi rất nhiều về tính hữu dụng của nó
Người dùng sẽ muốn biết bài đăng đã được cập nhật và do đó có liên quan nên sẽ tham khảo ngày và số bản vá
Một bản cập nhật thực sự có giá trị có thể yêu cầu thay đổi số 6 thành 5 và số bản vá từ 9.0.1 thành 9.0.2.
Nếu ngày ghi hướng dẫn được cập nhật lần cuối cách đây 6 tháng thì điều đó vô nghĩa
Ngoài ra, ngày (rất lỗi thời) hiển thị trong kết quả của Google, vì vậy mọi người cũng sẽ ít nhấp vào ngày đó hơn, với CTR là một yếu tố xếp hạng khác
Tất nhiên họ chỉ có thể giả vờ như họ hiểu tất cả những điều này và trở thành một kẻ lừa đảo hữu ích sẽ luôn giành chiến thắng!
Google SearchLiaison đã trả lời:
“Không, chúng tôi không làm điều này nếu các bản cập nhật được thực hiện có ích cho mọi người.
Không phải điều chúng tôi nói.
Không có trong hướng dẫn của chúng tôi.”
SearchLiaison đúng nhưng do độ không rõ ràng của một đoạn văn đó nên có vẻ như nó nói lên ý nghĩa của Luke Jordan.
Luke tiếp lời:
“Vì vậy, để xác nhận, bạn có biết liệu một ký tự thay đổi trong một bài viết có nhằm mục đích hữu ích cho mọi người không?”
Có một bài đăng bổ sung của Luke, kèm theo ảnh chụp màn hình đoạn văn trong hướng dẫn:
“vì nguyên tắc của bạn theo nghĩa đen là bạn không nên thay đổi ngày của các trang khi nội dung không thay đổi đáng kể.”
SearchLiaison đã trả lời:
“Bối cảnh của những câu hỏi đó là liệu bạn có đang làm gì đó cho Google hay không.
Nếu bạn chỉ thay đổi ngày vì cho rằng “điều đó sẽ khiến Google nghĩ rằng nội dung này mới mẻ”, thì có khả năng bạn đang điều chỉnh theo các hành vi khác nhìn chung phù hợp với các tín hiệu mà chúng tôi sử dụng để xác định mức độ hữu ích của nội dung.
Đó không chỉ là một điều. Nó không trực tiếp.
Và sẽ không có vấn đề gì nếu bạn không làm việc chủ yếu cho Google.”
Phù hợp với các hành vi khác
Điều mà SearchLiaison dường như muốn nói là chiến thuật thay đổi ngày chỉ là một trong nhiều chiến thuật mà mô hình học máy sử dụng để tính xác suất thống kê rằng website đang sử dụng chiến thuật SEO cho Google thay vì làm điều gì đó để tạo ra nội dung hữu ích.
Có một điều về số liệu thống kê là nếu bạn chỉ sử dụng một số liệu riêng lẻ thì mô hình thống kê sẽ đưa ra những quyết định tồi.
Đó là lý do tại sao trong các mô hình thống kê liên quan đến tìm kiếm, có tài liệu rõ ràng rằng việc sử dụng nhiều tín hiệu cùng nhau để tính xác suất thống kê sẽ chính xác hơn so với việc chỉ sử dụng một tín hiệu (số liệu).
Nếu bạn chưa quen với điều này, hãy xem bản PDF này của hệ thống nhận dạng SPAM thống kê kết hợp nhiều tính năng như số liệu tương tác On-page, Off-page và người dùng để phân loại xem website có phải là SPAM hay không.
Không đưa từ ngữ vào phản hồi của SearchLiaison, nhưng có vẻ như họ đang ám chỉ rằng chỉ làm một việc có thể là dấu hiệu vô ích là không đủ để coi website là vô ích khi không có tín hiệu tiêu cực nào khác.
Đây là những gì SearchLiaison đã nói:
“Nếu bạn chỉ thay đổi ngày vì cho rằng “điều đó sẽ khiến Google nghĩ rằng điều này mới mẻ”, thì bạn có thể đang điều chỉnh theo các hành vi khác nhìn chung phù hợp với các tín hiệu mà chúng tôi sử dụng để xác định mức độ hữu ích của nội dung”.
Thật tốt khi SearchLiaison làm rõ điểm này vì tôi cũng cảm thấy rằng đoạn văn này có vẻ quá rộng và có thể dẫn đến kết quả không chính xác (khi một website vô tình bị phân loại là SPAM).