Gary Ilyes của Google đã đưa ra một số nguyên nhân gây ra lỗi đã thu thập dữ liệu nhưng không được lập chỉ mục.
Vào tháng 5, Gary Illyes của Google đã tham gia phỏng vấn tại hội nghị SERP Conf 2024 ở Bulgaria và trả lời câu hỏi về nguyên nhân một url đã thu thập thông tin nhưng không lập chỉ mục, đồng thời đưa ra nhiều lý do hữu ích để gỡ lỗi và khắc phục lỗi này.
Mặc dù cuộc phỏng vấn diễn ra vào tháng 5, nhưng video phỏng vấn không được đưa tin nhiều và không nhiều người thực sự xem nó. Tôi chỉ biết đến nó vì Olesia Korobka gần đây đã thu hút sự chú ý đến cuộc phỏng vấn trong một bài đăng trên Facebook.
Mặc dù cuộc phỏng vấn diễn ra vào tháng 5, nhưng thông tin này vẫn hữu ích ở thời điểm hiện tại.
Lý do thu thập dữ liệu nhưng chưa được lập chỉ mục
Đã thu thập dữ liệu hiện chưa được lập chỉ mục là mục tham chiếu lỗi trong báo cáo Lập chỉ mục trang của Google Search Console, báo cáo này cảnh báo rằng Google đã thu thập thông tin một trang nhưng chưa được lập chỉ mục.
Trong một cuộc phỏng vấn trực tiếp, có người đã gửi một câu hỏi như sau:
“Lý do việc thu thập thông tin nhưng không lập chỉ mục là do một trang quá giống với các nội dung khác đã được lập chỉ mục không?
Google đang ám chỉ rằng đã có đủ những thứ khác rồi và nội dung của bạn không đủ độc đáo không?”
Tài liệu về bảng điều khiển tìm kiếm của Google không cung cấp câu trả lời về lý do tại sao Google có thể thu thập dữ liệu một trang nhưng không lập chỉ mục trang đó, do đó đây là một câu hỏi nhiều người thắc mắc.
Gary Illyes trả lời rằng có, một trong những lý do có thể là đã có nội dung khác tương tự. Nhưng ông cũng nói rằng còn có những lý do khác nữa.
Ông trả lời:
“Đúng vậy, đó có thể là một điều mà nó có thể có nghĩa. Thu thập dữ liệu nhưng không lập chỉ mục, lý tưởng nhất là chúng ta sẽ chia nhỏ danh mục đó thành các phần chi tiết hơn, nhưng điều đó cực kỳ khó vì cách dữ liệu tồn tại bên trong.
Có thể là một loạt các điều, loại bỏ nội dung trùng lặp là một trong những điều như vậy, khi chúng tôi thu thập dữ liệu trên trang và sau đó quyết định không lập chỉ mục vì đã có phiên bản đó hoặc phiên bản cực kỳ giống với nội dung đó có sẵn trong chỉ mục của chúng tôi và nó có tín hiệu tốt hơn.
Nhưng đúng vậy, nhưng nó có thể bao gồm nhiều thứ khác nhau.”
Chất lượng tổng thể của website có thể ảnh hưởng đến việc lập chỉ mục
Gary sau đó lưu ý đến một lý do khác khiến Google có thể thu thập dữ liệu nhưng lại chọn không lập chỉ mục một trang, cho rằng đó có thể là vấn đề về chất lượng website.
Illyes sau đó tiếp tục trả lời:
“Và chất lượng chung của website, điều đó có thể ảnh hưởng rất nhiều đến số lượng các URL này được thu thập nhưng không được lập chỉ mục mà bạn thấy trong bảng điều khiển tìm kiếm. Nếu số lượng các URL này rất cao, điều đó có thể gợi ý về các vấn đề chung về chất lượng.
Và tôi đã thấy điều đó rất nhiều kể từ tháng 2, khi chúng ta đột nhiên quyết định lập chỉ mục một lượng lớn URL trên một website chỉ vì… nhận thức của chúng tôi về website đó đã thay đổi.”
Các lý do khác khiến việc thu thập thông tin không được lập chỉ mục
Tiếp theo, Gary đưa ra những lý do khác giải thích tại sao URL có thể được thu thập thông tin nhưng không được lập chỉ mục, nói rằng có thể nhận thức của Google về web có thể đã thay đổi nhưng đó có thể là một vấn đề kỹ thuật.
Gary giải thích:
“…Và một khả năng là khi bạn thấy con số đó tăng lên, nhận thức về… nhận thức của Google về website đã thay đổi, đó có thể là một điều.
Nhưng sau đó cũng có thể đã xảy ra lỗi, chẳng hạn như trên website và sau đó nó phân phát cùng một trang chính xác cho mọi URL trên web. Đó cũng có thể là một trong những lý do khiến bạn thấy con số đó tăng lên.
Đúng vậy, có thể có nhiều thứ.”
Tóm lại
Gary đã cung cấp các câu trả lời giúp gỡ lỗi tại sao một trang có thể được thu thập dữ liệu nhưng không được Google lập chỉ mục.
- Nội dung tương tự với nội dung đã được xếp hạng trong các trang kết quả của công cụ tìm kiếm (SERP)
- Nội dung tương tự tồn tại trên một website khác có tín hiệu tốt hơn
- Vấn đề chung về chất lượng tổng quan website
- Vấn đề kỹ thuật
Mặc dù Illyes không nói rõ ý của anh ấy về một website khác có tín hiệu tốt hơn nhưng tôi khá chắc chắn rằng anh ấy đang mô tả tình huống khi một website cung cấp nội dung của nó cho một website khác và Google chọn xếp hạng website đó cho nội dung chứ không phải website từ nhà xuất bản gốc.