Tìm hiểu ba trụ cột xếp hạng của Google, vai trò quan trọng của dữ liệu người dùng cuối, cách mọi người tương tác với tìm kiếm và nhiều thông tin khác.
Bộ Tư pháp Hoa Kỳ đã công bố một số tài liệu thử nghiệm mới bao gồm các bài thuyết trình, tài liệu và email nội bộ của Google liên quan đến xếp hạng tìm kiếm.
Dưới đây là bảy nội dung thảo luận cụ thể về các yếu tố xếp hạng trên Google tìm kiếm, vai trò quan trọng của dữ liệu người dùng cuối, cách mọi người tương tác với tìm kiếm và nhiều thông tin khác.
1. Tuổi thọ của một cú nhấp chuột (tương tác với người dùng)
Đây là bản trình bày PowerPoint đã được biên tập lại rất nhiều do Eric Lehman của Google biên soạn và giống như hầu hết các tài liệu khác, nó thiếu ngữ cảnh đầy đủ đi kèm.
Tuy nhiên, những gì ở đây rất thú vị đối với tất cả những người làm SEO.
Trong slide “3 trụ cột của xếp hạng”, Google nhấn mạnh ba lĩnh vực:
- Nội dung: Tài liệu nói gì về chính nó.
- Anchors: Web khác nói gì về tài liệu.
- Tương tác người dùng: Người dùng nói gì về tài liệu.
Google đã thêm ghi chú về tương tác của người dùng:
“Chúng tôi có thể sử dụng ‘lượt nhấp chuột’ làm đại diện cho ‘tương tác của người dùng’ ở một số nơi. Tương tác của người dùng bao gồm nhấp chuột, chú ý vào kết quả, vuốt trên băng chuyền và nhập truy vấn mới.
Trong trang trình bày này có tiêu đề “Tín hiệu tương tác của người dùng”, Google minh họa mối quan hệ của các truy vấn, tương tác và kết quả Tìm kiếm, cùng với các kết quả cho truy vấn [tại sao đại dương lại mặn]. Các tương tác cụ thể được Google đề cập:
- Đọc
- Số nhấp chuột
- Cuộn
- Di chuyển chuột
Vào tháng 9, Lehman đã làm chứng trong phiên tòa chống độc quyền rằng Google sử dụng số lần nhấp chuột để xếp hạng.
Tuy nhiên, điều quan trọng là phải làm rõ rằng chỉ riêng các nhấp chuột riêng lẻ cũng là một tín hiệu nhiễu cho xếp hạng (xem thêm điều đó trong Ranking for Research). Google đã công khai cho biết họ sử dụng dữ liệu nhấp chuột để đào tạo, đánh giá, thử nghiệm có kiểm soát và cá nhân hóa.
Những gì được biên tập lại:
- Trang trình bày có tiêu đề “Số liệu” – tất cả những gì hiển thị chỉ là một dòng: “Thành phần xếp hạng web”.
- Bảy trang trình bày bổ sung, trong đó có hai trang có tiêu đề “Đề cương” và “Tóm tắt”.
Liên kết: Bản trình bày của Google: Cuộc sống của một cú nhấp chuột (tương tác với người dùng) (15 tháng 5 năm 2017) (PDF)
2. Xếp hạng
Bảy trang trình bày này là một phần của bài thuyết trình lớn hơn về Tìm kiếm chung tay trong Quý 4 năm 2016, do Lehman chuẩn bị.
Trong slide này, Google cho biết “Chúng tôi không hiểu tài liệu. Chúng tôi giả mạo nó.
- “Ngày nay, khả năng hiểu tài liệu một cách trực tiếp của chúng ta còn rất ít.
- Vì vậy, chúng tôi quan sát cách mọi người phản ứng với tài liệu và ghi nhớ phản hồi của họ.”
Và nguồn gốc “thần kỳ” của Google được tiết lộ:
“Hãy bắt đầu với một số thông tin cơ bản..
Một tỷ lần mỗi ngày, mọi người yêu cầu chúng tôi tìm tài liệu liên quan đến truy vấn.
Điều điên rồ là chúng ta không thực sự hiểu tài liệu. Ngoài một số nội dung cơ bản, chúng tôi hầu như không xem xét tài liệu.
Chúng tôi nhìn vào mọi người.
Nếu một tài liệu nhận được phản hồi tích cực, chúng tôi cho rằng nó tốt. Nếu phản ứng là âm tính thì có lẽ là xấu.
Đơn giản hóa một cách tổng thể, đây chính là nguồn gốc của phép thuật của Google.”
Vậy nó hoạt động như thế nào?
Trong slide này, Google giải thích cách “mỗi người tìm kiếm được hưởng lợi từ phản hồi của người dùng trước đây… và đóng góp phản hồi có lợi cho người dùng trong tương lai”:
“Tìm kiếm tiếp tục hoạt động theo nguyên tắc quy nạp.
Điều này có ý nghĩa quan trọng.
Trong việc thiết kế trải nghiệm người dùng, PHỤC VỤ người dùng là KHÔNG ĐỦ.
Chúng tôi phải thiết kế các tương tác cho phép chúng tôi HỌC HỎI từ người dùng.
Bởi vì đó là cách chúng ta phục vụ người tiếp theo, tiếp tục quá trình cảm ứng và duy trì ảo tưởng mà chúng ta hiểu.
Nhìn về tương lai, tôi tin rằng việc học hỏi từ người dùng cũng là chìa khóa để THỰC SỰ hiểu được ngôn ngữ.”
Và trong slide cuối cùng, Google tóm tắt bằng tuyên bố này:
- “Khi sự hiểu biết giả tạo không thành công, chúng ta trông thật ngu ngốc.”
Bốn trang trình bày còn lại hoàn toàn có thể bỏ qua, trừ khi bạn muốn biết rằng “Tìm kiếm là nơi tuyệt vời để bắt đầu hiểu ngôn ngữ. Thành công có ý nghĩa vượt xa Tìm kiếm.”
Liên kết tài liệu: Bản trình bày của Google: Q4 Search All Hands (ngày 8 tháng 12 năm 2016) (PDF)
Vì vậy, khi bạn thấy Google khẳng định các liên kết không phải là top 3 yếu tố xếp hạng quan trọng nhất, bây giờ bạn có thể hy vọng hiểu rõ hơn lý do tại sao. Điều đó không có nghĩa là các liên kết không quan trọng hoặc dữ liệu người dùng là toàn bộ lý do – học máy và xử lý ngôn ngữ tự nhiên là những phần quan trọng khác.
Google đang quan tâm đến người dùng cuối, cách mọi người tương tác với kết quả tìm kiếm. Không phải với tư cách cá nhân mà là một tập thể.
3. Nghiên cứu xếp hạng
Không rõ ai đã tạo ra bài thuyết trình này, nhưng có một số phát hiện rất thú vị ở đây.
Trong slide này, Google nói về 18 khía cạnh của chất lượng tìm kiếm:
- Mức độ liên quan
- Chất lượng trang
- Độ phổ biến
- Độ tươi mới
- Bản địa hóa
- Ngôn ngữ
- Tính trung tâm
- Sự đa dạng về chủ đề
- Cá nhân hóa
- Hệ sinh thái web
- Thân thiện với thiết bị di động
- Công bằng xã hội
- Tùy chọn
- Porn demotion
- Thư rác
- Thẩm quyền
- Sự riêng tư
- Kiểm soát người dùng sửa lỗi chính tả
Trang trình bày này thảo luận về những thiếu sót của việc đánh giá lưu lượng truy cập trực tiếp. Đúng, về cơ bản Google đang nói về việc các nhấp chuột không phải là một tín hiệu tốt vì chúng khó diễn giải.
- “Mối liên hệ giữa hành vi người dùng được quan sát và chất lượng kết quả tìm kiếm là rất mong manh. Chúng tôi cần nhiều lưu lượng truy cập để đưa ra kết luận và các ví dụ riêng lẻ rất khó diễn giải.”
Cuối cùng, trang trình bày này cung cấp một minh họa khác về cách hoạt động của xếp hạng kết quả tìm kiếm trên Google:
Có một số thông tin thú vị khác trong bài trình bày này, mặc dù không nhất thiết phải gắn liền với thứ hạng. Các vấn đề chú ý:
- “Các nỗ lực thao túng kết quả tìm kiếm diễn ra liên tục, tinh vi và được tài trợ tốt. Thông tin về cách hoạt động của tìm kiếm vẫn cần phải biết.” (Trang trình bày 5)
- “Hãy tiếp tục nói về cách hoạt động của tìm kiếm trên cơ sở cần biết. Mọi thứ chúng tôi rò rỉ sẽ được sử dụng để chống lại chúng tôi bởi SEO, những kẻ lừa đảo bằng sáng chế, đối thủ cạnh tranh, v.v.” (Trang trình bày 10)
- “Không thảo luận về việc sử dụng số lần nhấp chuột trong tìm kiếm, ngoại trừ trên cơ sở cần biết với những người hiểu rõ và không nói về chủ đề này ra bên ngoài. Google có một vị trí công khai. Đó là điều đáng tranh cãi. Nhưng làm ơn đừng tự làm đồ của riêng mình.” (Trang trình bày 11)
Link: Bài thuyết trình của Google: Xếp hạng cho Nghiên cứu (16/11/2018) (PDF)
4. Google thật kỳ diệu
Trong phần trình bày này, chúng ta tìm hiểu cách hoạt động thực sự của tìm kiếm.
Trang trình bày này giải thích cách tìm kiếm không hoạt động. Từ các ghi chú:
“Chúng tôi nhận được một câu hỏi. Các hệ thống tính điểm khác nhau phát ra dữ liệu, chúng tôi xử lý UX và gửi dữ liệu đó cho người dùng.
Điều này không sai, chỉ là chưa đầy đủ. Chưa đầy đủ đến mức công cụ tìm kiếm được xây dựng theo cách này sẽ không hoạt động tốt. Không có phép thuật.”
Trong trang trình bày này, chúng ta tìm hiểu cách hoạt động của tìm kiếm:
“Điều quan trọng là luồng thông tin thứ hai theo hướng ngược lại.
Khi mọi người tương tác với tìm kiếm, hành động của họ dạy chúng ta về thế giới.
Ví dụ: một cú nhấp chuột có thể cho chúng tôi biết rằng hình ảnh tốt hơn kết quả trên web. Hoặc một cái nhìn dài có thể có nghĩa là KP rất thú vị.
Chúng tôi ghi lại những hành động này và sau đó các nhóm tính điểm sẽ trích xuất cả mô hình hẹp và mô hình chung.”
Tiếp theo, chúng ta tìm hiểu nguồn gốc “ma thuật” của Google. Từ các ghi chú:
“Nguồn gốc phép thuật của Google chính là cuộc đối thoại hai chiều với người dùng.
Với mỗi truy vấn, chúng tôi cung cấp một số kiến thức và nhận lại một ít. Sau đó, chúng ta cho đi nhiều hơn và nhận lại nhiều hơn một chút.
Những bit này cộng lại. Sau vài trăm tỷ vòng, chúng ta bắt đầu trông khá thông minh!
Đây không phải là cách duy nhất chúng ta học nhưng là cách hiệu quả nhất.”
Vậy làm cách nào để Google học hỏi được nhiều hơn từ người dùng? Từ các ghi chú:
“Nhìn bề ngoài, người dùng đặt câu hỏi và Google trả lời. Đó là công việc kinh doanh cơ bản của chúng tôi. Chúng ta không thể làm hỏng chuyện đó được. Nhưng chúng ta phải lặng lẽ lật ngược tình thế. Một cách là:
-
Ngầm hỏi người dùng một câu hỏi
-
Cung cấp thông tin cơ bản cần thiết
-
Cung cấp cho người dùng một số cách để cho chúng tôi biết câu trả lời”
Trang trình bày này xem xét 10 liên kết màu xanh.
“Ví dụ: mười liên kết màu xanh lam ngầm đặt ra câu hỏi, ‘Kết quả nào là tốt nhất?’
Xem trước kết quả cung cấp thông tin cơ bản. Và câu trả lời là một cú nhấp chuột.
Đây là một UX tuyệt vời cho việc học tập. Trong nhiều năm, Google đã bị chế giễu vì kết quả tìm kiếm tuyệt vời trong giao diện người dùng nhạt nhẽo.
Nhưng giao diện người dùng nhạt nhẽo này đã làm cho kết quả tìm kiếm trở nên tuyệt vời.”
Trang trình bày này nằm trên Tìm kiếm Hình ảnh:
“Tìm kiếm hình ảnh đặt ra một câu hỏi tương tự– bạn thích cái nào nhất? Hình thu nhỏ cung cấp thông tin cơ bản và câu trả lời của người dùng được ghi lại dưới dạng di chuột, nhấp chuột hoặc tương tác thêm.”
Cuối cùng là thẻ kiến thức:
“Ví dụ: một số thẻ kiến thức cần nhấn thêm một lần nữa để mở hoàn toàn.
Ở bên trái, nhấn thêm có nghĩa là người dùng muốn phân loại thấp hơn và có cái nhìn tổng quan hơn.
Ở bên phải, người dùng có quá ít thông tin cơ bản.
Thêm cái gì cơ? Việc nhấn vào đây khác với việc cuộn xuống như thế nào? Người dùng không thể đưa ra quyết định đúng đắn, vì vậy Lượt nhấn và lượt nhấp là những sự kiện đặc biệt trong nhật ký; chúng ta nên mang lại ý nghĩa cho mỗi người.”
Liên kết: Bản trình bày của Google: Google thật kỳ diệu. (Ngày 30 tháng 10 năm 2017) (PDF)
5. Đăng nhập & Xếp hạng
Bài trình bày này thảo luận về “vai trò quan trọng của việc ghi nhật ký” trong xếp hạng và tìm kiếm.
Trang trình bày trông quen thuộc này tái hiện lại cuộc đối thoại hai chiều vốn là nguồn gốc của phép thuật của Google. Như đã giải thích trong ghi chú:
“Tìm kiếm hơi giống một bữa tiệc potluck, trong đó mỗi người mang một đĩa thức ăn để chia sẻ. Đây là một món ăn tuyệt vời và đa dạng mà mọi người đều có thể thưởng thức. Nhưng nó chỉ có hiệu quả vì mỗi người đều đóng góp một chút.
Theo cách tương tự, tìm kiếm được hỗ trợ bởi khối lượng kiến thức khổng lồ. Nhưng nó không phải là thứ chúng tôi tạo ra. Đúng hơn, mọi người đến tìm kiếm đều đóng góp một ít kiến thức cho hệ thống mà từ đó mọi người đều có thể hưởng lợi.”
Trong slide này, Google thảo luận về việc dịch hành vi của người dùng. Từ ghi chú slide:
“Nhật ký không chứa các đánh giá giá trị rõ ràng – đây là kết quả tìm kiếm tốt, đây là kết quả tìm kiếm tồi.
Vì vậy, chúng ta phải tìm cách diễn giải các hành vi của người dùng được đưa vào các đánh giá giá trị.
Và việc dịch thuật thực sự rất phức tạp, một vấn đề mà mọi người đã nỗ lực giải quyết khá đều đặn trong hơn 15 năm qua.
Mọi người làm việc dựa trên nó vì những đánh giá về giá trị là nền tảng của tìm kiếm trên Google.
Nếu chúng ta có thể thu được thêm một chút ý nghĩa trong một phiên, thì ngay ngày hôm sau chúng ta sẽ nhận được gấp tỷ lần điều đó.
Trò chơi cơ bản là bạn bắt đầu với một lượng nhỏ dữ liệu ‘sự thật cơ bản’ cho biết điều này trên trang tìm kiếm là tốt, điều này xấu, điều này tốt hơn điều kia.
Sau đó, bạn xem xét tất cả các hành vi liên quan của người dùng và nói: “À, đây là điều người dùng làm với một điều tốt! Đây là những gì người dùng làm với một điều xấu! Đây là cách người dùng thể hiện sự ưu tiên!’
Tất nhiên, con người thì khác nhau và thất thường. Vì vậy, tất cả những gì chúng tôi nhận được chỉ là mối tương quan thống kê, không có gì thực sự đáng tin cậy.
Ví dụ:
[BỊ TÁC ĐỘNG]
– Nếu ai đó click vào 3 kết quả tìm kiếm thì kết quả nào xấu? Chà, có thể là TẤT CẢ trong số họ, vì đây có thể là một truy vấn khó nếu họ nhấp vào 3 kết quả. Thử thách là tìm ra cái nào hứa hẹn nhất.”
Cuối cùng, trang trình bày này thảo luận về cách ghi nhật ký hỗ trợ xếp hạng và Tìm kiếm. Từ các ghi chú:
“… và đây là phần tôi đã cảnh báo bạn. Tôi đang bán thứ gì đó. Tôi đang bán ý tưởng về thuật ngữ nhật ký nhằm lưu ý đến nhu cầu của nhóm xếp hạng. Khá xin vui lòng với đường trên đầu trang.
Nhưng lý do cơ bản là nhóm xếp hạng thực sự kỳ lạ ở một khía cạnh nữa, đó là tác động kinh doanh.
Như tôi đã đề cập, không phải một hệ thống mà rất nhiều hệ thống trong bảng xếp hạng đều được xây dựng trên nhật ký.
Đây không chỉ là hệ thống truyền thống như hệ thống tôi đã giới thiệu cho bạn trước đó mà còn là hệ thống máy học tiên tiến nhất, nhiều hệ thống trong số đó chúng tôi đã công bố ra bên ngoài– RankBrain, RankEmbed và DeepRank.
Xếp hạng web chỉ là một phần của tìm kiếm, nhưng nhiều tính năng tìm kiếm sử dụng kết quả web để diễn giải truy vấn và kích hoạt tương ứng.
Vì vậy, việc hỗ trợ xếp hạng sẽ hỗ trợ tìm kiếm nói chung.
Nhưng thậm chí còn vượt xa điều này, các công nghệ được phát triển trong lĩnh vực tìm kiếm đã lan rộng khắp công ty đến Quảng cáo, YouTube, Play và các nơi khác.
Vì vậy, tôi không làm về tài chính nhưng nói một cách tổng thể, tôi nghĩ rằng một lượng lớn hoạt động kinh doanh của Google gắn liền với việc sử dụng nhật ký trong xếp hạng.”
Liên kết: Bài thuyết trình của Google: Ghi nhật ký & Xếp hạng (ngày 8 tháng 5 năm 2020) (PDF)
6. Xếp hạng trên Mobile và Desktop
Bản tin này đi sâu vào sự khác biệt giữa xếp hạng tìm kiếm trên mobile và desktop, ý định của người dùng và sự hài lòng của người dùng – tại thời điểm lưu lượng truy cập trên thiết bị di động bắt đầu vượt qua lưu lượng truy cập trên máy tính để bàn vào một số ngày.
Google đã so sánh các số liệu, bao gồm:
- CTR
- Tinh chỉnh thủ công
- Truy vấn cho mỗi nhiệm vụ
- Độ dài truy vấn (tính bằng char)
- Độ dài truy vấn (bằng word)
- Sự bỏ đi (Tỷ lệ thoát)
- Vị trí nhấp chuột trung bình
- Trùng lặp
Dựa trên những phát hiện này, một trong những khuyến nghị là:
“Tín hiệu hoặc đánh giá xếp hạng trên thiết bị di động riêng biệt phản ánh các mục đích khác nhau. Các truy vấn trên thiết bị di động thường có những mục đích khác nhau và chúng tôi có thể cần kết hợp các tín hiệu bổ sung hoặc bổ sung phản ánh những mục đích này vào khung xếp hạng của mình. Như đã thảo luận trước đó, điều mong muốn là các tín hiệu này xử lý đúng cách các sự cố cấp cục bộ.
7. Điểm đầu dòng để trình bày với Sundar
Không có gì đáng ngạc nhiên trong tài liệu này (không rõ ai đã viết nó), nhưng có một điểm thú vị về xếp hạng BERT và Tìm kiếm:
“Các thử nghiệm ban đầu với BERT được áp dụng cho một số lĩnh vực khác trong Tìm kiếm, bao gồm xếp hạng Web, cho thấy những cải tiến rất đáng kể trong việc hiểu các truy vấn, tài liệu và ý định.”
“Mặc dù BERT mang tính cách mạng nhưng nó chỉ là bước khởi đầu cho một bước nhảy vọt trong công nghệ hiểu ngôn ngữ tự nhiên.”
Liên kết: Tài liệu Google: Dấu đầu dòng để trình bày cho Sundar (17 tháng 9 năm 2019) (PDF)
Bài viết được dịch và tham khảo từ Searchengineland.com/google-search-ranking-documents-434141