Làm rõ cách các thuật toán xếp hạng Google hoạt động

Bạn đang đặt ra câu hỏi các thuật toán xếp hạng Google hoạt động như thế nào? Và làm thế nào để xếp hạng tốt hơn trên Google tìm kiếm? Cùng SEO HOT làm rõ cách các thuật toán xếp hạng Google hoạt động qua các tài liệu bị rõ rĩ từ Google nhé.

Các tài liệu tiết lộ cách Google tìm kiếm đang sử dụng hoặc đã sử dụng lượt nhấp, liên kết, nội dung, thực thể, dữ liệu Chrome và nhiều yếu tố khác để xếp hạng.

Một loạt tài liệu bị rò rỉ của Google đã cho chúng ta cái nhìn chưa từng có về Google tìm kiếm và tiết lộ một số yếu tố quan trọng nhất mà Google sử dụng để xếp hạng nội dung.

Vụ rõ rỉ tài liệu làm rõ cách các thuật toán Google hoạt động

Hàng ngàn tài liệu, dường như đến từ kho API Nội dung nội bộ của Google, đã được một bot tự động tên là yoshi-code-bot phát hành trên Github vào ngày 13 tháng 3. Những tài liệu này đã được chia sẻ với Rand Fishkin, đồng sáng lập SparkToro, vào đầu tháng này.

Từ các tài liệu này, chúng ta đã được hé lộ cách thức hoạt động của thuật toán xếp hạng của Google, một điều vô cùng quý giá đối với các chuyên gia SEO, những người có thể hiểu rõ ý nghĩa của nó. Năm 2023, chúng ta đã có cái nhìn chưa từng có về các yếu tố xếp hạng của Yandex Search thông qua một vụ rò rỉ , một trong những sự kiện lớn nhất năm đó.

Vụ rò rỉ tài liệu Google này? Đây có thể sẽ là một trong những câu chuyện lớn nhất trong lịch sử SEO và Google tìm kiếm.

Nội dung bên trong các tài liệu này đề cập đến những gì?

Dưới đây là những gì tôi biết về các tài liệu nội bộ, nhờ Fishkin và King:

Hiện tại: Tài liệu cho thấy thông tin này là chính xác tính đến tháng 3-2025.

Tính năng xếp hạng: Tài liệu API thể hiện 2.596 mô-đun với 14.014 thuộc tính.

Trọng số: Các tài liệu không nêu rõ cách tính trọng số cho bất kỳ tính năng xếp hạng nào – chỉ nêu rõ chúng tồn tại.

Twiddlers: Theo King, đây là các hàm xếp hạng lại “có thể điều chỉnh điểm truy xuất thông tin của một tài liệu hoặc thay đổi thứ hạng của một tài liệu”.

Hạ hạng: Nội dung có thể bị hạ hạng vì nhiều lý do, chẳng hạn như:

  • Liên kết không khớp với trang đích.
  • Tín hiệu SERP cho thấy sự không hài lòng của người dùng.
  • Đánh giá sản phẩm.
  • Location
  • Tên miền khớp chính xác.
  • Khiêu dâm

Lịch sử thay đổi: Google dường như lưu giữ bản sao của mọi phiên bản của mọi trang đã từng được lập chỉ mục. Điều này có nghĩa là Google có thể “ghi nhớ” mọi thay đổi đã được thực hiện trên một trang. Tuy nhiên, Google chỉ sử dụng 20 lần thay đổi gần nhất của một URL khi phân tích liên kết.

Liên kết rất quan trọng. Các tài liệu cho thấy sự đa dạng và mức độ liên quan của liên kết vẫn là yếu tố then chốt. Và PageRank vẫn còn rất hữu ích trong các tính năng xếp hạng của Google. PageRank cho trang chủ của một website được xem xét cho mọi tài liệu.

Điều này không chứng minh người phát ngôn của Google đã nói dối về việc liên kết không phải là “ba yếu tố xếp hạng hàng đầu” hay liên kết ít quan trọng hơn đối với xếp hạng. Có thể có hai điều đúng cùng một lúc. Một lần nữa, chúng ta không biết bất kỳ yếu tố nào trong số này được đánh giá như thế nào.

Những cú click chuột thành công rất quan trọng. Điều này không có gì đáng ngạc nhiên, nhưng nếu bạn muốn xếp hạng cao, bạn cần tiếp tục tạo ra nội dung và trải nghiệm người dùng tuyệt vời dựa trên các tài liệu. Google sử dụng nhiều phép đo khác nhau, bao gồm badClicks, goodClicks, lastLongestClicks và unsquashedClicks.

Ngoài ra, các tài liệu dài hơn có thể bị cắt bớt, trong khi nội dung ngắn hơn sẽ được chấm điểm (từ 0-512) dựa trên tính độc đáo. Điểm cũng được tính cho các nội dung “Your Money Your Life”, chẳng hạn như website sức khỏe và tin tức.

Tất cả những điều này có ý nghĩa gì?

Theo King:

Bạn cần thu hút nhiều lượt nhấp chuột thành công hơn bằng cách sử dụng một tập hợp truy vấn rộng hơn và tạo ra nhiều liên kết đa dạng hơn nếu muốn tiếp tục được xếp hạng tốt. Về mặt lý thuyết, điều này hoàn toàn hợp lý vì một nội dung chất lượng sẽ làm được điều đó. Việc tập trung vào việc thu hút nhiều lưu lượng truy cập chất lượng hơn đến trải nghiệm người dùng tốt hơn sẽ gửi tín hiệu đến Google rằng trang của bạn xứng đáng được xếp hạng.

Tài liệu và lời khai từ phiên tòa chống độc quyền giữa Hoa Kỳ và Google đã xác nhận rằng Google sử dụng số lượt nhấp chuột để xếp hạng – đặc biệt là với hệ thống Navboost, “một trong những tín hiệu quan trọng” mà Google sử dụng để xếp hạng.

Thương hiệu rất quan trọng. Bài học lớn nhất của Fishkin là gì? Thương hiệu quan trọng hơn bất cứ điều gì khác:

“Nếu có một lời khuyên chung mà tôi dành cho các nhà tiếp thị muốn cải thiện thứ hạng tìm kiếm tự nhiên và lưu lượng truy cập, thì đó sẽ là: ‘Hãy xây dựng một thương hiệu đáng chú ý, phổ biến và được công nhận rộng rãi trong lĩnh vực của bạn, bên ngoài tìm kiếm của Google.‘”

Các thực thể rất quan trọng. Quyền tác giả vẫn tồn tại. Google lưu trữ thông tin tác giả liên quan đến nội dung và cố gắng xác định xem một thực thể có phải là tác giả của tài liệu hay không.

SiteAuthority: Google sử dụng một thứ gọi là “siteAuthority”.

Google đã nói với chúng tôi rằng có một điều gì đó tương tự như thế này tồn tại vào năm 2011, sau khi bản cập nhật Panda được ra mắt, tuyên bố công khai rằng “nội dung chất lượng thấp trên một phần của website có thể ảnh hưởng đến thứ hạng của toàn bộ website”.

Tuy nhiên, Google đã phủ nhận việc có điểm uy tín của website trong những năm sau kể từ đó.

Dữ liệu Chrome. Một mô-đun có tên ChromeInTotal cho biết Google sử dụng dữ liệu từ trình duyệt Chrome để xếp hạng.

Danh sách trắng. Một vài mô-đun cho thấy Google đưa một số tên miền liên quan đến bầu cử và COVID vào danh sách trắng – isElectionAuthority và isCovidLocalAuthority. Mặc dù chúng ta đã biết từ lâu Google (và Bing) có “danh sách ngoại lệ” khi “các thuật toán cụ thể vô tình tác động đến các website”.

Các website nhỏ. Một tính năng khác là smallPersonalSite – dành cho các website hoặc blog cá nhân nhỏ. King suy đoán rằng Google có thể tăng hoặc giảm thứ hạng các website như vậy thông qua Twiddler. Tuy nhiên, điều đó vẫn còn là một câu hỏi bỏ ngỏ. Một lần nữa, chúng tôi không biết chắc chắn các tính năng này được đánh giá cao đến mức nào.

Những phát hiện thú vị khác. Theo tài liệu nội bộ của Google:

  • Độ mới rất quan trọng – Google xem xét ngày trong dòng tiêu đề (bylineDate), URL (sytacticDate) và nội dung trên trang (semanticDate).
  • Để xác định xem một tài liệu có phải là chủ đề cốt lõi của trang web hay không, Google sẽ vector hóa các trang và website, sau đó so sánh các nhúng trang (siteRadius) với các nhúng website (siteFocusScore).
  • Google lưu trữ thông tin đăng ký tên miền (RegistrationInfo).
  • Tiêu đề trang vẫn quan trọng. Google có một tính năng gọi là titlematchScore, được cho là có thể đo lường mức độ phù hợp của tiêu đề trang với truy vấn.
  • Google đo kích thước phông chữ có trọng số trung bình của các thuật ngữ trong tài liệu (avgTermWeight) và văn bản neo.

Tìm hiểu đầy đủ các tài liệu bị rò rỉ của Google tìm kiếm tại đây.

dịch vụ SEO HOT
Dịch vụ SEO HOT là công ty SEO hàng đầu tại TPHCM cung cấp các gói SEO tổng thể, SEO từ khóa, SEO Google Maps, tư vấn SEO cho các doanh nghiệp vừa và nhỏ.