Google có nhiều thẻ khác nhau ảnh hưởng đến hoạt động của trình thu thập thông tin theo cách này hay cách khác. Các thẻ này cung cấp cho Google gợi ý về cách lập chỉ mục các trang của bạn và liệu nó có nên lập chỉ mục chúng hay không. Và tất nhiên, hãy để Google hiểu đúng nội dung của bạn và giá trị của nó.
Hơn nữa, Google có thói quen giới thiệu các thẻ mới theo thời gian. Tuy nhiên, các đề xuất của Google về việc sử dụng chúng trên các website có thể khá mơ hồ và chủ sở hữu trang web có thể gặp một số khó khăn về vị trí thêm các thẻ mới và cách thức.
Trong hướng dẫn này, tôi sẽ giới thiệu tổng quan về những thẻ mà Google có, cách chúng ảnh hưởng đến hành vi của trình thu thập thông tin và cách bạn có thể áp dụng chúng trên các trang của mình.
Cùng tìm hiểu nào.
Thẻ meta robots
Thẻ meta robots ảnh hưởng đến cách Google hiển thị đoạn mã trang của bạn trong kết quả tìm kiếm. Các thẻ này được đặt trong tiêu đề của tài liệu HTML. Trên thực tế, chỉ có một thẻ – robots. Tất cả phần còn lại (nofollow, noindex, v.v.) là các lệnh bạn cung cấp cho Google để thiết lập một mẫu hành vi nhất định. Tuy nhiên, vì các hướng dẫn của Google cũng coi các chỉ thị này là thẻ, nên tôi cũng sẽ giữ tên này để giữ mọi thứ rõ ràng.
Lưu ý: Để làm cho tất cả các thẻ robots hoạt động, không đưa các trang chúng được sử dụng vào tệp robots.txt. Nếu không, Google sẽ không thể nhìn thấy chúng.
Các thẻ meta robots là:
All
Thẻ All được ngụ ý theo mặc định nếu bạn không chỉ định bất kỳ lệnh nào khác trên trang của mình. Bạn thực sự có thể nói rõ ràng hoặc không – sẽ không có gì thay đổi. Thẻ All cho Google biết rằng trang này hoàn toàn có thể được lập chỉ mục: tất cả nội dung của nó có thể được thu thập thông tin và lập chỉ mục, đồng thời có thể theo dõi tất cả các liên kết trên trang đó.
Ví dụ:
<meta name = “robots” content = “all”>
Noindex
Thẻ Noindex ngăn trang xuất hiện trong SERP. Google sẽ vẫn thu thập dữ liệu và theo dõi tất cả các liên kết trên trang nếu không có chỉ thị nào khác được ngụ ý.
Bạn có thể sử dụng thẻ này để ẩn các trang nhất định khỏi lập chỉ mục – đây có thể là các trang có dữ liệu riêng tư, trang đăng nhập, trang đang được phát triển, v.v.
Ví dụ:
<meta name = “robots” content = “noindex”>
Nofollow
Thẻ nofollow không cho phép trình thu thập thông tin của Google follow bất kỳ liên kết nào trên trang. Tuy nhiên, Google sẽ có thể lập chỉ mục trang và kéo nó lên SERP.
Ví dụ:
<meta name = “robots” content = “nofollow”>
Nếu bạn cần cả ẩn trang khỏi SERP và ngăn thu thập dữ liệu bất kỳ liên kết nào mà nó có, bạn có thể kết hợp thẻ nofollow và noindex. Như thế này:
<meta name = “robots” content = “noindex, nofollow”>
None
Thẻ này thực sự giống như nofollow và noindex kết hợp. Bạn có thể sử dụng nó để ngăn trang xuất hiện trong Google SERP và bất kỳ liên kết nào của nó bị theo dõi.
Ví dụ:
<meta name = “robots” content = “none”>
Noarchive
Bạn đã bao giờ gặp trường hợp khi bạn nhấp vào một URL từ SERP, nhưng sau đó Google nói rằng trang đó không khả dụng và hiển thị cho bạn bản sao được lưu trong bộ nhớ cache của trang đó vào một ngày nhất định?
Nếu bạn muốn đảm bảo rằng Google sẽ không hiển thị bản sao đã lưu trong bộ nhớ cache các trang của bạn cho người dùng, hãy thêm thẻ noarchive.
Sử dụng thẻ này nếu bạn muốn ngăn quyền truy cập vào một trang nhất định trong trường hợp (hoặc sau) trang này không khả dụng.
Ví dụ:
<meta name = “robots” content = “noarchive”>
Nositelinkssearchbox
Google có thể hiển thị hộp tìm kiếm liên kết website nội bộ của bạn ngay trên SERP của nó. Vì vậy, mọi người có thể thực hiện tìm kiếm website mà không cần truy cập trực tiếp vào website của bạn.
Nếu bạn muốn người dùng truy cập website của mình trước khi tìm kiếm bất kỳ thứ gì trên đó, hãy đặt thẻ nositelinkssearchbox trong HTML của trang chủ của bạn.
Ví dụ:
<meta name = “robots” content = “nositelinkssearchbox”>
Indexifembedded
Đây là điều hoàn toàn mới của Google. Nếu bạn thêm thẻ được gắn sẵn trên trang của mình, thì nội dung từ trang này có thể được lập chỉ mục nếu nó được nhúng trên một số trang khác thông qua iframe hoặc các thẻ HTML tương tự.
Note! Thẻ indxifembedded chỉ hoạt động cùng với thẻ noindex, vì bản thân trang sẽ không được lập chỉ mục. Nội dung của trang chỉ được lập chỉ mục khi nó được nhúng vào một nơi khác.
Tại sao bạn có thể cần thẻ này?
Đây là những gì Google nói về vấn đề này:
Thẻ indexifembedded không xác định giải quyết một vấn đề phổ biến đặc biệt ảnh hưởng đến các nhà xuất bản phương tiện truyền thông: mặc dù họ có thể muốn nội dung của mình được lập chỉ mục khi nó được nhúng trên các trang của bên thứ ba, nhưng họ không nhất thiết muốn các trang phương tiện của mình được lập chỉ mục theo cách riêng của họ.
Điều này thực sự có ý nghĩa gì?
Giả sử, bạn có trang A với một số loại phương tiện có ít ngữ cảnh. Trang A này có một thẻ noindex. Nếu bạn nhúng nội dung từ trang A sang trang B, nội dung này sẽ không được lập chỉ mục, vì vậy trang B cũng sẽ không được lập chỉ mục đầy đủ. Nhưng nếu bạn thêm một thẻ được nhúng vào trang A, thì nội dung được nhúng sẽ được lập chỉ mục trên trang B. Vì vậy, trang B được lập chỉ mục đầy đủ.
Ví dụ:
<meta name = “robots” content = “noindex, indxifembedded”>
Notranslate
Thẻ notranslate ngăn Google dịch đoạn mã trang của bạn sang ngôn ngữ của truy vấn tìm kiếm. Nếu bạn không sử dụng thẻ này, Google sẽ dịch đoạn mã của trang và tất cả nội dung của trang. Hơn nữa, Google sẽ tự động dịch tất cả các liên kết được nhấp từ trang đó.
Vấn đề là tất cả các tương tác với website của bạn trong trường hợp đó sẽ thông qua Google Dịch. Mặc dù Google Dịch đang trở nên chính xác hơn từng ngày và chất lượng bản dịch của nó nhìn chung là tốt, nhưng một số nhầm lẫn vẫn có thể xảy ra.
Vì vậy, nếu nội dung của bạn nhạy cảm với các bản dịch, tôi khuyên bạn nên thêm thẻ notranslate để hạn chế khả năng sáng tạo không thể đoán trước của Google. Đến lượt mình, bạn có thể tạo một số phiên bản ngôn ngữ của website để làm cho nội dung của bạn tiếp cận được nhiều đối tượng hơn.
Ví dụ:
<meta name = “robots” content = “notranslate”>
Noimageindex
Thẻ này ngăn Google lập chỉ mục bất kỳ hình ảnh nào trên trang và kéo chúng vào SERP.
Ví dụ:
<meta name = “robots” content = “noimageindex”>
Unavailable_after: [date/time]
Thẻ này không cho phép Google hiển thị trang trong SERPs sau một số ngày cụ thể.
Bạn có thể sử dụng thẻ này trên một số trang liên quan đến sự kiện (ưu đãi theo mùa, giảm giá, chiến dịch khuyến mại, v.v.), những trang này sẽ trở nên không liên quan sau một ngày nhất định.
Ví dụ:
<meta name = “robots” content = “unavailable_after: 2022-04-23”>
Nosnippet
Áp dụng thẻ nosnippet nếu bạn không muốn trang của mình có đoạn văn bản hoặc đoạn video nổi bật. Hãy nhớ rằng đoạn mã hình ảnh có thể vẫn được hiển thị trên SERP.
Tại sao bạn có thể cần cái này?
Giả sử, trang của bạn có một đoạn mã nổi bật và nếu đoạn mã này cung cấp tất cả thông tin cần thiết ngay trên SERP, thì người dùng có thể không cần truy cập vào website của bạn. Ví dụ: đây là một trường hợp phổ biến nếu chúng ta google, chẳng hạn như lời bài hát:
Người dùng nhận được thông tin của bạn từ SERP, vì vậy họ không cần phải đi bất cứ nơi nào khác. Điều này có nghĩa là trang của bạn nơi lấy nội dung không nhận được lưu lượng truy cập mà nó có thể nhận được. Tuy nhiên, việc sử dụng thẻ nosnippet có thể gặp rủi ro vì các đoạn mã của đối thủ cạnh tranh của bạn sau đó có thể hoạt động tốt hơn bạn và được chú ý nhiều hơn.
Ví dụ:
<meta name = “robots” content = “nosnippet”>
Max-snippet: [number]
Thẻ này hướng dẫn Google về số lượng ký tự mà nó có thể sử dụng trong meta description đoạn mã. Bạn có thể đặt con số chính xác, cũng như:
0 – nếu bạn không muốn trang của mình có một đoạn mã nào cả (bằng với nosnippet);
-1 – nếu bạn không muốn giới hạn Google và để Google tự chọn độ dài của đoạn mã.
Google sẽ theo dõi các thẻ này trong trường hợp không được cấp quyền sử dụng nội dung cụ thể. Điều này bao gồm việc đánh dấu trang của bạn bằng dữ liệu có cấu trúc hoặc cung cấp cho Google thỏa thuận cấp phép. Cả hai lệnh này đều mạnh hơn các thẻ dành riêng cho đoạn mã, vì vậy hãy đảm bảo rằng bạn không áp dụng chúng nếu bạn cần thiết lập giới hạn đoạn mã.
Ví dụ:
<meta name = “robots” content = “max-snippet: 20”>
Max-image-preview: [setting]
Thẻ max-image-preview cho phép bạn chọn kích thước hình ảnh được hiển thị trên SERP. Nếu bạn không sử dụng thẻ này, thì Google sẽ sử dụng kích thước hình ảnh mặc định.
Ba tùy chọn để nêu ở đây:
- None: một đoạn mã sẽ không bao gồm một hình ảnh nào cả;
- Standard: một hình ảnh sẽ có kích thước mặc định;
- Large: hình ảnh có thể lớn, bằng chiều rộng của khung nhìn.
Thẻ này áp dụng cho tất cả các loại kết quả tìm kiếm trừ khi bạn đã cấp cho Google các quyền cụ thể (chẳng hạn như khi nội dung của bạn là AMP hoặc phiên bản canonical của một bài báo hoặc khi bạn có thỏa thuận cấp phép với Google).
Ví dụ:
<meta name = “robots” content = “max-image-preview: standard”>
Max-video-preview: [number]
Thẻ này cho phép bạn chỉ định thời lượng chính xác (giây) của đoạn mã xem trước video.
Các tùy chọn đặc biệt để nêu ở đây:
0 – tùy chọn này hiển thị hình ảnh tĩnh thay vì video. Kích thước của hình ảnh phụ thuộc vào những gì bạn chỉ định với thẻ xem trước hình ảnh tối đa;
-1 – không có giới hạn về thời lượng xem trước video.
Cũng giống như tất cả các thẻ liên quan đến đoạn mã, chế độ max-video-preview áp dụng cho tất cả các loại kết quả tìm kiếm.
Ví dụ:
<meta name = “robots” content = “max-video-preview: 9”>
Giá trị Rel cho chất lượng liên kết
Các thẻ này, hay nói rõ ràng là các thuộc tính rel trong thẻ <a>, được sử dụng để điều chỉnh các mối quan hệ liên kết giữa các trang. Thuộc tính Rel là các chỉ thị nội tuyến và được đặt trong phần nội dung của tài liệu HTML trong dòng có liên quan.
Hiện tại, Google có các giá trị rel sau:
Rel=”nofollow”
Nofollow ban đầu được giới thiệu để đánh dấu các liên kết trả phí, do người dùng tạo và các liên kết mà bạn không muốn Google liên kết với website của mình. Các liên kết được đánh dấu là nofollow không vượt qua PageRank và không cho phép Google thu thập dữ liệu trang được liên kết từ website của bạn.
Vấn đề là rel=”nofollow” đã thay đổi rất nhiều kể từ ngày nó được giới thiệu. Vào năm 2019, Google đã xác nhận rằng họ coi các liên kết nofollow như một gợi ý – do đó, các trình thu thập thông tin của Google giờ đây có thể quyết định xem có nên tự mình truy cập các liên kết này (đọc là vượt qua PageRank) hay không.
Vậy bạn nên sử dụng nofollow hiện nay như thế nào?
Áp dụng giá trị này cho các liên kết đến các trang mà bạn không muốn chia sẻ PageRank vì bất kỳ lý do gì. Đây có thể là các trang của đối thủ cạnh tranh của bạn hoặc các trang mà bạn không muốn Google liên kết với website của mình. Đồng thời, không phải là ý tưởng tốt nhất để liên kết đến bất kỳ trang nào rõ ràng là chất lượng thấp ngay cả với các liên kết nofollow, vì chúng vẫn cho Google cơ hội truy cập trang được liên kết.
Ví dụ:
<a rel=”nofollow” href=”https://mysite.com/my_page”>my anchor</a>
Rel = “ugc”
Google khuyên bạn nên sử dụng rel =”ugc” với các liên kết đến nội dung do người dùng tạo. Đây là một thẻ tương đối mới (trước đây, nofollow được đề xuất cho UGC).
Áp dụng thẻ này nếu bạn không chắc chắn về chất lượng của nội dung do người dùng tạo. Loại nội dung này thực sự khó để mắt đến để chắc chắn về bất cứ điều gì, vì vậy hãy giữ các trang của bạn ở khía cạnh an toàn.
Ví dụ:
<a rel=”ugc” href=”https://mysite.com/my_page”>my anchor</a>
Tuy nhiên, những người làm SEO vẫn có những lo ngại nhất định nếu bạn nên sử dụng rộng rãi thuộc tính rel = “ugc”. Một trong những lý do cho điều này là tuyên bố của Google nói rằng:
Nếu bạn muốn ghi nhận và khen thưởng những người đóng góp đáng tin cậy, bạn có thể xóa thuộc tính này khỏi các liên kết được đăng bởi các thành viên hoặc người dùng đã liên tục có những đóng góp chất lượng cao theo thời gian.
Điều này ngụ ý rằng, không giống như nofollow, Google có thể coi các liên kết rel=”ugc” như một thứ không thực sự có giá trị.
Rel=”sponsored”
Thuộc tính rel=”sponsored” được khuyến khích sử dụng cho các việc mua và affiliate links.
Thẻ này cũng mới; trước đây, Google đã khuyến nghị áp dụng nofollow cho loại liên kết này.
Trên thực tế, rel =”nofollow” vẫn được chấp nhận đối với các liên kết trả phí, vì vậy bạn không cần phải thay đổi các thuộc tính trên các trang của mình theo cách thủ công. Tuy nhiên, tốt hơn bạn nên đánh dấu các liên kết trả phí mới là sponsored.
Ví dụ:
<a rel=”sponsored” href=”https://mysite.com/my_page”>my anchor</a>
Một câu hỏi hay thực sự là tại sao Google cần các thuộc tính mới khi nofollow vẫn được chấp nhận cho tất cả các loại liên kết. Có thể ý tưởng là Google sẽ xử lý các thuộc tính này (gợi ý, như Google nói) theo cách khác.
Điều thú vị nữa là Google đề xuất các ví dụ về việc sử dụng nhiều giá trị rel cùng một lúc. Như thế này:
<p>I hate <a rel=”ugc nofollow” href=”https://cheese.example.com/blue_cheese”>Blue</a> cheese.</p>
Hoặc:
<p>I hate <a rel=”ugc sponsored” href=”https://cheese.example.com/blue_cheese”>Blue</a> cheese.</p>
Điều này chỉ có thể có nghĩa là chắc chắn Google sẽ đối xử với chúng theo cách khác. Vẫn chưa rõ sự khác biệt này là gì, nhưng những thẻ này báo hiệu điều gì đó cho Google.