Kiến thức ‘hình phạt’ hay “penalty” bị giới hạn rất nhiều trong cộng đồng SEO. Đôi khi chúng ta khó có thể bắt kịp với những cách thực tiễn nào có thể thực sự gây ra một hình phạt của Google.
Hôm nay tôi quyết định tổng hợp tất cả các vấn đề SEO chung và hình phạt vào bài này để bạn có thể dễ dàng tham khảo.
1. Các hình phạt và áp dụng có hiệu lực ngay
Google chọn áp dụng một hiệu ứng phủ định nếu không sẽ không tồn tại, bởi vì một trang web đã không tuân thủ các nguyên tắc của chúng.
1. ManipulaTing Backlink (Thao túng liên kết)
Như Google đã nói trong cảnh báo hành động thủ công cho các liên kết tự nhiên, “một mẫu liên kết giả, lừa đảo hoặc lôi kéo không tự nhiên” chỉ tới một trang web có thể bị phạt.
2. Tạo / Tác động cho Google Bot
Hiển thị nội dung / URL khác cho người dùng và công cụ tìm kiếm (được gọi là che giấu) hoặc chuyển hướng Googlebot chứ không phải người dùng là vi phạm Nguyên tắc Quản trị Trang web của Google và sẽ có nghĩa là bạn bị áp dụng với một hình phạt.
Điều nay bao gôm:
- Văn bản và liên kết chỉ hiển thị với công cụ tìm kiếm
- Hiển thị HTML cho công cụ tìm kiếm, nhưng chỉ hiển thị Flash / hình ảnh cho người dùng.
Tuy nhiên, John Mueller của Google đã đề cập đến một ngoại lệ trong một Hangout Quản trị Trang web gần đây: mặc dù đó là cách che giấu kỹ thuật, John nói rằng ông không thấy “vấn đề” đó là chuyển hướng Googlebot từ các URL có tham số theo dõi đến các URL chuẩn, nhưng cho phép người dùng không được Được chuyển hướng, vì vậy chúng có thể được theo dõi trong phân tích.
3. Doorway Pages
Tạo một số trang cửa được thiết kế đặc biệt để xếp hạng trong kết quả tìm kiếm, nhưng dẫn đến cùng một trang, được Google coi là thư rác.
4. Chất lượng nội dung kém
Bản cập nhật xếp hạng Panda của Google được thiết kế để ngừng các trang web có nội dung chất lượng kém xuất hiện trong kết quả tìm kiếm. Google tìm kiếm các trang web có tỷ lệ lớn các yếu tố điều hướng / hình ảnh / động và không đủ bản sao, quá nhiều trang trống, nhồi nhét quảng cáo và các trục trặc kỹ thuật cản trở trải nghiệm của người dùng.
5. Nội dung tạo tự động
Hầu hết nội dung đã được tạo tự động sẽ vi phạm Nguyên tắc quản trị trang web của Google. Điều này có thể bao gồm nội dung được dịch tự động, nội dung bị cạo từ nguồn cấp dữ liệu Atom / RSS hoặc kết quả tìm kiếm hoặc nội dung đã được kết hợp với nhau từ các nguồn khác mà không thêm bất kỳ nội dung giá trị nào.
6. Sử dụng MARKUP giả tạo
Trong một cuộc họp của Google Webmaster Hanger gần đây, John Mueller cho biết: “Từ quan điểm chính sách, chúng tôi muốn hiển thị nội dung trên các trang khi nó được đánh dấu, vì vậy rõ ràng là dễ dàng hơn với các lược đồ đánh dấu hiện tại, các định dạng vi mô vv và khó hơn Để kiểm tra với JSON-LD vì đánh dấu JSON-LD chủ yếu là JavaScript tách biệt với HTML trên trang. ”
Ngụ ý ở đây là bạn có thể bị phạt nếu bạn đang cố đánh lừa Google bằng cách đánh dấu không hiển thị trên trang.
7. Quảng cáo và quảng cáo tự nhiên
Như Matt Cutts đã nhận xét vào năm 2013, liên kết trong quảng cáo (nội dung quảng cáo được hiển thị dưới dạng bài xã luận, chẳng hạn như bài đăng trên blog hoặc bài viết tin tức) nên không được theo dõi để chúng phân phối PageRank và bản thân quảng cáo phải được đánh dấu rõ ràng như vậy.
Các quảng cáo không công bố có thể dẫn đến một trang web (và các trang liên kết đến nó) bị phạt.
8. Hiệu suất website gây trở ngại
Các vấn đề về hiệu suất trang web gây trở ngại nghiêm trọng đến trải nghiệm của người dùng về trang web của bạn có thể khiến trang web bị xóa khỏi kết quả tìm kiếm, hiệu quả giống như hình phạt. Giúp tăng tốc độ trang web của bạn bằng cách tuân thủ Các Quy tắc về Google PageSpeed của Google.
9. Hacker Spam
Vào tháng 10 năm 2015, Google đã đưa ra bản cập nhật liên quan đến spam ‘Hacker’ trong các kết quả tìm kiếm. Spam bị khóa cơ bản sẽ không còn hiển thị trong kết quả tìm kiếm.
10. Chỉ sử dụng HTTP
Vào tháng 8 năm 2014, Google tuyên bố họ sẽ đưa ra một lợi thế xếp hạng nhỏ cho các trang web sử dụng HTTPS. Tuy nhiên, đây chỉ là một tín hiệu nhẹ vào lúc này.
11. Không tối ưu Mobile
Bản cập nhật thân thiện với thiết bị di động của Google có nghĩa là các trang web không đáp ứng các yêu cầu thân thiện với thiết bị di động của họ sẽ không được hiển thị trên nhiều kết quả tìm kiếm.
12. Interstitials (Quảng cáo chuyển tiếp)
Kể từ ngày 1 tháng 11 năm 2015, quảng cáo chuyển tiếp trong ứng dụng bao gồm ‘số lượng nội dung đáng kể‘ trên một trang sẽ không được coi là thân thiện với thiết bị di động và sẽ không được xếp hạng.
2. Các vấn đề SEO khác (Bị ảnh hưởng chứ không bị phạt)
1. Nội dung trùng lặp
Không có hình phạt nào vì nội dung trùng lặp, nhưng Google có thể cố gắng lọc các bản sao từ chỉ mục bằng cách chọn một phiên bản chính của nội dung (ngay cả khi nội dung này không được chỉ định trong một thẻ canonical hoặc redirect) và ưu tiên cho một phiên bản này trong kết quả tìm kiếm.
Sự trùng lặp giữa các trang web khác nhau có thể gây nhầm lẫn trong kết quả về phiên bản của cùng một nội dung nên được lập chỉ mục, có thể dẫn đến giả định rằng có một hình phạt thủ công:
Nội dung trùng lặp có thể bao gồm các vấn đề sau (nhưng không phải là tất cả):
- Các phiên bản cùng 1 tên miền: www / non-www và HTTP / HTTPS
- Cùng một URL với các thông số khác nhau
- Mô tả sản phẩm trùng lặp trên các URL / trang web khác nhau
- Tách các URL thân thiện với thiết bị di động, các URL thân thiện với máy in vv
- Nội dung thông cáo báo chí được sử dụng trên một số ấn phẩm tin tức
- Nội dung liên kết
- Nội dung đã được tổng hợp
- Các trang Tag và Category
- Nội dung được bản địa hoá (nội dung tương tự chứa thông tin được điều chỉnh cho người dùng trong một khu vực cụ thể
Google không coi đây là nội dung trùng lặp, do đó thường sẽ không cố gắng ‘gấp lại’ trang thành một.
- Cùng một nội dung được dịch sang nhiều ngôn ngữ *
- Các trang khác nhau có cùng thẻ tiêu đề và mô tả *
- Nội dung web và ứng dụng tương đương *
Để giúp giảm thiểu tác động của nội dung trùng lặp, bạn nên sử dụng các thẻ canonical, hreflang, Redirect 301 và thêm giá trị cho nội dung hiện tại nếu phù hợp.
2. Chuỗi chuyển hướng
Chuỗi chuyển hướng (một trang chuyển hướng đến trang 2, và sau đó trang 2 chuyển hướng sang trang thứ ba) sẽ làm chậm tiến trình của Googlebot thông qua trang web của bạn (sau đó làm giảm hiệu quả thu thập dữ liệu) và cũng làm tăng thời gian tải cho người dùng.
3. Lỗi 500
Lỗi 500 trên website sẽ không gây ra một hình phạt, nhưng chúng có thể ảnh hưởng đến thứ hạng của bạn.
Trong một Hangout của Google Webmaster gần đây, John Mueller của Google giải thích rằng nếu Googlebot có thể lấy lỗi máy chủ có nghĩa là nó đang thu thập thông tin trang web của bạn quá nhanh, dẫn đến tỷ lệ thu thập thông tin chậm hơn.
Tỷ lệ thấp hơn này có thể có nghĩa là Google sẽ thấy ít nội dung của bạn hơn và có thể lập chỉ mục nội dung mới sau này.
Nếu trang web liên tục gửi 500 lỗi trở lại Google, chúng sẽ được xử lý như 404 và các URL trả về lỗi sẽ bị loại khỏi kết quả tìm kiếm.
4. Lỗi 404 và không được chuyển hướng
Không có hình phạt nào cho việc lỗi 404 hoặc để lại các trang hết hạn mà không cần chuyển hướng. Nếu Googlebot tìm thấy một trang trả về 404, trang đó sẽ bị xóa khỏi chỉ mục của Google; Nó có thể được kích hoạt lại sau đó và sẽ được thu thập lại.
Tuy nhiên, nếu người dùng thường xuyên truy cập các trang 404 thì nó có thể ảnh hưởng đến tương tác, vì vậy tốt nhất là tạo ra một trang 404 hấp dẫn có thể cho phép người dùng tìm thấy những gì họ cần hoặc 301 chuyển hướng đến một sự thay thế tương đương.
5. Sử dụng thẻ Canonical cho phiên bản nội dung sai
Mặc dù Google chỉ đề xuất sử dụng các Tag Cananical trong các trang nội bộ, nhưng không có hình phạt đối với việc liên kết đến các URL chuẩn.
Tuy nhiên, liên kết đến các phiên bản khác ‘làm suy yếu’ các tín hiệu trỏ đến phiên bản chính của trang và có thể có nghĩa là Google sẽ ưu tiên phiên bản khác của nội dung của bạn trong kết quả tìm kiếm.
Tương tự như vậy, không có hình phạt đối với việc liên kết đến phiên bản chính thức sai, nhưng điều này khiến Googlebot khó tìm ra phiên bản nội dung bạn muốn được lập chỉ mục và phiên bản sai có thể xuất hiện trong kết quả tìm kiếm.
Ngoài ra, Google có thể bỏ qua các thẻ Canonical của bạn nếu bạn có thể chuẩn hóa nhiều trang cho một URL đơn lẻ không giống nhau.
6. Chuyển hướng nhiều URL đến URL đích
Như ý kiến của John Mueller trong Hangout Quản trị Web của Google vào ngày 16 tháng 10, quá nhiều URL chuyển hướng đến một URL không liên quan (chẳng hạn như trang chủ) có thể được xem như là một phần mềm 404 thay vì có nhiều nội dung cũ chuyển hướng đến một trang.
Không phải là một sự tương đương trực tiếp gây bối rối cho người dùng và Google không thể “đánh đồng” các trang với bất cứ thứ gì.
7. Thời gian tải trang
Google là chú trọng tất cả về sự tương tác và họ đặc biệt khuyên bạn nên tối ưu hóa tốc độ của trang web trong Hướng dẫn Quản trị Trang web của họ, nhưng những vấn đề nhỏ với thời gian tải không ảnh hưởng đến thứ hạng và hiệu suất.
Bất kỳ cải tiến nào bạn có thể thực hiện để giúp người dùng theo cách của họ thông qua trang web (ví dụ như giảm thời gian tải) sẽ giúp tương tác và lòng trung thành với thương hiệu.
8. HTML không hợp lệ
Như đã đề cập của John Mueller, Google vẫn sẽ cố gắng hiểu một trang có chứa HTML không hợp lệ và cách họ có thể xếp hạng nó.
Mọi thứ trên trang đều có giá trị để Google có thể hiểu nội dung, nhưng họ hiểu rằng “trong thế giới thực hầu hết các trang đều không phải là HTML hợp lệ”, do đó Googlebot phải có khả năng giải quyết vấn đề đó.
Tuy nhiên, một trang HTML bị hỏng có thể vẫn không thể đọc, trong trường hợp đó, hiệu suất SEO có thể bị ảnh hưởng.
9. Chuyển hướng / 404 trong Sitemap
Bạn có thể gửi Sơ đồ trang web XML với các trang hết hạn (trả về 404) để giúp chúng nhanh chóng bị xóa khỏi chỉ mục. Tốt nhất là đưa chúng vào Sơ đồ trang web riêng biệt để bạn có thể xem chúng riêng biệt với các URL có thể lập chỉ mục khác.
Bạn nên gỡ bỏ chúng sau khi đã xóa khỏi chỉ mục để đảm bảo số chỉ mục phản ánh trạng thái thực của trang web và tránh tiếp tục thu thập URL.
10. Chặn / mở khóa Tệp JAVASCRIPT
Google khuyên bạn nên thu thập dữ liệu toàn bộ nội dung của trang web (để cho phép Googlebot hiển thị trang như trình duyệt và kiểm tra tính tương thích của điện thoại di động) nhưng không có hình phạt nào cho phép quá nhiều / ít các tệp này.
Nếu không được phép, có nghĩa là Googlebot sẽ không thể biết được trang của bạn có thân thiện với thiết bị di động và có thể không thể hiểu được trang của bạn nếu bạn sử dụng JavaScript để hiển thị nội dung.
11. Sử dụng HTTP2
Google không thể thu thập thông tin các trang web chỉ hoạt động trên HTTP2 vào lúc này. John Mueller đã đề cập rằng họ đang làm việc này và ông nghi ngờ nó sẽ được sẵn sàng vào cuối năm nay.
12. Xác định ngôn ngữ theo địa điểm người dùng
Matt Cutts thảo luận về việc phân phát nội dung khác nhau cho người dùng dựa trên vị trí IP của họ trong năm 2009 và giải thích sự khác biệt giữa việc này và cách che giấu.
13. Nofollow Link
Trong Buổi Webmaster Hangout của mình vào ngày 25 tháng 9, Google Mueller của Google đã nói: “Đó không phải là điều mà chúng tôi có thể nói rằng có bất kỳ lợi thế SEO nào liên quan đến trang của người khác”.
Từ bình luận của John, chúng ta có thể giả định một cách an toàn rằng nếu liên kết bên ngoài không có bất kỳ lợi thế SEO nào, thì việc không theo dõi tất cả chúng sẽ không có bất kỳ tác động tiêu cực nào (và chắc chắn không có hình phạt nào).