Sửa lỗi google không index website

Tại sao website không được index, hay google không index bài viết, trang chủ, trang chuyên mục… là những câu hỏi thường gặp phải, nhất là đối với các bạn mới bắt đầu tạo dựng cho mình trang web/blog đầu tiên.

Đã tìm hiểu – hiện không được lập chỉ mục??? puck gu gồ???

wpvina

Những lỗi google không index website thường gặp phải:

  • Không index toàn bộ trang web
  • Không index trang chủ
  • Không index trang bài viết mới đăng

Đấy là những lỗi mà chúng ta thường gặp phải khi bắt đầu khai báo trang web của bản thân với bộ máy tìm kiếm vĩ đại nhất hiện nay – GOOGLE.

Sửa lỗi google không index website

Vậy tại sao google không index?

Tại sao website không được index? Và sau đây là một số thông tin:

  • Một là do bạn chặn bot google truy cập
  • Hai là nó cho rằng trang web của bạn không hữu ích, nội dung rác
  • Ba là trang web của bạn bị vỡ giao diện, hoặc các phần nội dung chồng chéo lên nhau
  • Bốn là tốc độ tải trên trang của bạn quá chậm chạp
  • Năm là Hosting, VPS chặn bot truy cập
  • Sáu là trang web của bạn đang dính án phạt từ một thuật toán nào đó của google
  • Bảy là google đang tắt tính năng này trong một khoảng thời gian nhất định
  • Tám là vi phạm luật sử dụng dữ liệu có cấu trúc – Schema Google

Với các trang web mới thì sẽ rơi vào trường hợp Một, hai, ba, bốn, năm.

Các trang web lâu đời nếu không được index bài viết mới trong nhiều tháng thì rất có thể đã rơi vào trường hợp thứ Sáu.

Án phạt của google rất đáng sợ, vì thế các bạn nên xây dựng nội dung và backlink thật chất lượng để không rơi vào trường hợp này. Để phát hiện ra án phát của google cũng rất khó khăn, đòi hỏi SEOER phải có kiến thức chuyên môn vững chắc, hiểu về mọi thuận toán của bộ máy này và đã làm nhiều dự án SEO.

Còn để phát hiện google bảo trì hay tạm thời tắt tính năng index thì bạn nên theo dõi các blog tin tức chuyên về SEO. Cũng có thể google sẽ thông báo trong Search Console.

Trường hợp thứ năm, google không index bài viết vì bị nhà cung cấp chặn BOT cũng rất ít gặp, nếu một công ty cung cấp Hosting, VPS mà chặn bot tìm kiếm truy cập thì chắc chả có khách hàng nào thuê nữa mất.

Trường hợp website không index từ một, hai, ba và bốn và chúng ta mắc phải nhiều nhất. Sau đây mình sẽ chỉ các bạn một số mẹo để kiểm tra xem bạn đang thuộc trường hợp nào và cách xử lí lỗi google không index website (trang chủ, bài viết…) ra sao nhé!

GO GO GO////////////////////////////////////////////////////////////////

Sửa lỗi website không index

Sau khi hiểu những lí do tại sao google không index website thì chúng ta sẽ phải khắc phục những sự cố này, hãy kiểm tra từng lỗi một và đánh dấu vào file microsoft excel để tiện cho việc kiểm tra, giám sát.

Các cách dưới đây không chỉ giúp khắc phục Google không lập chỉ mục mà cũng khắc phục luôn lỗi index của các bộ máy tím kiếm khác như Cốc Cốc, Bing…

Gỡ chặn không cho bot truy cập

Để các con bot của các bộ máy tìm kiếm đọc được bất cứ trang nào trang web của bạn thì bạn phải cho phép nó.


Không cho index bằng thẻ tag

<meta name="robots" content="noindex, nofollow" />

Đây là trường hợp hay gặp khi làm web mới. Khi cài web bằng core wp lúc thiết lập nó sẽ hỏi các bạn: Có cho phép các công cụ tìm kiếm lập chỉ mục trang web này hay không?

Nếu các bạn đánh dấu tích vào Search engine visibility thì nó sẽ tự động thêm thẻ robots: noindex và nofollow như code trên vào sau thẻ <head>.

Cách khắc phục: Truy cập Settings ===>>> Reading ===>>> bỏ dấu tích phần Discourage search engines from indexing this site đi là xong.

Nếu bạn đã tắt rồi mà vẫn còn thẻ robots noindex thì hãy kiểm tra lại phần cài đặt của plugins SEO.

Cách kiểm tra xem còn thẻ tag đáng ghét này hay không: Bấm tổ hợp phím CTRL + U để xem mã nguồn ===>>> Bấm tìm kiếm CTRL + F ===>>> nhập dòng chữ noindex vào. Nếu không có thì bạn đã làm đúng.


Không cho index bằng robots.txt

Nếu bạn dùng mã nguồn wordpress thì mình nghĩ sẽ không rơi vào trường hợp này được đâu, vì file robots.txt mặc định của wordpress rất chuẩn rồi.

Những cứ kiểm tra lại cho chắc: gõ https://tenmiencuaban.com/robots.txt vào trình duyệt để xem file.

Khắc phục: Nếu bạn gặp trường hợp file như bên dưới thì hãy xóa dòng Disallow: / đi là xong.

Ví dụ về các file bị chặn website không index.

User-agent: * 
Disallow: /
User-agent: Googlebot
Disallow: /
  • Thấy code Disallow thì đó chính là lệnh chặn.
  • Disallow: / là code chặn toàn bộ site.

Bạn có thể xem tài liệu chính thức về Disallow của google để hiểu hơn.

Gỡ chặn index bằng robots.txt

Cách kiểm tra xem đã gỡ chặn robots.txt chưa: Truy cập https://www.google.com/webmasters/tools/robots-testing-tool?siteUrl chọn trang web bạn muốn test các link nghi ngờ bị chặn vào và nhấn nuits KIỂM TRA.


Sữa lỗi giao diện và khắc phục tốc độ tải trang

Do bị lỗi giao diện

Đây là cái mà chúng ra khó có thể nhìn ra nhất, tuy nhiên con bot của google lại tìm ra rất nhanh các lỗi này. Mình cũng chẳng hiểu vì sao nó thông minh như thế?

Lỗi vỡ hoặc các phần nội dung chồng chéo lên nhau mà mình muốn nói ở đây không phải là giao diện trên máy tính để bàn, laptop mà là giao diện web trên điện thoại.

Lỗi này có thể sẽ khiến con BOT google không index bài viết mới nhất nên các bạn để ý.

Chắc có lẽ đọc đến đây bạn sẽ thắc mắc: WTF, giao diện mobile liên quan gì đến index nhỉ?

Nhưng sự thực như vậy đó, hiện tại google đang ưu tiên index url trên mobile trước desktop. Chính vì thế mà giao diện web bạn trên mobile bị lỗi là nó sẽ không index url đâu.

Khắc phục: Kiểm tra lại giao diện mobile và sửa lại cho chuẩn. Lưu ý xung đột plugins cũng gây ra lỗi vỡ giao diện.

Cách kiểm tra xem: Cái này khá khoai, mình hay dùng để xem ảnh chụp màn hình của web xem có vỡ hay không.


Sửa lỗi google không index website
Google không lập chỉ mục trang web của bạn?

Tốc độ trang quá chậm

Cái này thì khá dễ nhận biết. Bạn có thể dùng pagespeed google, gtmetrix, test my website think with google, dùng trình duyệt…

Không index được bài viết, url nào đó do tốc độ trang web khá ít gặp, trừ khi trang web của bạn xoay vòng hơn 1 phút.

Còn cách tăng tốc đọ trang web thì rất dài dòng và lằng nhằng, đơn giản nhất là bạn hãy dùng host tốt như Azdigi hay Tinohost. Sau đó sử dụng các theme nhẹ nhàng, đơn giản là sẽ có tốc độ tốt ngay.

Còn nếu trang web của bạn cần những chức năng phức tạp thì nên thuê dev để họ code đúng đủ và nhanh.

Xem thêm: Bật mí mẹo tối ưu hình ảnh wordpress ( giảm kích thước, tốc độ load nhanh)


Gỡ bỏ vi phạm luật sử dụng dữ liệu có cấu trúc – Schema Google

Do khai báo sai, bị lỗi, trùng lặp Schema

Google không index bài viết vì vi phạm về sử dụng dữ liệu có cấu trúc – Schema Google cũng rất hay gặp phải, nhất là với những SEOER lạm dụng thái quá.

Đầu tiên kiểm tra lại xem giao diện bạn có những Schema nào, các plugin có cái nào tạo Schema hay không. Thống kê các Schema này ra xem có sự trùng lặp, hoặc plugin bị lỗi nên khai báo thiếu các trường, nó có tạo ra nhiều Schema giống hệt nhau hay không.
Trang web dùng để kiếm tra: https://search.google.com/structured-data/testing-tool/?hl=vi
Hoặc https://search.google.com/test/rich-results

Ví dụ: Trên một trang web ABCXYZ, giao diện đã được dev khai báo Microdata HTML BlogPosting rồi. Nhưng do chủ trang web không biết nên thêm một plugin tạo BlogPosting bằng JSON-LD script nữa. Điều này sẽ gây ra sự trùng lặp BlogPosting.

Khắc phục: Nếu không quá am hiểu về các loại schema thì không nền dùng. Hãy loại bỏ lỗi trùng lặp và khai báo chính xác. Không dùng lạm dụng schema với mục đích leo rank từ khóa.

Vậy làm thế nào để phát hiện google không index bài viết hay trang chủ…

Hiện tại thì minh chỉ biết hai cách để xác định google không index bài viết/trang chủ hay bất cứ trang nào khác trên web:

Cách 1: Tìm kiếm url trên bộ máy tìm kiếm

Bạn đặt url của bạn vào dấu ngoặc kép rồi dán vào thanh tìm kiếm.

"https://vnexpress.net/10-hoa-khoi-du-lich-viet-tham-gia-phu-xanh-dat-trong-4217222.html"

Cách 2: Phát hiện không index được bài viết bằng cách tìm nạp trong search console

Khi bạn gửi URL để google lập chỉ mục nhưng không thấy hiển thị sau nhiều ngày. Search-console cũng thông báo lí do vì sao URL không được lập chỉ mục nên các bạn để ý nhé.

Phát hiện không index được bài viết bằng cách

Sau khi các bạn sửa xong lỗi google không index website thì tiến hành gửi lại URL để google xem xét.

Tìm hiểu thêm về SEO.

3.4/5 - (5 bình chọn)

DMCA.com Protection Status