Nguyên Nhân Website Không Được Tìm Thấy Trên Google
Thịnh Văn Hạnh 13/03/2023 1333 Lượt xem Chia sẻ bài viết
Để Website của bạn có thể xuất hiện trên Google, trang Web của bạn phải được lập chỉ mục bởi Google (hay còn gọi là Google Index). Nếu không, nó sẽ không xuất hiện trên kết quả tìm kiếm của thanh công cụ, gây thiệt hại đáng kể cho lượng truy cập. Điều này sẽ ảnh hưởng đến hiệu quả kinh doanh của bạn, dù cho Website của bạn có được đầu tư về nội dung và hình thức từ trước.
Để giải quyết vấn đề này, bạn cần phải xác định nguyên nhân không lập chỉ mục được Website. Dưới đây là một số nguyên nhân chính bạn có thể tham khảo. Hãy cùng BKNS tìm hiểu cách khắc phục vấn đề này để Website của bạn có thể xuất hiện trên Google dưới đây.
Tóm Tắt Bài Viết
- 1 Tên miền được lập chỉ mục là www hoặc non www
- 2 Google chưa tìm thấy Website của bạn
- 3 Trang web hoặc (các) trang bị chặn với robot.txt
- 4 Không có sitemap.xml
- 5 Lỗi thu thập dữ liệu
- 6 Nội dung trùng lặp
- 7 Bật tương tác với các công cụ tìm kiếm
- 8 Trang web bị chặn bởi .htaccess
- 9 Trang web có trong thẻ Meta NOINDEX
- 10 Vấn đề AJAX / JavaScript
- 11 Thời gian tải trang quá lâu
- 12 Hosting Down Times
- 13 Website đã bị Google loại bỏ
- 14 Website chưa được SEO
- 15 Loại ngôn ngữ lập trình sử dụng thiết kế website
- 16 Sử dụng các kỹ thuật để spam
- 17 Cấu trúc trang lộn xộn
- 18 Nhồi nhét quá nhiều từ khóa
- 19 Website vi phạm chính sách của Google
- 20 Có sự bất thường về liên kết (internal link và backlink) trên website
- 21 Kết luận
Tên miền được lập chỉ mục là www hoặc non www
Về mặt kỹ thuật thì tên miền www là một tên miền phụ. Ví dụ, Google xem http://example.com và http://www.example.com là khác nhau.
Hãy đảm bảo bạn đã thêm bản ghi đầy đủ, chính xác và đã redirect www về non www hoặc ngược lại. Đòng thời, bạn cũng cho Google biết tên miền nào là tên miền chính cho website của bạn.
Google chưa tìm thấy Website của bạn
Đây là vấn đề thường gặp nhất đối với các trang web mới. Bạn có thể sẽ phải chờ trong vài ngày, nhưng nếu Google vẫn chưa lập chỉ mục trang web của bạn, hãy đảm bảo sitemap của trang web được tải lên và chúng hoạt động đúng.
Sau khi thiết kế web xong, bạn cần tạo hoặc gửi sơ đồ trang web, nên làm điều này càng sớm càng tốt. Ngoài ra cũng nên yêu cầu Google thu thập dữ liệu và tìm nạp trang web thường xuyên.
Hướng dẫn submit sitemap lên Google:
- Truy cập Search Console
- Vào mục Sitemaps
- Gởi file sitemap của bạn lên vào ô sitemap rồi nhất Submit.
Xem hình hướng dẫn bên dưới.
Nếu Google không index hoặc index chậm, bạn cũng có thể sử dụng công cụ Kiểm tra URL để gửi các URL riêng lẻ đến chỉ mục của Google. Đối với số lượng URL lớn, bạn nên gửi sơ đồ trang web.
Cách submit URL Google:
-
- Kiểm tra URL bằng cách sử dụng công cụ Kiểm tra URL.
- Chọn Yêu cầu lập chỉ mục. Công cụ sẽ chạy quy trình kiểm tra trực tiếp trên URL để xem liệu URL này có bất kỳ vấn đề lập chỉ mục rõ ràng nào hay không. Nếu không có vấn đề nào, trang sẽ được đưa vào hàng đợi lập chỉ mục. Nếu trang phát hiện ra vấn đề, bạn phải cố gắng khắc phục các vấn đề đó.
Đây là bước quan trọng để đăng ký Website lên Google. Sau khi làm xong web, bạn cần thực hiện ngay để Google index được các nội dung trên Website của bạn.
Trang web hoặc (các) trang bị chặn với robot.txt
Một vấn đề khác là website của bạn đã chặn index bằng robot.txt. Điều này hoàn toàn được khắc phục dễ dàng. Chỉ cần xóa mục nhập khỏi tệp robots.txt và trang web của bạn sẽ xuất hiện lại trong chỉ mục.
Cấu trúc file robots chuẩn SEO
Không có sitemap.xml
Mỗi trang web nên tạo trang sitemap, đây là một bản đồ đơn giản để bot của Google đi theo và lập chỉ mục trang web của bạn. Bạn đọc thêm về chính sách sơ đồ của Google và tạo một cái dễ dàng cho trang web của mình.
Nếu còn gặp bất kì vấn đề nào trên sơ đồ trang web, nên đối chiếu lại và sửa đổi phù hợp.
Lỗi thu thập dữ liệu
Có những trang mà Google không thể lập chỉ mục do không thể thu thập dữ liệu. Tuy nhiên, bot có thể nhìn thấy những trang này mặc dù không lập chỉ mục chúng.
Để phát hiện các lỗi thu thập dữ liệu, bạn có thể truy cập Google Search Console, chọn trang web của bạn, nhấp vào Kiểm tra URL và yêu cầu lập chỉ mục. Hệ thống sẽ trả về thông báo nếu phát hiện bất kỳ lỗi nào.
Yêu cầu lập chỉ mục là một trong những cách miễn phí để đưa trang web của bạn lên Google.
Nội dung trùng lặp
Có quá nhiều nội dung trùng lặp trên trang web có thể gây nhầm lẫn cho các công cụ tìm kiếm, dẫn đến bỏ cuộc khi lập chỉ mục trang web của bạn. Nếu nhiều URL trên trang web của bạn cung cấp cùng nội dung, đó là vấn đề trùng lặp nội dung trên trang web của bạn.
Để khắc phục vấn đề này, hãy chọn trang bạn muốn giữ và sử dụng phương pháp 301 để chuyển hướng các trang khác đến trang giữ. Tuy nhiên, cần cẩn trọng khi chuẩn hóa trang web vì một số trang đã gặp vấn đề chuẩn hóa sai và dẫn đến bị chặn khi lập chỉ mục.
Bật tương tác với các công cụ tìm kiếm
Nếu có một trang web WordPress, bạn đã có thể vô tình click vào phần tương tác với công cụ tìm kiếm. Chuyển đến Quản trị viên → Cài đặt → Đọc để kiểm tra.
Trang web bị chặn bởi .htaccess
Tệp .htaccess của bạn là một phần của sự tồn tại của trang web của bạn trên máy chủ, cho phép tệp này có sẵn trên web trên toàn thế giới. Tệp .htaccess được viết bằng ngôn ngữ Apache. Mặc dù .htacess rất tiện dụng và hữu ích, nhưng nó có thể sử dụng để chặn các trình thu thập thông tin và ngăn chặn việc lập chỉ mục.
Trang web có trong thẻ Meta NOINDEX
Một cách để chặn con bot có thể truy cập vào website là có các thẻ meta noindex. Nó thường trông như:
<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>
Xóa dòng mã này và bạn sẽ được bot quay lại ngay lập tức.
Vấn đề AJAX / JavaScript
Google không index JavaScript và AJAX. Nhưng những ngôn ngữ này không dễ lập chỉ mục như HTML. Vì vậy, nếu bạn định cấu hình không chính xác các trang AJAX và thực thi JavaScript, Google sẽ không lập chỉ mục trang.
Thời gian tải trang quá lâu
Google không thích nó nếu trang web của bạn mất thời gian tải quá quá lâu. Nếu trình thu thập thông tin gặp thời gian tải tối đa, có thể nó sẽ không lập chỉ mục trang web.
Hosting Down Times
Nếu trình thu thập thông tin không thể truy cập trang web của bạn, chỉ mục sẽ không được lập.
Khi vấn đề này xảy ra, hãy thử kiểm tra kết nối của bạn. Nếu máy chủ của bạn ngừng hoạt động thường xuyên, có thể trang web sẽ không được thu thập thông tin. Và đó là lúc bạn nên lựa chọn một nhà cung cấp hosting mới.
Website đã bị Google loại bỏ
Điều này thực sự là một điều không ai mong muốn với những ai quản lý hệ thống website.
Bạn nên kiểm tra các hoạt động của trang web mình đang quản lý, phát hiện nguyên nhân và đưa nó về trạng thái hoạt động bình thường trở lại.
Website chưa được SEO
Một nguyên nhân quan trọng nữa làm Website không được tìm thấy trên Google là trang web của bạn chưa được SEO.
SEO được hiểu là quá trình tối ưu hóa từ khóa trên thanh công cụ tìm kiếm. Trước khi đưa nó lên Google, bạn nên thực hiện các bước SEO cho web để nó có thể xuất hiện ở vị trí dễ nhìn trên thanh kết quả tìm kiếm.
Loại ngôn ngữ lập trình sử dụng thiết kế website
Hiện nay để thiết kế website có rất nhiều loại ngôn ngữ lập trình khác nhau như: AJAX, Javascript và HTML. Tuy nhiên không phải ngôn ngữ nào cũng tiện lợi cho việc SEO web, cụ thể ở đây chính là việc hỗ trợ cho quá trình Google index.
Để được index nhanh hơn cũng như hạn chế việc bị từ chối index, chúng ta cần sử dụng loại ngôn ngữ lập trình phù hợp khi thiết kế website. Với HTML sẽ là ngôn ngữ lập trình được Google index nhanh nhất, còn 2 ngôn ngữ còn lại sẽ có thời gian index lâu hơn.
Do đó, nếu website gặp tình trạng từ chối index không phải do các nguyên nhân kể trên thì có thể kiểm tra nó được thiết kế bằng ngôn ngữ AJAX hoặc Javascript hay không?
Nếu có nên tạm dừng quá trình index, xem xét chuyển đổi ngôn ngữ lập trình cho website hoặc tối ưu lại cấu trúc trang phù hợp hơn.
Sử dụng các kỹ thuật để spam
Việc không có đội ngũ nhân sự hoặc muốn sử dụng thủ thuật để tiết kiệm thời gian làm SEO mà có những SEOer sử dụng các công cụ để can thiệp kỹ thuật vào quá trình làm SEO với các hành động như:
- Công cụ tạo nội dung tự động bằng cách thu thập nội dung các bài đăng trên internet.
- Xây dựng liên kết không chất lượng
- Chuyển hướng không minh bạch
- Ẩn liên kết
- Sao chép nội dung từ các bên khác
- Spam liên kết quá nhiều
- Tạo ra các website vệ tinh vi phạm chính sách Google,…
Tất cả các điều trên đều bị Google đánh giá là spam, chất lượng không đạt, không đem lại thông tin giá trị cho người dùng, do đó khả năng cao là các bài viết liên quan sẽ không được index.
Cấu trúc trang lộn xộn
Cấu trúc nội dung trên website ảnh hưởng đến việc đọc hiểu của Google trong quá trình thu thập dữ liệu.
Với một website có cấu trúc trang lộn xộn, khó hiểu thì khả năng rất cao là sẽ không được Google index trong quá trình tìm kiếm các truy vấn của người dùng.
Ngoài ra, nếu như cấu trúc nội dung trên trang bị sai hoặc gây hiểu lầm còn có thể sẽ bị Google phạt. Do đó cần lưu ý tối ưu cấu trúc trang chuẩn SEO để tạo điều kiện được lập chỉ mục một cách thuận lợi.
Nhồi nhét quá nhiều từ khóa
Đây là sai lầm phổ biến với cách tư duy cũ khi làm SEO. Nhiều người cho rằng cứ bỏ vào trong bài viết càng nhiều từ khóa thì khả năng lên TOP lại càng cao.
Tuy nhiên Google đánh giá cao sự tự nhiên và chất lượng cao trong nội dung bài viết thay vì việc nhồi nhét từ khóa.
Do đó với các trang tập trung nhồi nhét từ khóa quá mức sẽ bị Google đánh giá thấp, cho rằng nội dung không có giá trị thì khả năng cao cũng sẽ không được index.
Bạn nên tối ưu nội dung bài viết chuẩn SEO bằng cách đầu tư thời gian công sức thay vì sử dụng các kỹ thuật nhồi nhét từ khóa nếu muốn được Google index nhanh.
Website vi phạm chính sách của Google
Trong tất cả các nguyên nhân thì đây có lẽ là nguyên nhân nặng nhất làm mất Google index.
Các website có nội dung gây hiểu lầm, lừa đảo, liên quan đến các vấn đề như: tài chính, sức khỏe, phân biệt giới tính, phân biệt chủng tộc, cơ thể người, hàng cấm, chất gây nghiện, quảng cáo sai sự thật,… Hay website có chứa các mã độc, bảo mật thấp,… đều được xếp vào diện có khả năng cao vi phạm các chính sách bảo vệ người dùng của Google.
Trong trường hợp này khả năng bị Google bỏ qua index các trang trên website là rất cao.
Do đó hãy tập trung xây dựng nội dung phù hợp với khách hàng mục tiêu để hạn chế tối đa các trường hợp vi phạm chính sách của Google hay bị Google phạt.
Có sự bất thường về liên kết (internal link và backlink) trên website
Việc xây dựng liên kết trên website cùng với nội dung là một trong những tiêu chí quan trọng để Google đánh giá chất lượng website theo chuẩn SEO. Các liên kết trên trang và liên kết trở về từ bên ngoài nếu không đạt chất lượng tốt hoặc có sự bất thường, đặc biệt là khi mua bán qua trung gian, đặt trong khu vực chữ ký trên diễn đàn, spam trong phần nhận xét của người dùng hoặc không liên quan về mặt nội dung và chất lượng, sẽ làm cho website bị mất index.
Thuật toán Google Penguin sẽ giúp xử lý các vấn đề xoay quanh xây dựng liên kết trên trang. Để tránh từ chối index, ta cần lưu ý các hành động trên. SEO website không chỉ giúp tối ưu hóa thân thiện với bộ máy tìm kiếm, mà còn giúp nâng cao chất lượng nội dung trong mắt người dùng. Mục tiêu của SEO là gia tăng số lượng và chất lượng lưu lượng truy cập của người dùng tiềm năng vào website.
Kết luận
Trên đây là toàn bộ những nguyên nhân khiến website không được tìm thấy trên Google. Để website được hoạt động bình thường, bạn nên phát hiện và tránh các nguyên nhân kể trên.