xml sitemap là gì

XML sitemap là gì?

XML Sitemap là một tài liệu đặc biệt quan trọng và khi bạn tạo dựng website thì việc tạo XML Sitemap là điều bắt buộc. Một XML Sitemap tốt hoạt động như một lộ trình trang web của bạn dẫn Google đến tất cả các trang quan trọng của bạn.

Vậy theo bạn XML Sitemap là gì?

Một trong những mục tiêu của bạn là cung cấp cho Google các tín hiệu phù hợp để nó có thể lập chỉ mục trang web của bạn tốt hơn. XML Sitemap là một trong những tín hiệu có thể dẫn đến việc lập chỉ mục nhanh hơn và xếp hạng cao hơn.

XML sitemap là gì?

XML Sitemap là một tệp liệt kê tất cả các trang quan trọng trên trang web của bạn mà trình thu thập thông tin của công cụ tìm kiếm nên biết. Khi đó, các công cụ tìm kiếm sẽ dễ dàng biết được nội dung nào có sẵn và hiểu được cấu trúc webasite của bạn.

Bạn có nhiều trang quan trọng nhưng ít liên kết nội bộ trỏ tới và khi đó các công cụ tìm kiếm sẽ khó phát hiện được nội dung của bạn. Tuy nhiên với XML Sitemap trình thu thập thông tin sẽ được tăng tốc để khám phá nội dung bị bỏ sót đó.

so do trang web XML

Ngay cả khi bạn không có sitemap, các công cụ tìm kiếm vẫn có thể lập chỉ mục các trang nội dung của bạn. Nhưng đợi điều đó xảy ra thì quá lâu, thật sự là như vậy tôi đã đợi cả tháng để Google lập chỉ mục các trang đầu tiên (không gửi sitemap, không share, không liên kết).

Khi bạn có một XML Sitemap và gửi nó lên công cụ tìm kiếm, tốc độ khám phá nội dung của bot sẽ tăng lên rất nhiều, các trang nội dung của bạn sẽ dễ dàng được index hơn.

Sơ đồ trang web XML rất hữu ích cho các công cụ tìm kiếm, vì nó cung cấp cho chúng một cái nhìn tổng quan về tất cả nội dung có sẵn cùng một lúc. Hãy theo dõi những nội dung tiếp theo để hiểu hơn về XML Sitemap!

Tầm quan trọng của XML Sitemap?

Sơ đồ trang web XML giúp các công cụ tìm kiếm đánh giá nội dung trang web của bạn và thông báo cho chúng về nội dung mới hoặc cập nhật.

Việc tối ưu intetnal link không phải website nào cũng làm tốt. Với XML Sitemap, các trình thu thập thông tin có thể dễ dàng phát hiện các nội dung quan trọng trên website, bù đắp về mặt thiếu sót trong việc bố trí intetnal link.

Nếu bạn đang tạo dựng một website mới, nội dung bạn có được là rất ít, các backlink trỏ đến dường như không có, tín liên quan không cao và lẽ dĩ nhiên độ tin tưởng của Google đễn website của bạn là rất thấp. Những điều này sẽ hạn chế việc thu thập thông tin của các công cụ tìm kiếm đối với website của bạn.

Nếu không có một XML Sitemap và không gửi lên công cụ tìm kiếm, đến ngày tháng nào nội dung của bạn mới được index và xếp hạng.

Sơ đồ trang web XML trông như thế nào?

Trước tiên bạn cần biết một đường dẫn Sitemap nó như thế nào:

https://serpseoaz.com/sitemap_index.xml

hoặc

https://serpseoaz.com/sitemap.xml

XML Sitemap chỉ dùng cho các công cụ tìm kiếm đọc và chúng được định dạng dưới dạng ngôn ngữ mà máy tính dễ hiệu nhất, phải rồi chính là ngôn ngữ XML. Dưới đây là một ví dụ về XML Sitemap của website SerpSeoAZ của tôi:

Ví dụ về XML Sitemap

Chúng ta sẽ bóc tách từng phần của XML Sitemap:

<?xml version="1.0" encoding="UTF-8"?> Khai báo XML biểu thị rằng nội dung được cấu trúc theo phiên bản 1.0 và mã hóa UTF-8 của tiêu chuẩn XML

<urlset xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance” …..</urlset> : phần này đóng gói tất cả các URL có trong sơ đồ trang web và mô tả phiên bản nào của tiêu chuẩn XML Sitemap được sử dụng. Nội dung nằm trong cặp thẻ <urlset</urlset>

<url>
	<loc>https://serpseoaz.com/blog/</loc>
	<lastmod>2021-08-20T23:07:36+07:00</lastmod>
</url>

Phần này biểu thị định nghĩa URL riêng lẻ trên trang của bạn thông qua cặp thẻ <url> </url>

  • <lastmod> hiểu thị ngày nội dung dược sửa đổi lần cuối
  • <loc> biểu thị ví trí của URL
  • <priority> biểu thị mức độ ưu tiên của URL
  • <changefreq>: tần suất nội dung trên URL dự kiến ​​sẽ thay đổi.

Có bất kỳ hạn chế nào đối với Sơ đồ trang web XML không?

XML Sitemap có một số hạn chế cần lưu ý:

  • Không được chứa nhiều hơn 50.000 URL tối đa.
  • Kích thước tệp của chúng được giới hạn ở 50MB khi giải nén.

Nếu Sơ đồ trang web XML của bạn vượt quá các giới hạn này, bạn cần phải tách chúng thành nhiều Sơ đồ trang web XML và sử dụng Chỉ mục Sơ đồ trang web XML.

Các phương pháp hay nhất cho Sơ đồ trang web XML

Những gì bạn nên làm với XML Sitemap để website của bạn đạt hiệu quả SEO tối đa?

Sau đây là một vài điều cần thiết bạn phải tuân theo:

Giữ cho Sơ đồ trang web XML của bạn luôn được cập nhật

Đảm bảo rằng Sơ đồ trang web XML của bạn bao gồm trường “lastmost” một giá trị cung cấp thông tin cho Google về thời điểm một trang được sửa đổi lần cuối.

Mỗi khi bạn có bất kỳ thay đổi nào trong trang nội dung, sitemap sẽ luôn được cập nhật. Và điều này sẽ vô cùng có lợi mỗi khi Google lập chỉ mục lại trang nội dung của bạn. Ngoài ra, bất cứ khi nào một trang bị xóa, nó cũng sẽ bị xóa khỏi Sơ đồ trang web XML của bạn

Chỉ thêm các trang có thể lập chỉ mục vào XML Sitemap của bạn

Các trang mà google không thể truy cập nội dung là các trang đã bị chuyển hướng 301, trang 404, các trang đang bị tệp Robot.txt chặn. Những kiểu trang như thế này không nên đưa chúng vào XML Sitemap và nếu như đã xuất hiện thì bạn nên loại bỏ chúng khỏi càng sớm càng tốt.

Tuân thủ các giới hạn đối với Sơ đồ trang web XML

Đảm bảo rằng Sơ đồ trang web XML của bạn không chứa nhiều hơn 50.000 URL và kích thước tệp không nén được giới hạn ở 50MB. Khi website của bạn đã quá giới hạn này, bạn cần tách XML Sitemap ra thành các tệp nhỏ hơn

Tạo Sitemap riêng cho hình ảnh và video

Nhiều hình ảnh, video được tải chậm theo những cách mà công cụ tìm kiếm không thể nhìn thấy. Với sự thay đổi bố cục tích lũy (CLS) và các chỉ số tốc độ khác ngày càng trở nên quan trọng, bạn cần phải giảm tải hình ảnh.

Việc tạo sitemap hình ảnh có thể đưa hình ảnh của bạn được lập chỉ mục và đưa vào kết quả tìm kiếm.

Tất cả những vấn đề này đã được tôi làm rõ trọng bài viết “20 cách tối ưu hóa hình ảnh chuẩn SEO“, tham khảo nó và bạn sẽ hiểu rõ hơn gì gì tôi đã đề cập trong phần này.

Tạo XML Sitemap trong WordPress

Hãy nhớ rằng, nền tảng WordPress sẽ không hỗ trợ bạn tạo XML Sitemap đâu nhé!

Bạn cần sử dụng một Plugin để tại XML Sitemap. Vâng một Plugin hỗ trợ SEO, Rank Math là một plugin tuyệt vời, đây cũng là các mà tôi sẽ tạo XML Sitemap

Bạn đã cài đặt Rankmath chưa? Đây là một plugin hỗ trợ SEO rất tốt và tất nhiên cũng hỗ trợ tạo XML Sitemap.

Di chuyển tới “cài mới Plugin > Rank Math SEO“, bạn hãy cài đặt và kích hoạt plugin này nhé.

Cai dat Rankmath SEO

Một giao diện hỗ trợ cài đặt sẽ hiện ra và cứ làm theo hướng dẫn. Tới phần Sitemap thì chỉ cần lựa chọn những phần mà bạn muốn đưa vào Sitemap XML, vậy thôi:

Cai-dat-XML-Sitemap-trong-Rankmath

Sau đó Sitemap của bạn sẽ trông như thế này:

XML Sitemap khi sử dụng rankmath

Cách gửi Sơ đồ trang đến Google

Tạo XML Sitemap là chưa xong việc đâu nhé mọi người! Chúng ta cần gửi nó cho các công cụ tìm kiếm và đặc biệt là Google

Sẽ có 2 cách gửi sơ đồ Website tới Google, hãy cùng tôi theo dõi!

Gửi Sơ đồ trang web bằng Google Search Console

Bước 1: Đảm bảo XML Sitemap của bạn nằm trong thư mục gốc của trang web và có thể truy cập công khai.

Có nghĩa là khi tôi nhập cấu trúc URL của Sitemap

https://serpseoaz.com/sitemap_index.xml

hoặc

https://serpseoaz.com/sitemap.xml

thì phải xuất hiện như thế này:

Cấu trúc XML Sitemap của SerpseoAZ

Bước 2: Đăng ký trang web của bạn với Google Search Console

Nếu bạn chưa đăng ký Google Search Console và chưa biết sử dụng nó thì bạn có thể tham khảo bài viết rất chi tiết của tôi “Cách sử dụng Google Search Console“. Từ cách cài đặt, các sử dụng tối ưu SEO, cách sử lỗi lập chỉ mục, … đủ để bạn thành thạo với Google Search Console.

Bước 3: Gửi Sơ đồ trang web của bạn

Trong bảng điều khiển Google Search Console, di chuyển tới “chỉ mục > Sơ đồ website“, các bạn copy “link Sitemap” và dán vào “Thêm sơ đồ trang web mới

dán đường dẫn sitelmap vào Google search Console

Đó là tất cả những gì bạn phải làm để cho Google biết về sơ đồ trang web của bạn. Google sẽ theo dõi tệp sơ đồ trang web để biết các thay đổi và thêm các trang mới vào chỉ mục của chúng.

Gửi sơ đồ trang web bằng tệp robots.txt

Tệp robots.txt là một tệp văn bản nằm trong thư mục gốc của trang web thông báo cho trình thu thập thông tin của công cụ tìm kiếm không thu thập dữ liệu các trang hoặc phần nhất định của trang web. Một trong những yếu tố bạn có thể thêm vào File Robot.txt của mình là ‘Sitemap‘.

Chỉ cần thêm Sitemap: https://example.com/sitemap.xml ngay dưới tệp Robot.txt là được. Và làm sao để tạo và sửa tệp Robot.txt thì tôi đã đề cập trong một bài viết khác của tôi “File Robot TXT là gì? Hướng dẫn hoàn chỉnh từ A đến Z“.

Khi các công cụ tìm kiếm đọc robots.txt của bạn, chúng cũng sẽ thu thập thông tin và lập chỉ mục sơ đồ trang web của bạn.

User-agent: *
Allow: /
Sitemap: https://serpseoaz.com/sitemap.xml

Suy nghĩ cuối cùng về XML Sitemap

Qua bài viết bạn có thể hiểu XML Sitemap là gì và tầm quan trọng của nó như thế nào rồi chứ?

Sơ đồ trang web XML giúp các công cụ tìm kiếm đánh giá nội dung trang web của bạn và thông báo cho chúng về nội dung mới hoặc cập nhật. Có một sơ đồ trang XML hợp lệ mà các công cụ tìm kiếm có thể đọc được là điều quan trọng đối với SEO.

Với nền tảng WordPress, việc tạo XML Sitemap không khó. ĐIều quan trọng đó là bạn phải tuân thủ một vài điều kiến để Sitemap tốt nhất cho SEO

  • Giữ cho Sơ đồ trang web XML của bạn luôn được cập nhật
  • Chỉ thêm các trang có thể lập chỉ mục vào XML Sitemap của bạn
  • Tuân thủ các giới hạn đối với Sơ đồ trang web XML
  • Tạo Sitemap riêng cho hình ảnh và video
  • Xóa các trang nội dung mỏng, nội dung trùng lặp khỏi sitemap

Vậy đây, đó là những gì về XML Sitemap! Hãy cho tôi một bình luận bên dưới nhé!

2 thoughts on “XML sitemap là gì?”

  1. Chào bạn , cảm ơn bạn về bài viết rất bổ ích . Cho mình hỏi với những sản phẩm hay trang mình đã 301 hoặc noindex thì mình làm làm thế nào để loại bỏ ạ . Vì mình thấy trong sitemap theo danh mục như vậy bot sẽ quét hết cả những sản phẩm hay trang mà mình 301 hoặc noindex ròi . Rất mong nhận được hỗ trợ từ bạn , cảm ơn bạn

    1. 1. Bạn vào quản trị website xóa bài viết đó đi. Sau đó gửi lại Site Map cho google Search console nhé!
      2. Nếu Google chưa index sitemap kịp thì dùng tính năng Xóa URL trong Google Search console xóa tạm thời đi.
      Trước đó bạn hãy đánh giá trang xem còn hữu dụng không nhé! Nếu trang được nhiều link trỏ tới hay có từ khóa đang xếp hạng thì bạn nên 301 tới trang liên quan trước khi xóa nhé!
      Cảm ơn bạn đã đọc bài!

Leave a Comment

Email của bạn sẽ không được hiển thị công khai.