in

Sitemap: những điều bạn cần biết về sơ đồ trang web

Sitemap (Sơ đồ trang web) là gì?

Một sitemap về cơ bản là một tập tin (thông thường dưới dạng XML) mà bạn cung cấp thông tin về các trang, video, và các tập tin khác trên trang web của bạn, cũng như mối quan hệ giữa chúng. Từ đó, các công cụ tìm kiếm như Google sẽ đọc tập tin này để thu thập dữ liệu trang web của bạn một cách chính xác hơn.

Sơ đồ trang web cho Google biết những trang và tập tin nào bạn cho là quan trọng trong trang web của mình, đồng thời cung cấp thông tin có giá trị về các liên kết này: ví dụ: đối với các trang, thời điểm trang được cập nhật lần cuối, tần suất thay đổi trang,…

Cấu trúc một trang web

Bạn có thể sử dụng sơ đồ trang web để cung cấp thông tin về các loại nội dung cụ thể trên các trang của mình, bao gồm cả nội dung video và hình ảnh . Ví dụ:

  • video entry trong sơ đồ trang web có thể chỉ định thời gian chạy video, danh mục và xếp hạng độ phù hợp với lứa tuổi.
  • image entry trong sơ đồ trang web có thể bao gồm chủ đề hình ảnh, loại và giấy phép.

Bạn có cần tạo sơ đồ trang web cho trang của mình không?

Nếu các trang trên trang web của bạn được liên kết đúng cách, Google thường có thể quét hầu hết trang web của bạn. Mặc dù vậy, sơ đồ trang web có thể cải thiện việc thu thập thông tin của các trang web kha khá lớn bài viết hoặc có cấu trúc phức tạp, các tệp chuyên biệt.

Sử dụng sơ đồ trang web không đảm bảo rằng tất cả các mục trong sơ đồ trang web của bạn sẽ được thu thập thông tin và lập chỉ mục, vì các quy trình của Google dựa vào các thuật toán phức tạp để lập lịch thu thập thông tin. Tuy nhiên, trong hầu hết các trường hợp, trang web của bạn sẽ được hưởng lợi từ việc có sơ đồ trang web và bạn sẽ không bao giờ bị phạt nếu có sơ đồ trang web.

Khi nào bạn cần một sơ đồ trang web:

  • Trang web của bạn thực sự lớn. Do đó, nhiều khả năng trình thu thập dữ liệu web của Google có thể bỏ qua việc thu thập thông tin một số trang mới hoặc được cập nhật gần đây của bạn.
  • Trang web của bạn có một kho lưu trữ lớn các trang nội dung bị tách biệt hoặc không được liên kết tốt với nhau qua internal link. Nếu các trang trong trang web của bạn không tự nhiên tham chiếu lẫn nhau, bạn có thể liệt kê chúng trong sơ đồ trang web để đảm bảo rằng Google không bỏ qua một số trang của bạn.
  • Trang web của bạn là mới và có ít liên kết bên ngoài đến nó. Con bot của Google và các trình thu thập thông tin web khác thu thập dữ liệu web bằng cách đi theo các liên kết từ trang này sang trang khác. Do đó, Google có thể không phát hiện ra các trang của bạn nếu không có trang web nào khác liên kết đến chúng.
  • Trang web của bạn có nhiều nội dung đa phương tiện (video, hình ảnh) hoặc được hiển thị trên Google Tin tức. Google có thể tính đến thông tin bổ sung từ các sơ đồ trang web để tìm kiếm, nếu thích hợp.

Bạn có thể sẽ không cần sơ đồ trang web nếu:

  • Trang web của bạn khá “nhỏ”. Nhỏ ở đây là khoảng 500 trang hoặc ít hơn trên trang web của bạn. (Chỉ những trang mà bạn nghĩ cần có trong kết quả tìm kiếm mới được tính vào tổng số này.)
  • Bạn đang sử dụng một dịch vụ lưu trữ trang web đơn giản như Blogger hoặc Wix. Nếu trang web của bạn nằm trên một dịch vụ giúp bạn thiết lập trang web nhanh chóng với các trang và phần tử điều hướng được định dạng trước, dịch vụ của bạn có thể tự động tạo sơ đồ trang web cho bạn và bạn không cần phải làm gì cả.
  • Trang web của bạn được liên kết toàn diện. Điều này có nghĩa là Google có thể tìm thấy tất cả các trang quan trọng trên trang web của bạn bằng cách nhấp vào các liên kết bắt đầu từ trang chủ.
  • Bạn không có nhiều tệp phương tiện (video, hình ảnh) hoặc trang tin tức mà bạn cần xuất hiện trong chỉ mục. Sơ đồ trang web có thể giúp Google tìm và hiểu các tệp video và hình ảnh hoặc các bài báo trên trang web của bạn, nếu bạn muốn chúng xuất hiện trong kết quả của Google Tìm kiếm. Nếu bạn không cần những kết quả này xuất hiện trong kết quả Hình ảnh, Video hoặc Tin tức, bạn có thể không cần sơ đồ trang web.

Tạo sơ đồ trang web (sitemap) như thế nào?

Trong giới hạn của bài viết này, mình chủ yếu hướng dẫn bạn cách tạo sơ đồ trang web bằng các plugins trong WordPress (trong trường hợp bạn dùng WordPress là công cụ viết bài). Với các nền tảng CMS khác, bạn có thể tìm hiểu thêm tại địa chỉ Sitemap của Google để nắm cấu trúc của trang sitemap.

Nguyên tắc chung của file sitemap

  • Sử dụng các URL nhất quán, đủ điều kiện. Google sẽ thu thập dữ liệu các URL của bạn chính xác như được liệt kê.
  • Sơ đồ trang web có thể được đăng ở bất kỳ đâu trên trang web của bạn, nhưng sơ đồ trang web chỉ ảnh hưởng đến con cháu của thư mục mẹ. Do đó, một sơ đồ trang web được đăng tại thư mục gốc của trang web có thể ảnh hưởng đến tất cả các tệp trên trang web. Do đó bạn nên đặt file sitemap vào thư mục gốc.
  • Cho Google biết về các phiên bản ngôn ngữ thay thế của một URL bằng cách sử dụng chú thích hreflang.
  • Các tệp sơ đồ trang web phải được mã hóa UTF-8.
  • Chia sơ đồ trang web lớn thành các sơ đồ trang web nhỏ hơn: kích thước sơ đồ trang web tối đa là 50.000 URL/50MB không nén.
  • Chỉ liệt kê các URL chuẩn trong sơ đồ trang web của bạn. Nếu bạn có hai phiên bản của một trang, hãy chỉ liệt kê trang chuẩn (do Google chọn) trong sơ đồ trang web.
  • Nếu bạn có các URL khác nhau cho các phiên bản trên thiết bị di động và máy tính để bàn của một trang, chúng tôi khuyên bạn chỉ nên trỏ đến một phiên bản trong sơ đồ trang web.
  • Hãy nhớ rằng sơ đồ trang web là một đề xuất cho Google về những trang bạn cho là quan trọng; Google không cam kết thu thập dữ liệu mọi URL trong sơ đồ trang web.
  • Vị trí của URL trong sơ đồ trang web không quan trọng; Google không thu thập dữ liệu các URL theo thứ tự mà chúng xuất hiện trong sơ đồ trang web của bạn.

Tạo sơ đồ trang web Google Tin tức

Khi bạn tạo sơ đồ trang web Tin tức của mình, hãy làm theo các yêu cầu bên dưới:

  • Bao gồm URL cho các bài báo đã xuất bản trong 2 ngày qua. Bạn có thể xóa các bài viết sau 2 ngày khỏi sơ đồ trang web Tin tức, nhưng chúng vẫn ở trong chỉ mục trong khoảng thời gian 30 ngày thông thường.
  • Cập nhật sơ đồ trang web Tin tức của bạn với các bài viết mới khi chúng được xuất bản. Google Tin tức thu thập thông tin sơ đồ trang web Tin tức thường xuyên như thu thập thông tin phần còn lại của trang web của bạn.
  • Thêm tối đa 1.000 URL đầy đủ để bao gồm nhiều hơn, chia nhỏ các URL này thành nhiều sơ đồ trang web và sử dụng tệp chỉ mục sơ đồ trang web để quản lý chúng. Sử dụng định dạng XML được cung cấp trong giao thức sơ đồ trang web. Không liệt kê nhiều hơn 50.000 sơ đồ trang trong tệp sơ đồ trang web của bạn. Các giới hạn này giúp đảm bảo rằng máy chủ web của bạn không sử dụng các tệp lớn.
  • Cập nhật sơ đồ trang web hiện tại của bạn với các URL bài viết mới của bạn. Không tạo sơ đồ trang web mới với mỗi lần cập nhật.

Cách tạo sơ đồ trang web với Yoast SEO

Sitemap: những điều bạn cần biết về sơ đồ trang web 1

Trên đây là sơ đồ trang web dạng XML của Yoast.com, được tạo bởi plugin Yoast SEO. Nếu bạn dùng plugin này, Yoast.com XML sitemap sẽ hiển thị vài sitemap như: post-sitemap.xml, page-sitemap.xml, video-sitemap.xml,… Việc phân loại này làm cho cấu trúc của trang web càng rõ ràng càng tốt. Vì vậy, nếu bạn nhấp vào một trong các sơ đồ trang lập chỉ mục, bạn sẽ thấy tất cả các URL trong sơ đồ trang web cụ thể đó. Ví dụ: nếu bạn nhấp vào, post-sitemap.xml bạn sẽ thấy tất cả các URL bài đăng của Yoast.com (nhấp vào hình ảnh để phóng to).

Bạn sẽ thấy một ngày ở cuối mỗi dòng. Mục này cho Google biết khi nào mỗi bài đăng được cập nhật lần cuối và giúp ích cho SEO vì bạn muốn Google thu thập dữ liệu nội dung cập nhật của bạn càng sớm càng tốt. Khi thông tin ngày này thay đổi trong sơ đồ trang XML, Google biết rằng có nội dung mới để thu thập thông tin và lập chỉ mục.

sitemap được tạo bởi Yoast SEO

Nếu bạn có một trang web rất lớn, đôi khi cần phải tách một sơ đồ trang lập chỉ mục. Một sơ đồ trang XML duy nhất được giới hạn ở 50.000 URL, vì vậy, nếu trang web của bạn có hơn 50.000 bài đăng, chẳng hạn, bạn sẽ cần hai sơ đồ riêng biệt cho các URL bài đăng, thêm một cách hiệu quả sơ đồ trang chỉ mục thứ hai. Plugin Yoast SEO đặt giới hạn còn thấp hơn – ở 1.000 URL – để giữ cho sơ đồ trang web của bạn tải nhanh nhất có thể.

Yoast SEO tự động tạo sơ đồ trang XML cho trang web của bạn. Nhấp vào SEO > General > Features.

Trong màn hình này, bạn có thể bật hoặc tắt mục XML Sitemaps. Ngoài ra, bạn có thể nhấp vào dấu chấm hỏi để mở rộng thông tin và xem các thông tin khác.

Sitemap: những điều bạn cần biết về sơ đồ trang web 2

Bạn có thể loại trừ các loại nội dung khỏi sơ đồ trang XML của mình bằng cách vào Search Appearance > Content Types và tắt các mục không muốn tạo XML.

Sitemap: những điều bạn cần biết về sơ đồ trang web 3

Cách tạo sơ đồ trang web với Rank Math SEO

Hiện tại trang của mình đang tạo sitemap bằng Rank Math SEO. Bạn có thể vào tham khảo tại địa chỉ https://nhatphuc.com/sitemap_index.xml.

Sitemap: những điều bạn cần biết về sơ đồ trang web 4

Bạn có thể truy cập cài đặt Sơ đồ trang web trong Rank Math SEO bằng cách vào Rank Math > Sitemap Settings.

Cơ bản bạn hãy xem tuỳ chọn Sitemap xem đã bật chưa trong từng mục. Sau đó bấm Save Change để xác nhận.

Sitemap: những điều bạn cần biết về sơ đồ trang web 5

Do Rank Math SEO cung cấp rất nhiều tuỳ chọn để bạn cấu hình sitemap nên mình sẽ dành hẳn một bài về cách cấu hình sitemap trong Rank Math SEO trong bài viết tiếp theo.

Cách làm cho Google tìm thấy sơ đồ trang web của bạn

Đăng ký file sitemap lên Google Search Console

Nếu bạn muốn Google tìm thấy sơ đồ trang XML của mình nhanh hơn, bạn sẽ cần thêm nó vào tài khoản Google Search Console của mình.

Trong phần Sơ đồ trang web, bạn sẽ thấy liệu sơ đồ trang web XML của mình đã được thêm chưa. Nếu không, bạn có thể thêm sơ đồ trang web của mình ở đầu trang:

Sitemap: những điều bạn cần biết về sơ đồ trang web 6

Việc thêm sơ đồ trang XML giúp kiểm tra xem Google có lập chỉ mục tất cả các trang trong sơ đồ trang web của bạn hay không. Có thể xảy ra lỗi ngăn lập chỉ mục một số trang. Một tùy chọn khác là bạn có thể cần nhiều liên kết hơn trỏ đến nội dung chưa được lập chỉ mục.

Cách khác để đăng ký sơ đồ trang web

  • Chèn dòng sau vào bất kỳ đâu trong tập tin robots.txt của bạn, chỉ định đường dẫn đến sơ đồ trang web của bạn:

Sitemap: http://example.com/sitemap_location.xml

  • Sử dụng chức năng ping để yêu cầu Google thu thập thông tin sơ đồ trang web của bạn. Gửi một yêu cầu HTTP GET như sau: ví dụ:

http://www.google.com/ping?sitemap=<complete_url_of_sitemap>

http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

Sử dụng Báo cáo Sơ đồ trang web để phát hiện các lỗi

Khi Google đã thu thập thông tin sơ đồ trang web của bạn, hãy nhấp vào nó trong Các sơ đồ trang web đã gửi. Nếu bạn thấy mục Trạng tháiThành công nghĩa là Google đã thu thập thông tin sơ đồ trang web của bạn thành công.

Sitemap: những điều bạn cần biết về sơ đồ trang web 7

Bạn cũng có thể nhấp vào biểu tượng biểu đồ thanh nhỏ để chuyển đến Báo cáo mức độ phù hợp cho sơ đồ trang web của bạn: Báo cáo này cho bạn biết có bao nhiêu URL mà Google đã tìm thấy trong sơ đồ trang web của bạn… và có bao nhiêu trang trong số đó được đưa vào chỉ mục của Google:

Sitemap: những điều bạn cần biết về sơ đồ trang web 8

Làm gì khi bạn không dùng WordPress để có plugin tự tạo sitemap

Có thể bạn rơi vào trường hợp không dùng WordPress, và cũng không có khả năng để code một sitemap. Vậy làm thế nào? Giải pháp là bạn hãy dùng đến công cụ có tên Screaming Frog.

Sitemap: những điều bạn cần biết về sơ đồ trang web 9

Screaming Frog là phần mềm máy tính để bàn cung cấp nhiều công cụ SEO. Điểm hay là công cụ này có một trang miễn phí sử dụng tạo sơ đồ trang miễn là trang web có ít hơn 500 trang. Đối với những người có trang web lớn hơn, bạn sẽ cần nâng cấp phiên bản trả phí.

Slickplan cũng là một giải pháp thay thế. Bạn sẽ có cơ hội sử dụng một mẫu sơ đồ trang web, tương tự như những mẫu có thể tạo bằng plugin trên WordPress. Từ đây, bạn có thể kéo và thả các trang khác nhau vào mẫu để tổ chức cấu trúc trang web của mình. Sau khi hoàn thành và bạn hài lòng với giao diện của sơ đồ trang web trực quan, bạn có thể xuất nó dưới dạng tệp XML.

Slickplan là phần mềm trả phí nhưng bạn có thể dùng bản dùng thử miễn phí. Nó ít nhất đáng để thử.

Phần kết luận

Nếu bạn đã sẵn sàng đưa chiến lược SEO của mình lên cấp độ tiếp theo, bạn cần tạo sơ đồ trang cho trang web của mình. Như bạn có thể thấy từ hướng dẫn này, thật dễ dàng để tạo sơ đồ trang web của bạn nhất là khi bạn đang dùng WordPress. Những plugins như Yoast SEO, RankMath SEO đều tạo sitemap rất tốt. Trường hợp bạn không dùng WordPress, Screaming Frog và Slickplan đều là những lựa chọn tuyệt vời để bắt đầu.

Sitemap là một bước trong hơn 40 bước checklist SEO khi xây dựng trang web.

Written by Linh Nguyễn

0 0 votes
Article Rating
Subscribe
Notify of
guest

0 Comments
Inline Feedbacks
View all comments