Hướng dẫn audit phân trang bằng Screaming Frog chuẩn SEO

Nội dung

Audit phân trang (Pagination Audit) là một phần không thể thiếu của các website lớn, đặc biệt là trang thương mại điện tử, tin tức, hoặc blog. Tuy nhiên, nếu không được cấu hình đúng cách, nó có thể gây ra nhiều vấn đề SEO nghiêm trọng như lãng phí ngân sách crawl, trùng lặp nội dung và giảm khả năng hiển thị của các trang con. Bài viết này, SEO Lenart sẽ hướng dẫn bạn quy trình Pagination Audit toàn diện bằng công cụ Screaming Frog, giúp bạn chẩn đoán và khắc phục các lỗi kỹ thuật một cách hệ thống và hiệu quả.

Vì Sao Phải Audit Phân Trang Bằng Screaming Frog?

audit phân trang

Thực hiện audit thủ công là việc gần như bất khả thi với các website lớn. Screaming Frog là công cụ đắc lực giúp bạn tự động hóa quy trình này, mang lại những lợi ích rõ rệt:

  • Phát hiện URL phân trang bị chặn trong robots.txt: Nhanh chóng tìm ra các chỉ thị “Disallow” đang vô tình ngăn Googlebot tiếp cận nội dung ở các trang con.
  • Xác định canonical trỏ sai về trang 1: Đây là một lỗi phổ biến làm mất giá trị của các trang con. Công cụ giúp bạn xác định hàng loạt URL đang bị cấu hình sai thẻ canonical.
  • Phân tích liên kết nội bộ đứt gãy hoặc vòng lặp: Dễ dàng tìm thấy các liên kết “Next/Prev” bị hỏng hoặc các chuỗi phân trang không dẫn đến trang cuối, gây lãng phí ngân sách crawl.
  • Kiểm tra tình trạng indexability hàng loạt: Screaming Frog cho phép bạn xem trạng thái “index” hay “noindex” của hàng ngàn URL cùng lúc, giúp tiết kiệm thời gian và công sức.

Quy Trình Pagination Audit Chi Tiết Trên Screaming Frog

Thực hiện Pagination Audit không chỉ là rà lỗi kỹ thuật, mà là quy trình có hệ thống giúp đánh giá cách Googlebot thu thập, hiểu và xếp hạng các trang trong chuỗi phân trang. Dưới đây là checklist chi tiết từng bước mà đội ngũ SEO Lenart khuyến nghị khi tiến hành kiểm tra.

Bước 1: Lọc và Thu Thập Toàn Bộ URL Phân Trang

Đầu tiên, bạn cần thu thập tất cả các URL thuộc chuỗi phân trang.

  1. Sau khi crawl xong website, vào tab Internal → HTML.
  2. Sử dụng thanh tìm kiếm (Filter) ở góc trên bên phải, nhập vào một định dạng URL phân trang phổ biến của trang bạn như “page=” hoặc “/page/”.
  3. Sau khi lọc, chọn tất cả các URL và nhấn nút Export để xuất ra file CSV. File này sẽ là cơ sở để bạn phân tích sâu hơn hoặc lưu trữ để so sánh trong tương lai.

Bước 2: Kiểm Tra Trạng Thái Indexability

Đây là bước kiểm tra xem các trang phân trang có được phép lập chỉ mục hay không.

  1. Tại giao diện chính, chuyển sang tab Indexability.
  2. Nhìn vào cột “Indexability Status”. Đảm bảo các trang phân trang quan trọng không bị gắn mác “Non-Indexable”.
  3. Nếu một URL bị “Non-Indexable”, cột bên cạnh sẽ cho biết lý do: “Noindex”, “Blocked by robots.txt” hoặc “Canonicalised”. Dựa vào đây, bạn sẽ biết cần kiểm tra lại file robots.txt hay thẻ meta robots trong mã HTML của trang.

Bước 3: Phân Tích Canonical

kiếm tra ở tab canonical

Thẻ canonical là yếu tố quan trọng nhất trong việc xử lý phân trang.

  1. Chuyển sang tab Canonicals.
  2. Sử dụng bộ lọc để chỉ hiển thị các URL phân trang. Hãy tìm những URL có thẻ canonical trỏ về trang 1 của chuỗi. Đây là một lỗi sai nghiêm trọng.
  3. Nguyên tắc đúng: Mỗi trang phân trang (page 2, page 3,…) phải có thẻ canonical trỏ về chính nó (self-referencing canonical).
  4. Bạn có thể vào menu Reports → Canonicals → Canonical Errors để xuất báo cáo các URL bị lỗi và gửi cho đội ngũ phát triển web xử lý.

Bước 4: Kiểm Tra Cấu Trúc Liên Kết Nội Bộ (Internal Link)

kiểm tra trong tab inlink

Cấu trúc liên kết quyết định khả năng được tìm thấy của các trang con.

  1. Trong tab Internal, chọn một URL phân trang bạn muốn kiểm tra.
  2. Ở khung cửa sổ dưới, chọn tab Inlinks. Tại đây, bạn sẽ thấy tất cả các URL đang trỏ đến trang bạn đã chọn.
  3. Kiểm tra cột “From” và “Anchor Text” để phát hiện các vấn đề như:
    • Liên kết từ các trang “Next/Prev” bị hỏng (lỗi 404).
    • Anchor text không rõ ràng (ví dụ: “click vào đây” thay vì “Trang 2”).
  4. Để có cái nhìn tổng quan, bạn có thể sử dụng tính năng Visualisations → Crawl Tree Graph. Biểu đồ này giúp bạn hình dung luồng sức mạnh (PageRank) có được truyền sâu đến các trang con hay không.

Bước 5: Kiểm Tra Thẻ rel=”next” / “prev” (Nếu Có)

Mặc dù Google đã thông báo không còn sử dụng thẻ rel=”next“/”prev“, chúng vẫn là một tín hiệu tốt cho các công cụ tìm kiếm khác và giúp định hình cấu trúc website.

  1. Vào menu Config > Custom > Extraction.
  2. Nhấn “Add” và thiết lập một bộ trích xuất dữ liệu (extractor) bằng XPath hoặc CSS Path để tìm thẻ <link rel=”next“> và <link rel=”prev“> và lấy giá trị href của chúng.
  3. Sau khi crawl lại, kết quả sẽ xuất hiện trong tab Custom Extraction. Tại đây, bạn có thể kiểm tra xem các thẻ này có trỏ đúng thứ tự trong chuỗi phân trang hay không.

Bước 6: Kiểm Tra Sitemap và Robots.txt

kiểm tra audit phân trang trong robots.txt

Cuối cùng, hãy đảm bảo các công cụ tìm kiếm có thể tìm và crawl các URL phân trang.

  1. Trước khi crawl, hãy đảm bảo bạn đã bật tùy chọn Configuration → Spider → Basic → Crawl Linked XML Sitemaps.
  2. Sau khi crawl, kiểm tra tab Directives để xem các URL phân trang có đang bị chặn bởi robots.txt, meta robots hay X-Robots-Tag không.
  3. Đồng thời, bạn có thể kiểm tra xem các URL phân trang có được khai báo trong sitemap hay không bằng cách vào tab Sitemaps.

Theo dõi và duy trì sau khi audit phân trang theo checklist Lenart

quy trinh audit phan trang chi tiet tren screaming frog

Để đảm bảo tính ổn định và hiệu suất SEO bền vững, Lenart khuyến nghị thiết lập lịch theo dõi định kỳ với các bước sau:

Bước 1: Theo dõi khả năng index qua Google Search Console

  • Mở Coverage Pages (Indexing) để theo dõi các page phân trang được lập chỉ mục.
  • Đánh dấu các URL có trạng thái “Crawled – currently not indexed” hoặc “Excluded by ‘noindex’ tag” để xác định nguyên nhân.
  • Sử dụng Inspect URL để kiểm tra nhanh canonical mà Google đang nhận diện.

Bước 2: Định kỳ quét lại cấu trúc bằng Screaming Frog

Cứ mỗi 1–2 tháng, hãy crawl lại toàn bộ thư mục chứa phân trang:

  • Kiểm tra sự thay đổi trong cấu trúc link nội bộ, meta robots, và thẻ canonical.
  • Đối chiếu với dữ liệu cũ để phát hiện trang bị mất liên kết hoặc canonical trỏ sai.

Bước 3: Kiểm tra lại sitemap và robots.txt sau khi cập nhật nội dung

Bất cứ khi nào thêm hoặc xóa danh mục, bạn nên:

  • Cập nhật lại sitemap.xml, đảm bảo không chứa URL lỗi hoặc redirect.
  • Kiểm tra robots.txt để chắc chắn không chặn crawl nhầm các trang ?page= hoặc /page/.
  • Dùng lệnh site:domain.com inurl:page trên Google để xác nhận các trang đang hiển thị đúng.

Bước 4: Theo dõi hiệu suất người dùng và tốc độ tải

Phân trang không chỉ là kỹ thuật SEO mà còn ảnh hưởng trực tiếp đến UX. Dùng Google Analytics 4 hoặc Search Console > Experience > Core Web Vitals để:

  • Xem thời gian tải của các trang phân trang.
  • Phát hiện tỷ lệ thoát cao bất thường ở page sâu.
  • Đánh giá tác động của nút “Xem thêm” hoặc “Cuộn vô tận” nếu bạn sử dụng kỹ thuật đó.

Bước 5: Lên kế hoạch bảo trì định kỳ cùng checklist “Lenart Pagination Health”

Cuối cùng, hãy lưu checklist kiểm tra theo chu kỳ (hàng tháng hoặc quý):

  • Crawl toàn site → So sánh canonical → Rà lại sitemap → Kiểm tra index → Theo dõi traffic từng page.

Đây là quy trình kiểm tra tiêu chuẩn mà Lenart áp dụng để duy trì “sức khỏe phân trang” ở trạng thái tối ưu, giúp website luôn sẵn sàng mở rộng mà không đánh mất tín hiệu SEO tích lũy.

Qua bài viết audit phân trang chuẩn SEO giúp phát hiện lỗi canonical, internal link và sitemap, đảm bảo Google crawl và index đầy đủ các trang phân trang. Với hướng dẫn từ SEO Lenart, bạn có thể tối ưu cấu trúc website, cải thiện trải nghiệm người dùng và duy trì thứ hạng bền vững trên Google. Việc theo dõi định kỳ và áp dụng các kỹ thuật chuẩn SEO sẽ biến những phát hiện kỹ thuật thành hành động cụ thể, giúp website vận hành hiệu quả, ổn định và sẵn sàng mở rộng mà không mất tín hiệu SEO quan trọng.

Tác giả: Vũ Sơn – Nhân sự Technical SEO LENART

Nội dung được nhân sự phòng Technical chia sẻ!
Bài viết liên quan
Nội dung
Bài viết mới nhất
Lên đầu trang