Hướng dẫn Audit AMP bằng Screaming Frog SEO Spider

Nội dung

Audit AMP luôn là bài toán khó với nhiều SEOer, đặc biệt khi phải kiểm tra hàng loạt URLs thủ công và phát hiện lỗi validation phức tạp. Tuy nhiên, với Screaming Frog, bạn có thể dễ dàng bulk validation AMP bằng chính thức AMP validator, thu thập SEO issues phổ biến và tối ưu hiệu quả mobile performance. Trong hướng dẫn này, LENART sẽ chỉ bạn cách cấu hình crawl, xem báo cáo và export dữ liệu AMP, từ đó fix lỗi nhanh chóng nhằm cải thiện thứ hạng mobile search và trải nghiệm người dùng. Lite version miễn phí (500 URLs), paid license crawl qua rel=”amphtml”.

audit-amp-screaming-frog

1. Crawl website để Audit AMP

Phần này của hướng dẫn chỉ bạn cách cấu hình crawl để tự động discover AMP URLs, audit và validate chúng một cách nhanh chóng, hiệu quả.

Từ việc setup Mode, configure Inclusion Rules đến chạy crawl và xem báo cáo chi tiết – quy trình đầy đủ sẽ được chia nhỏ thành các bước cụ thể:

1.1. Cấu hình Crawl & Store AMP trong SEO Spider

Vào Config > Spider > Crawl và bật hai tùy chọn quan trọng: ‘Crawl AMP’ để tự động discover AMP URLs qua rel=”amphtml” link tags (yêu cầu paid license), cùng ‘Store AMP HTML’ để lưu full AMP HTML phục vụ validation chi tiết. Lite version miễn phí có thể skip bước này và dùng upload list AMP URLs thay thế.

cau-hinh-audit-amp-trong-screaming-frog

1.2. Chạy crawl website để discover AMP URLs tự động

Mở SEO Spider, nhập URL website cần audit vào ô ‘Enter URL to Spider’ rồi nhấn ‘Start’.

chay-crawl-website-de-audit-amp

SEO Spider sẽ crawl toàn bộ site và tool sẽ tiến hành quét toàn bộ site và lấy ra các URL AMP thông qua thẻ rel=”amphtml” trong HTML. Nếu AMP URLs không được crawl hoặc dữ liệu không đầy đủ, bạn nên kiểm tra lại cấu hình crawl, bao gồm robots.txt và khả năng render JavaScript. Screaming Frog cho phép kiểm tra robots.txt bằng Screaming Frogcrawl JavaScript SEO để xác định chính xác nguyên nhân. Chờ crawl hoàn tất 100% để có đầy đủ dữ liệu AMP.

1.3. Cách xem tab AMP & 17 bộ lọc lỗi audit AMP trong Screaming Frog

Tab AMP hiển thị tất cả AMP URLs được discover. Tab có 17 filters (như hình dưới) giúp identify SEO & validation issues phổ biến.

tab-amp-phuc-vu-audit-amp

15 filters hiển thị ngay trong lúc crawl hoặc kết thúc crawl. 2 filters còn lại cần post ‘Crawl Analysis’ để populate data (chi tiết ngay sau).

Cửa sổ ‘overview’ bên phải hiển thị thông báo ‘(Crawl Analysis Required)’ cho các filters cần post analysis.

bo-loc-amp-dung-cho-audit-amp

1.4. Chạy Crawl Analysis để hoàn tất quy trình audit AMP

Để populate 2 AMP filters còn lại, chỉ cần click Crawl Analysis > Start.

bat-dau-audit-amp-bang-screaming-frog

Kiểm tra trước: Vào ‘Crawl Analysis > Configure’ đảm bảo ‘AMP’ được tick. Có thể untick các items khác để chạy nhanh hơn.

phan-tich-du-lieu-sau-audit-amp

Khi hoàn tất, progress bar đạt 100% và filters sẽ không còn thông báo ‘(Crawl Analysis Required)’.

hoan-tat-audit-amp-va-ap-dung-bo-loc

1.5. Hướng dẫn xem 17 AMP Filters Screaming Frog sau Crawl Analysis

Sau post crawl analysis, tất cả 17 AMP filters đã populate data đầy đủ. Ví dụ dưới đây hiển thị AMP URLs bị ‘non-200 responses’ (404 errors).

phat-hien-url-amp-loi-trong-audit-amp

17 Filters phân loại SEO & AMP specs issues:

SEO-related Filters

  • Non-200 Response: AMP URLs không trả về mã 200 OK – có thể do bị chặn robots.txt, redirect hoặc lỗi server. Khi audit AMP, việc phân tích http status code crawl giúp bạn xác định chính xác nhóm lỗi ảnh hưởng trực tiếp đến crawl và index.
  • Missing Non-AMP Return Link: Canonical page thiếu rel=”amphtml” backlink
  • Missing Canonical to Non-AMP: AMP canonical không trỏ về trang thường mà lại trỏ sang AMP khác. Trong các trường hợp website chuẩn bị remove AMP, lỗi này thường cần được xử lý kết hợp với audit redirect để đảm bảo luồng canonical và redirect không gây mất index.
  • Non-Indexable Canonical: AMP canonical là non-indexable page
  • Indexable/Non-Indexable: AMP nên non-indexable (nếu có non-AMP equivalent)

AMP Validation Filters:

  • Missing HTML AMP Tag: Thiếu <html amp> top-level
  • Missing/Invalid Doctype: Thiếu <!doctype html>
  • Missing Head/Body Tag: Thiếu <head>/<body> (required AMP)
  • Missing Canonical: Thiếu canonical trỏ non-AMP
  • Missing/Invalid Meta Charset: Thiếu meta charset=”utf-8″
  • Missing/Invalid Meta Viewport: Thiếu viewport width=device-width,minimum-scale=1
  • Missing/Invalid AMP Script: Thiếu v0.js script
  • Missing/Invalid AMP Boilerplate: Thiếu boilerplate code
  • Contains Disallowed HTML: HTML không phép (right-click → AMP Validator)
  • Other Validation Errors: Lỗi validation khác

1.6. Xem nguồn AMP URL qua tab ‘Inlinks’

Trong quá trình audit AMP, khi một AMP URL báo lỗi (ví dụ: 404, non-200 response hoặc validation error), bạn cần xác định nguồn desktop page nào đang trỏ tới AMP URL đó để fix chính xác.

Click vào AMP URL bị lỗi ở cửa sổ trên, sau đó chuyển sang tab Inlinks ở panel phía dưới để xem nguồn liên kết.

Trong tab Inlinks:

  • Type = amphtml cho biết AMP URL này được tham chiếu thông qua thẻ rel=”amphtml” trong phần <head> của HTML desktop page
  • Từ đây, bạn có thể xác định desktop URL nào đang trỏ tới AMP bị lỗi

Ví dụ chi tiết:
Desktop URL
https://www.telegraph.co.uk/business/essential-insights/cyber-resilience/

có thẻ rel=”amphtml” trỏ tới AMP version
https://www.telegraph.co.uk/business/essential-insights/cyber-resilience/amp/

nhưng AMP URL này trả về 404 error.

Thông tin này cho phép bạn audit AMP chính xác theo mối quan hệ desktop ↔ AMP, từ đó nhanh chóng fix các lỗi:

  • AMP URL trả về 404 / 5xx
  • Canonical trỏ sai
  • AMP links lỗi trong <head> của desktop page

1.7. Bulk Export AMP Inlinks qua ‘Bulk Export > AMP’

Để bulk export dữ liệu AMP inlinks, dùng menu ‘Bulk Export > AMP’.

xuat-du-lieu-phuc-vu-audit-amp

Ví dụ: Export tất cả AMP URLs không trả về 200 (404s) cùng inlinks tương ứng (canonical pages link tới AMP bị lỗi).

Siêu tiện cho việc fix hàng loạt canonical/AMP link issues

2. Upload & Audit AMP URLs riêng lẻ

Cách thay thế: Upload trực tiếp list AMP URLs ở List Mode để audit riêng.

Lite version miễn phí hoàn toàn hỗ trợ crawl & validate AMP URLs từ list upload.

Khuyến nghị: Nếu có cả desktop + AMP versions, upload desktop URLs và tweak config để audit cả đôi cùng lúc (quy trình chi tiết bên dưới).

Ưu điểm List Mode:

  • Không cần paid license
  • Nhanh hơn cho site AMP lớn
  • Chính xác khi biết trước AMP URLs

2.1. Audit AMP bằng List Mode

Click menu cấp cao ‘Mode > List’ để kích hoạt upload list desktop URLs.

che-do-list-dung-cho-audit-amp

2.2. Tắt giới hạn Crawl Depth khi crawl Screaming Frog

Mặc định List Mode giới hạn crawl depth = 0 (chỉ crawl URLs upload). Cần tắt giới hạn này để crawl thêm AMP versions (depth ‘1’).

cau-hinh-do-sau-crawl-cho-audit-amp

2.3. Bật Crawl & Store AMP và tắt các liên kết khác để audit AMP chính xác

Để audit AMP chính xác trong List Mode, Screaming Frog cần được cấu hình chỉ crawl desktop URLs đã upload và AMP equivalents tương ứng. Với các website staging hoặc môi trường test có yêu cầu đăng nhập, bạn cần cấu hình thêm để crawl website có mật khẩu, tránh tình trạng AMP URLs không được thu thập đầy đủ khi audit, thay vì thu thập toàn bộ liên kết và tài nguyên trên website. Việc này giúp giảm crawl noise, tăng tốc độ crawl và dễ dàng phát hiện các lỗi AMP validation quan trọng.

Vào Config > Spider > Crawl, bật hai tùy chọn sau:

  • Crawl AMP: cho phép Screaming Frog tự động discover AMP URLs thông qua thẻ rel=”amphtml”
  • Store AMP HTML: lưu trữ toàn bộ AMP HTML để phục vụ quá trình validation chi tiết

Trong List Mode (sau khi đã tắt giới hạn crawl depth), Screaming Frog sẽ crawl các liên kết tương tự như Spider Mode thông thường. Để chỉ crawl AMP equivalents, bạn cần tắt toàn bộ page links và resource links khác, chỉ giữ lại AMP links.

crawl-chi-url-amp-de-audit-amp

Kết quả: Screaming Frog chỉ crawl các desktop URLs đã upload và AMP equivalents tương ứng, thay vì toàn bộ liên kết và tài nguyên trên website. Cách cấu hình này giúp audit AMP chính xác trong List Mode, giảm crawl noise, tăng tốc crawl và dễ phát hiện các lỗi AMP validation hơn.

2.4. Upload desktop URLs & chạy audit AMP

Sau khi đã cấu hình Screaming Frog chỉ crawl desktop URLs và AMP equivalents, bước tiếp theo là upload danh sách desktop URLs cần audit AMP để tool tự động thu thập và kiểm tra phiên bản AMP tương ứng.

Copy danh sách desktop URLs cần audit, sau đó click Upload > Paste để dán URLs vào SEO Spider. Cách làm này tương tự quy trình crawl danh sách URL, giúp audit AMP nhanh và chính xác mà không cần crawl toàn bộ website.

dan-danh-sach-url-amp-de-audit-amp

Click OK hai lần để bắt đầu crawl. Screaming Frog sẽ tiến hành crawl desktop URLs đã upload và AMP URLs tương ứng, quá trình audit AMP sẽ chạy cho đến khi hoàn tất 100%.

Sau khi crawl xong, bạn đã có đầy đủ dữ liệu để tiếp tục audit AMP trong tab AMP, chạy Crawl Analysis và phân tích các lỗi AMP validation, canonical và indexability.

2.5. Tiếp tục audit AMP với 17 filters sau Crawl Analysis

Sau khi Screaming Frog hoàn tất crawl desktop URLs và AMP equivalents, bước tiếp theo trong quy trình là chạy Crawl Analysis để populate đầy đủ 17 AMP filters, phục vụ việc audit AMP chi tiết.

Tiếp tục thực hiện theo quy trình ở bước 1.3:

  • Mở tab AMP để xem danh sách toàn bộ AMP URLs đã crawl
  • Chạy Crawl Analysis nhằm populate dữ liệu cho 17 AMP filters
  • Phân tích các nhóm lỗi AMP validation, canonical, indexability và response codes

Mặc dù List Mode không toàn diện như full site crawl, việc upload desktop URLs và chỉ crawl AMP equivalents cho phép bạn phân tích mối quan hệ source giữa desktop ↔ AMP rất nhanh, từ đó spot check audit AMP hiệu quả và xác định chính xác nguồn gây lỗi.

Cách làm này đặc biệt phù hợp khi:

  • Cần kiểm tra nhanh lỗi AMP trên một tập URLs cụ thể
  • Muốn audit AMP mà không cần paid license
  • Tập trung vào canonical & AMP validation issues thay vì toàn bộ site

Bạn đã nắm vững cách audit AMP bằng Screaming Frog SEO Spider, từ cấu hình crawl tự động discover AMP URLs, xem 17 filters validation, phân tích inlinks source đến bulk export lỗi và List Mode upload desktop + AMP pairs. Nhờ quy trình này, bạn có thể nhanh chóng phát hiện & fix validation errors, SEO issues (canonical, indexability) để tối ưu mobile performance. Với các website đa ngôn ngữ hoặc quốc tế, sau khi xử lý AMP bạn cũng nên kiểm tra thêm các yếu tố kỹ thuật liên quan như audit hreflang hoặc kiểm tra structured data nhằm tránh xung đột index giữa các phiên bản URL. và rich results eligibility. LENART SEO tin rằng hướng dẫn sẽ giúp bạn khai thác Screaming Frog chuyên sâu, cải thiện thứ hạng mobile search và trải nghiệm người dùng trên mọi thiết bị.

Nội dung được nhân sự phòng Technical chia sẻ!

Bài viết liên quan

Nội dung
Bài viết nổi bật
Lên đầu trang