Hướng Dẫn Kiểm Tra Structured Data Hàng Loạt Bằng Screaming Frog

Nội dung

Kiểm tra structured data luôn là bài toán khó với nhiều SEOer, đặc biệt khi phải validate hàng loạt URLs thủ công và phát hiện lỗi schema phức tạp giữa required/recommended properties. Tuy nhiên, với Screaming Frog, bạn có thể dễ dàng kiểm tra structured data bulk theo chuẩn Schema.orgrich result Google, thay thế Google Structured Data Testing Tool lỗi thời (không API, không bulk). Trong hướng dẫn này, LENART sẽ chỉ bạn cách tải tool, kích hoạt paid licence, crawl & báo cáo chi tiết để fix lỗi nhanh chóng, tăng rich snippets và traffic organic. Lite version miễn phí (500 URLs), crawl không giới hạn với license.

kiem-tra-structured-data-schema-org-va-google

1. Bật Tùy Chọn Kiểm Tra Structured Data Trong Screaming Frog

Để bắt đầu kiểm tra structured data bulk, vào Configuration > Spider > Extraction và tick chọn:

  • JSON-LD, Microdata, RDFa
  • Schema.org Validation (case sensitive – Google không bắt buộc)
  • Google Rich Result Feature Validation (quan trọng nhất cho rich snippets)

cau-hinh-kiem-tra-structured-data-trong-screaming-frog

Lưu ý: Schema.org phân biệt hoa thường, nhưng Google linh hoạt hơn cho rich results.

2. Crawl Website Để Kiểm Tra Structured Data Tự Động

Mở SEO Spider, nhập URL website vào ô ‘Enter URL to spider’ rồi nhấn ‘Start’.

crawl-website-de-kiem-tra-structured-data

Tool sẽ tự động kiểm tra structured data toàn site, extract schema và validate rich results. Uống cà phê chờ progress bar đạt 100% – hoàn tất!

3. Xem Tab Structured Data

Tab Structured Data hiển thị tất cả URLs tìm thấy trong crawl cùng các loại structured data khác nhau trong các cột tương ứng riêng biệt, cũng như tổng số, lỗi và cảnh báo trong pane cửa sổ chính.

tab-kiem-tra-structured-data-trong-screaming-frog

Tab Structured Data có 8 bộ lọc giúp bạn hiểu rõ việc triển khai structured data và xác định các vấn đề validation. Các cột ‘Total Types’ và ‘Unique Types’ đếm số lượng structured data itemtypes được phát hiện trên mỗi URL.

Pane tổng quan bên phải cung cấp tóm tắt dữ liệu chứa trong mỗi tab và filter, giúp bạn biết nơi cần click mà không phải kiểm tra từng filter để xem có dữ liệu hay không.chi-tiet-loi-khi-kiem-tra-structured-data

Bạn có thể lọc theo các mục sau:

  • Contains Structured Data – Đây là các URL chứa structured data. Bạn có thể xem các loại khác nhau trong các cột ở cửa sổ phía trên.
  • Missing Structured Data – Đây là các URL không chứa bất kỳ structured data nào.
  • Validation Errors – Đây là các URL chứa lỗi validation. Lỗi có thể là Schema.org, Google rich result features, hoặc cả hai – tùy thuộc vào cấu hình của bạn. Các vấn đề Schema.org luôn được phân loại là errors, không phải warnings. Google rich result feature validation sẽ hiển thị lỗi cho missing required properties hoặc vấn đề triển khai required properties. ‘Required properties’ của Google phải được bao gồm và hợp lệ để nội dung đủ điều kiện hiển thị rich result.
  • Validation Warnings – Đây là các URL chứa cảnh báo validation cho Google rich result features. Những cảnh báo này luôn dành cho ‘recommended properties’, không phải required properties. Recommended properties có thể được thêm để cung cấp thêm thông tin về nội dung, cải thiện trải nghiệm người dùng – nhưng không làm mất eligibility cho rich snippets. Schema.org validation không có ‘warnings’, tuy nhiên có cảnh báo khi sử dụng schema data-vocabulary.org cũ hơn.
  • Parse Errors – Đây là các URL có structured data không parse đúng. Thường do markup không chính xác. Nếu dùng format JSON-LD ưu tiên của Google, JSON-LD Playground là công cụ tuyệt vời để debug parsing errors.
  • Microdata URLs – Đây là các URL chứa structured data ở format microdata
  • JSON-LD URLs – Đây là các URL chứa structured data ở format JSON-LD
  • RDFa URLs – Đây là các URL chứa structured data ở format RDFa

4. Xem Tab ‘Structured Data Details’ Trong Pane Cửa Sổ Dưới Để Phân Tích Lỗi Và Cảnh Báo Validation

Pane cửa sổ dưới Structured Data Details cung cấp thông tin chi tiết hơn về các items và issues được phát hiện. Phần bên trái của pane cửa sổ dưới hiển thị giá trị property cùng icons khi có errors hoặc warnings, và phần bên phải cung cấp chi tiết về các vấn đề validation cụ thể.

tong-quan-kiem-tra-structured-data

Phần bên phải của pane cửa sổ dưới sẽ chi tiết loại validation chính xác (Schema.org, hoặc Google rich result feature tương ứng), mức độ nghiêm trọng (error, warning hoặc chỉ info) và message cụ thể để fix issue. Nó cũng cung cấp link đến Schema.org property cụ thể để xem thêm chi tiết về yêu cầu.

5. Tham Khảo Tài Liệu Schema.org Hoặc Google Rich Result Feature Để Hiểu Rõ Vấn Đề Validation

Kiểm tra Structured data có thể khó khăn, ngay cả khi có sự hỗ trợ của tools. Vì vậy luôn tham khảo tài liệu liên quan để có thêm context và tuân thủ guidelines.

Quy tắc đơn giản cho structured data auditing là fix validation errors để đảm bảo nội dung được xem xét cho Google rich results feature và rich snippets, đồng thời cân nhắc xem thông tin trong warnings có hữu ích cho users không, rồi implement hoặc ignore.

Validation issues dựa trên Google rich results feature required và recommended properties cùng Schema.org specifications. Validation cũng kiểm tra values của properties để đảm bảo đúng format. Ví dụ, nếu property phải là URL, number, v.v.

Reviewing Google rich result feature guidelines sẽ giúp hiểu rõ hơn về validation issues – vì vậy luôn refer back to them. Hãy xem một số examples và process này.

5.1. Lỗi Validation Google Product

Trong ví dụ dưới đây, chúng ta có thể thấy lv.com có ‘Google Product’ feature validation errors và warnings. Pane cửa sổ bên phải liệt kê những required (với error), và recommended (với warning).

ket-qua-kiem-tra-structured-data-chi-tiet

Bạn có thể tranh luận rằng ‘product’ không nên được sử dụng ở đây, nhưng vì nó đã được dùng, nó sẽ được validated against Google product feature guidelines, theo đó Google documentation yêu cầu image là bắt buộc, và thiếu khoảng nửa tá recommended properties khác.

Recommended properties được highlight là warnings có thể được implement để thêm thông tin về content (có thể cung cấp better user experience) hoặc chỉ cần ignore.

5.2. Lỗi Validation Google Corporate Contact

Trong ví dụ tiếp theo dưới đây, Direct Line có Google corporate contact feature validation error liên quan đến việc sử dụng ‘customer service general enquiries’ trong property ‘contactType’ của schema.

loi-corporate-contact-khi-kiem-tra-structured-data

Pane cửa sổ bên phải giải thích rằng ‘http://schema.org/contactType’ phải là ‘customer service’ hoặc ‘customer support’ hoặc ‘technical support’ hoặc ‘billing support’ hoặc ‘bill payment’ hoặc ‘sales’ hoặc ‘reservations’ hoặc ‘credit card support’ hoặc ’emergency’ hoặc ‘baggage tracking’ hoặc ‘roadside assistance’ hoặc ‘package tracking’ trong ‘ContactPoint’.

yeu-cau-contacttype-khi-kiem-tra-structured-data

Như đã hiển thị ở trên, validation error khớp với yêu cầu của Google từ documentation của họ. Tuy nhiên, Google Structured Data Testing Tool không phát hiện đây là validation error.

kiem-tra-structured-data-corporate-contact-bang-google

Mặc dù tool của Google có thể ít strict hơn hoặc bỏ sót một số items, chúng tôi recommend tuân thủ guidelines để tất cả structured data ở đúng format, đảm bảo machine-readable và không có issues.

5.3. Lỗi Validation Google Aggregate Rating (Review Snippet)

Trong ví dụ này, Admiral có Google Aggregate Rating error, thuộc Google review snippet rich result feature.

vi-du-structured-data-hop-le-khi-kiem-tra

Vấn đề cho biết worstRating property là required cho AggregateRating. Tham khảo review snippet documentation của Google, ta thấy bestRating và worstRating thực tế chỉ là recommended properties.

Tuy nhiên, đọc kỹ hơn, chúng required nếu rating system không phải 5-point scale. Trong trường hợp này, Admiral dùng 10-point scale, nên chúng trở thành required. Họ dùng đúng bestRating nhưng thiếu worstRating. Google Structured Data Testing Tool không phát hiện lỗi này.

5.4. Lỗi Validation Google Breadcrumb

Trong ví dụ cuối cùng dưới đây, HSBC có Google breadcrumb rich result feature error. Vấn đề cho biết ‘http://schema.org/item’ property là required cho ‘ListItem’.vi-du-loi-structured-data-khi-kiem-tra

Breadcrumb feature guidelines của Google yêu cầu recommended properties phải bao gồm item (URL của webpage), name (title của breadcrumb) và position (vị trí breadcrumb trong trail). HSBC đơn giản thiếu item property và URL tương ứng để tận dụng rich result feature này.

Tóm tắt: Luôn review documentation và guidelines phù hợp để verify validation errors và warnings.

6. Xuất Báo Cáo Bulk Validation Errors & Warnings Trong Screaming Frog

Có hai bulk exports available cho structured data qua menu top-level ‘Reports’.

bao-cao-loi-khi-kiem-tra-structured-data

Report ‘Validation Errors & Warnings Summary’ đặc biệt hữu ích vì nó aggregate data thành unique issues (không report every instance) và hiển thị số URLs bị ảnh hưởng bởi mỗi issue, kèm sample URL cụ thể. Ví dụ report như dưới.

bao-cao-tong-hop-kiem-tra-structured-data

Điều này khiến report highly condensed và ideal cho developer muốn biết unique validation issues cần fix across the site. ‘Validation Errors & Warnings’ export là bulk export mọi error và warning discovered cùng URL tương ứng.

7. Câu Hỏi Thường Gặp (FAQ)

Dưới đây là các câu hỏi phổ biến nhất về kiểm tra structured data với Screaming Frog SEO Spider, giúp bạn giải đáp nhanh các thắc mắc thường gặp.

7.1. Bạn Có Hỗ Trợ Validation Structured Data Tạo Bởi GTM & JavaScript Không?

Có. Bạn có thể validate structured data cho client-side JavaScript và implementations qua Google Tag Manager (GTM).

Chuyển sang JavaScript rendering mode và SEO Spider sẽ extract & validate structured data chỉ có trong rendered HTML.

Xem hướng dẫn Google về generating structured data with JavaScript.

7.2. SEO Spider Kiểm Tra Schema.org Và Google Rich Result Features Nào?

Schema.org validation kiểm tra types và properties có tồn tại trong Schema vocabulary, hiển thị ‘errors’ cho mọi issues. Ví dụ: kiểm tra https://schema.org/author tồn tại cho property, hoặc https://schema.org/Book là type hợp lệ.

Validation dựa trên main và pending Schema vocabulary, cập nhật thường xuyên theo phiên bản mới của SEO Spider.

Google rich result features validation dùng documentation chính thức kiểm tra required/recommended properties và values đúng format (number, URL, text). Required properties thiếu = errors, recommended thiếu = warnings (tương tự Google Structured Data Testing Tool).

Danh sách đầy đủ Google rich result features SEO Spider hỗ trợ:

(Và tất cả Google rich result features khác – hiện hỗ trợ 100%)

7.3. Tại Sao Validation Errors & Warnings Khác Với Google Structured Data Testing hoặc Rich Results Tools?

Chúng tôi highly recommend sử dụng Google Structured Data Testing Tool. Đây là tool excellent và useful để review & validate structured data.

Tuy nhiên, có occasions nơi results khác nhau giữa hai tools. Chúng tôi thường thấy SEO Spider pick up nhiều errors và warnings hơn. Tool của Google thường relaxed hơn documentation, đôi khi miss issues hoặc miss-classify.

Chúng tôi đã share một couple inconsistencies trong examples ở trên, và dù generally reliable, like any tool nó không perfect. Mục đích không phải để pick on Google’s SDTT, mà point out rằng nó không always accurate và results không nên blindly followed without consideration.

Vấn đề lớn và common hơn là Google appear check AMP required/recommended properties against Non-AMP URLs.

Trang Spotify dùng Article Schema (và không phải AMP) có 7 errors trong Google’s Structured Data Testing Tool cho ‘Article’. Nó show errors against publisher ‘logo’ và ‘name’ ví dụ.

loi-non-amp-khi-kiem-tra-structured-data

Tuy nhiên, review Google’s Article feature guidelines cho Non-AMP URLs thì những cái này không phải requirements. Chúng chỉ required cho AMP URLs. SEO Spider không show errors này, vì correctly determine không phải AMP.

SEO Spider cũng không perfect, nên recommend use both tools in combination và refer appropriate documentation để validate results và differences.

Chúng tôi cũng recommend enhancement reports in Google Search Console để help validate errors. Dù support all rich result features đang gradually rolled out, một số popular types available. Google cũng cho test structured data URL level using URL Inspection Tool, see more info về issue và validate fixes.Rich Results Tool cũng help test eligibility cho rich snippets, dù chỉ small subset of types supported. Tuy nhiên, như Dave Ojeda noted, dù still beta, Google announced tại I/O 2019 rằng Rich Results Tool is the successor to SDTT. Nó show validation errors like SDTT, dù hai tools occasionally show different results.

Điểm consideration khác là Google guidelines continue evolve, với deprecated features (Social Profile), renaming (LocalBusiness to Local Business Listing) và amendments to required/recommended properties.

Ví dụ tốt là Google local business requirements, recently changed nhưng older guidelines vẫn viewable courtesy of Archive.org. Old requirement là ‘addressCountry’ property phải 2-letter ISO 3166-1 alpha-2 country code.
structured-data-local-business-trong-tim-kiem-google
Điều này differ với Schema.org/addressCountry requirements, cho phép dùng country name như ‘USA’.

SEO Spider picked up như Google local business validation error based on guidelines, nhưng Google Structured Data Testing Tool không. Gây confusion vì Google documentation inconsistent với tool của họ.

Google local business rich result guidelines now updated remove requirement này, chỉ refer Schema.org PostalAddress. Tuy nhiên, ‘AreaServed’ property cho corporate contact feature vẫn có requirement này và might cần adjust.

Chúng tôi track changes closely và update SEO Spider accordingly, nhưng might có delay giữa releases (không pre-warning!). Một số Google structured data documentation open to interpretation, nên welcome feedback từ SEO community via our support để improve tool.

Cuối cùng, important remember Google recommend follow guidelines even nếu Structured Data Testing Tool relaxed hơn về properties/values. John Mueller (Webmaster Trends Analyst at Google)

Quy trình kiểm tra structured data với Screaming Frog SEO Spider từ cấu hình Extraction (JSON-LD, Schema.org Validation), crawl tự động, phân tích 8 filters (Validation Errors, Warnings, Parse Errors), xem Structured Data Details đến bulk export unique issues qua Reports đã sẵn sàng triển khai. Nhờ workflow này, bạn nhanh chóng phát hiện & fix validation errors (required/recommended properties), SEO issues (schema syntax, rich results eligibility) để tối ưu rich snippets và traffic organic Google Search 2025. Dịch Vụ SEO LENART tin rằng hướng dẫn sẽ giúp khai thác SEO Spider chuyên sâu, cải thiện thứ hạng SERP và trải nghiệm người dùng với rich results hoàn hảo.

 

Nội dung được nhân sự phòng Technical chia sẻ!

Bài viết liên quan

Nội dung
Bài viết nổi bật
Lên đầu trang