Screaming frog là một trong những công cụ kiểm tra lỗi và chỉnh bài viết tối ưu nhất. Đây là ứng dụng được đông đảo SEO-er quan tâm hiện nay. Nắm được nhu cầu của khách hàng, dịch vụ SEO tổng thể SEODO đã tổng hợp bài viết phân tích chi tiết về chủ đề này. Nếu bạn quan tâm chủ đề này hãy cùng tìm hiểu thông qua nội dung dưới đây nhé!
>>> THAM KHẢO: Báo giá dịch vụ SEO HCM mới nhất 2024 với ưu đãi lên đến 100 triệu
1. Sreaming Frog là gì?
Sreaming Frog là một chương trình SEO Deskop mà bạn có thể sử dụng để thu thập dữ liệu của các trang web và thu thập dữ liệu về chứng. Một số điều mà bạn cần biết về Screaming Frog SEO Spider như:
- Screaming Frog có thể sử dụng cho cả 2 hệ điều hành là Windows và Mac.
- Screaming Frog có phiên bản miễn phí cho phép bạn thu thập dữ liệu tới 500 URL và phiên bản trả phí cho phép thu thập dữ liệu không giới hạn.
- Screaming Frog không chỉ dành cho mục đích SEO – nó cũng có thể được sử dụng cho việc kiểm tra trang web, phân tích đối thủ cạnh tranh.
>>> Cùng tìm hiểu: Top 10+ Công Cụ Check Thứ Hạng Từ Khóa Google Hàng Đầu
2. Tại sao nên sử dụng Sreaming Frog
Screaming Frog là một công cụ rất hữu ích cho các chuyên gia SEO và các chủ sở hữu trang web bởi những lợi ích mà nó mang lại như sau:
- Thu thập dữ liệu trang web chi tiết: Screaming Frog cho phép bạn thu thập thông tin chi tiết về trang web bao gồm các link, keyword, title, thẻ meta, độ dài nội dung và các yếu tố khác liên quan đến SEO. Điều này giúp bạn hiểu rõ hơn về trang web của mình và tối ưu hóa nó để có thứ hạng tốt hơn trên các công cụ tìm kiếm.
- Phát hiện các lỗi trên trang web: Screaming Frog giúp bạn phát hiện các lỗi trên trang web của mình, bao gồm các liên kết hỏng, trang 404, thẻ tiêu đề và thẻ meta sai, các trang trùng lặp và nhiều hơn nữa. Điều này giúp bạn sửa các lỗi này và tăng tính đáng tin cậy của trang web của mình.
- Tìm kiếm liên kết ngoài: Screaming Frog cho phép bạn tìm kiếm liên kết ngoài trang web của mình và xác định các liên kết hỏng hoặc liên kết không còn sử dụng. Điều này giúp bạn tìm kiếm các cơ hội liên kết mới và loại bỏ các liên kết hỏng
- Tiết kiệm thời gian: Screaming Frog giúp bạn thu thập dữ liệu nhanh chóng và hiệu quả, tiết kiệm thời gian và công sức so với việc phân tích trang web thủ công.
>>> ĐỪNG BỎ LỠ: 29 các công cụ hỗ trợ SEO hữu ích cho SEO-ER không thể bỏ lỡ trong năm 2024
3. Hướng dẫn sử dụng thu thập thông tin cơ bản bằng Screaming Frog SEO Spider
Screaming frog seo spider là một trong những công cụ thông dụng trong SEO. Chính vì vậy việc sử dụng thành thạo công cụ này sẽ giúp người dùng tối ưu website. Dưới đây là hướng dẫn sử dụng thu thập thông tin cơ bản một cách đơn giản nhất.
3.1. Cách thu thập thông tin toàn bộ trang web qua Screaming Frog
Khi bắt đầu thu thập thông tin, bạn nên dành một chút thời gian và đánh giá loại thông tin mà bạn đang tìm kiếm. Các đặc điểm về kích thước của trang web và bao nhiêu trang web bạn cần thu thập thông tin để truy cập. Đôi khi, với các website lớn, khách hàng nên hạn chế thu thập thông tin ở một phần phụ của URL. Điều này sẽ giúp kích thước tệp và việc xuất dữ liệu dễ dàng để quản lý.
Để thu thập thông tin toàn bộ trang web của bạn, bao gồm tất cả các miền phụ, bạn cần thực hiện một số điều chỉnh nhỏ đối với cấu hình spider để bắt đầu. Theo mặc định, ứng dụng chỉ thu thập thông tin tên miền phụ mà khách hàng nhập. Bất kỳ tên miền phụ bổ sung nào mà con nhện gặp phải sẽ được xem như các liên kết bên ngoài.
Bước 1:
Bước 2: Ngoài ra, nếu bạn đang bắt đầu thu thập thông tin từ một thư mục con và thông tin toàn bộ trang web. Bạn hãy chọn hộp được đánh dấu “Thu thập thông tin bên ngoài Thư mục Bắt đầu”.
3.2. Cách thu thập thông tin một thư mục con
Nếu bạn muốn giới hạn việc thu thập thông tin của mình trong một thư mục. Điều đơn giản là bạn chỉ cần nhập URL. Tiếp theo hãy nhấn bắt đầu mà không cần thay đổi bất kỳ cài đặt mặc định nào cả. Nếu bạn đã xác định được cài đặt mặc định ban đầu, hãy đặt lại cấu hình mặc định trong menu ‘Tệp’. Nếu bạn muốn tiếp tục thu thập thông tin đến phần còn lại của miền phụ, hãy đảm bảo chọn ‘Thu thập thông tin bên ngoài thư mục bắt đầu’.
3.3. Cách thu thập thông tin một nhóm tên miền phụ hoặc thư mục con cụ thể
Nếu bạn muốn giới hạn việc thu thập thông tin của mình trong một tập hợp tên miền phụ hoặc thư mục con cụ thể. Khách hàng có thể sử dụng RegEx để đặt các quy tắc đó trong cài đặt bao gồm hoặc loại trừ trong menu cấu hình. Trong ví dụ này, chúng tôi đã thu thập dữ liệu mọi trang trên Seerinteractive.com. Ngoại trừ các trang ‘about’ trên mọi tên miền phụ.
Bước 1:
Đi tới cấu hình > loại trừ, sử dụng biểu thức chính quy ký tự đại diện để xác định các URL hoặc thông số bạn muốn loại trừ.
Bước 2:
Kiểm tra biểu thức chính quy của bạn để đảm bảo rằng ứng dụng đang loại trừ các trang bạn đọc muốn trước khi bắt đầu thu thập thông tin. Đây là một cách tuyệt vời để thu thập dữ liệu các trang web lớn hơn. Trên thực tế, phần mềm đề xuất phương pháp này nếu bạn đọc cần phân chia và chinh phục thu thập thông tin cho một miền lớn hơn.
3.4. Bạn muốn có một danh sách tất cả các trang trên trang web của mình
Theo mặc định, phần mềm này được đặt để thu thập dữ liệu tất cả các tệp hình ảnh, JavaScript, CSS và flash mà con nhện gặp phải. Để chỉ thu thập thông tin HTML, bạn đọc sẽ phải bỏ chọn “Kiểm tra hình ảnh”, “Kiểm tra CSS”, “Kiểm tra JavaScript” và “Kiểm tra SWF” trong menu Cấu hình Spider.
Sau khi thu thập thông tin xong, hãy chuyển đến tab “nội bộ” và lọc kết quả của bạn theo “HTML”. Nhấp vào ‘Xuất’ và bạn sẽ có danh sách đầy đủ ở định dạng CSV. Mẹo chuyên nghiệp nếu bạn có xu hướng sử dụng các cài đặt giống nhau cho mỗi lần thu thập thông tin. Screaming Frog hiện cho phép khách hàng lưu cài đặt cấu hình của mình
3.5. Cách thu thập thông tin một trang thương mại điện tử hoặc các trang web lớn khác
Phần mềm ban đầu không được xây dựng để thu thập dữ liệu hàng trăm nghìn trang. Nhưng nhờ một số nâng cấp, công cụ Frog có khả nằng thu thập rất nhiều thông tin từ nhiều website khác nhau. Phiên bản mới nhất của ứng dụng đã được cập nhật dựa trên cơ sở dữ liệu lưu trữ để thu thập thông tin. Trong phiên bản 11.0, trang web cho phép người dùng chọn lưu tất cả dữ liệu vào đĩa trong cơ sở dữ liệu thay vì chỉ giữ nó trong RAM.
Trong phiên bản 12.0, trình thu thập thông tin tự động lưu các lần thu thập thông tin vào cơ sở dữ liệu. Điều này cho phép chúng được truy cập và mở bằng cách sử dụng “Tệp> thu thập thông tin trong menu cấp cao nhất. Mặc dù sử dụng thu thập dữ liệu cơ sở dữ liệu giúp ứng dụng quản lý tốt hơn các thu thập thông tin lớn hơn. Tuy nhiên chắc chắn đây không phải là cách duy nhất để thu thập dữ liệu một trang web lớn.
- Đầu tiên, bạn có thể tăng phân bổ bộ nhớ của spider.
- Thứ hai, bạn có thể chia nhỏ việc thu thập thông tin theo thư mục con. Bên cạnh đó, khách hàng có thể chỉ thu thập thông tin các phần nhất định của trang web bằng cách sử dụng cài đặt Bao gồm / Loại trừ.
- Thứ ba, bạn đọc có thể chọn không thu thập dữ liệu hình ảnh, JavaScript, CSS và flash. Bằng cách bỏ chọn các tùy chọn này trong menu Cấu hình, bạn có thể tiết kiệm bộ nhớ bằng cách chỉ thu thập dữ liệu HTML.
3.6. Cách thu thập thông tin các trang yêu cầu xác thực
Khi Website đi qua một trang được bảo vệ bằng mật khẩu. Sau đó sẽ xuất hiện hộp thoại, trong đó bạn có thể nhập tên người dùng và mật khẩu cần thiết. Xác thực dựa trên biểu mẫu là một tính năng rất mạnh mẽ và có thể yêu cầu hiển thị JavaScript để hoạt động hiệu quả. Trình thu thập thông tin được lập trình để nhấp vào mọi liên kết trên một trang. Do đó website có thể dẫn đến các liên kết đăng xuất, thậm chí xóa dữ liệu.
Khách hàng có thể điều chỉnh xác thực và điều hướng đến Cấu hình > Xác thực. Ngoài ra, bạn muốn tắt yêu cầu xác thực, hãy bỏ chọn ‘Xác thực dựa trên tiêu chuẩn’ trong cửa sổ ‘Xác thực’ từ menu Cấu hình.
>>> Đọc thêm kiến thức về: Top 10 Công Cụ Nghiên Cứu Từ Khóa SEO Tốt Nhất Hiện Nay
4. Screaming Frog – 5 Cách thu thập thông tin về Internal links
Ứng dụng Screaming Frog đem đến cho người dùng những tiện ích về Internal links. Đây là một trong những công cụ rất cần thiết với SEOer. Nội dung dưới đây sẽ giải đáp những thắc mắc cơ bản của bạn.
4.1. Tôi muốn thông tin về tất cả các liên kết bên trong và bên ngoài trên trang web của mình (văn bản liên kết, chỉ thị, liên kết trên mỗi trang, v.v.)
Nếu bạn không cần kiểm tra hình ảnh, JavaScript, flash hoặc CSS trên trang web hãy bỏ chọn các tùy chọn này trong menu Cấu hình Spider để tiết kiệm thời gian xử lý và bộ nhớ. Sau khi trình thu thập thông tin hoàn tất, hãy sử dụng menu Xuất hàng loạt để xuất CSV. Điều này sẽ cung cấp cho bạn đọc tất cả các vị trí liên kết, cũng như văn bản liên kết tương ứng, chỉ thị, v.v…
Tất cả các liên kết có thể là một báo cáo lớn hãy lưu ý điều này khi xuất thông tin đối với một trang web lớn, quá trình xuất này đôi khi có thể mất vài phút để chạy. Ngoài ra, người dùng có thể kiểm đếm nhanh số lượng liên kết trên mỗi trang, hãy chuyển đến tab ”Internal” và sắp xếp theo “Outlinks”. Bất cứ điều gì trên 100, có thể cần được xem xét.
4.2. Cách tìm các liên kết nội bộ bị hỏng trên một trang hoặc trang web
Khi nhấp vào bất kỳ URL riêng lẻ nào trong kết quả thu thập thông tin, bạn sẽ thấy thông tin thay đổi trong cửa sổ dưới cùng của chương trình. Bằng cách nhấp vào tab ‘Trong liên kết’ ở cửa sổ dưới cùng, bạn sẽ tìm thấy danh sách các trang đang liên kết đến URL đã chọn, cũng như văn bản liên kết và lệnh được sử dụng trên các liên kết đó. Bạn có thể sử dụng tính năng này để xác định các trang cần cập nhật liên kết nội bộ.
Để xuất danh sách đầy đủ các trang bao gồm các liên kết bị hỏng hoặc được chuyển hướng, hãy chọn ”Redirection (3xx) In Links” hoặc ”Client Error (4xx) In Links” hoặc ”Server Error (5xx) In Links” trong menu ”Advanced Export” và bạn sẽ nhận được bản xuất CSV của dữ liệu. Cuộn xuống mã phản hồi và xem các báo cáo sau:
- Không có liên kết phản hồi.
- Chuyển hướng (3xx) Liên kết.
- Chuyển hướng (JavaScript) Liên kết.
- Liên kết chuyển hướng (Meta Refresh).
- Lỗi máy khách (4xx) liên kết.
- Lỗi máy chủ (5xx).
>>> Nếu bạn đang tìm một dịch vụ SEO web trọn gói, tiết kiệm chi phí thì đừng ngần ngại liên hệ với SEODO – đơn vị SEO số 1 Việt Nam
4.3. Cách tìm các liên kết ra ngoài bị hỏng trên một trang hoặc trang web (hoặc tất cả các liên kết ngoài nói chung)
Sau khi bỏ chọn ”Check Images”, ”Check CSS”, ”Check JavaScript” và ”Check SWF” trong cài đặt Cấu hình Spider. ãy đảm bảo rằng ”Check External Links” vẫn được chọn. Sau khi thu thập thông tin xong, nhấp vào tab ‘Bên ngoài’ trong cửa sổ trên cùng, sắp xếp theo ‘Mã trạng thái’ và bạn sẽ dễ dàng tìm thấy các URL có mã trạng thái khác 200.
Để xuất danh sách đầy đủ các liên kết ra ngoài của bạn, hãy nhấp vào ”External” trên tab Xuất hàng loạt. Để có danh sách đầy đủ tất cả các vị trí và văn bản liên kết của các liên kết ngoài, hãy chọn ”All Outlinks” trong menu ”Bulk Export”. Báo cáo tất cả các liên kết ngoài cũng sẽ bao gồm các liên kết ra ngoài đến các miền phụ của bạn; nếu bạn muốn loại trừ miền của mình, hãy dựa vào báo cáo.
4.4. Cách tìm các liên kết đang được chuyển hướng
Sau khi thu thập thông tin xong, hãy chọn tab ”Response Codes” từ giao diện người dùng chính và lọc theo Mã trạng thái. Vì Screaming Frog seo spider sử dụng Biểu thức chính quy để tìm kiếm. Khách hàng hãy gửi các tiêu chí sau dưới dạng bộ lọc: 301 | 302 | 307. Điều này sẽ cung cấp cho bạn một danh sách khá chắc chắn về tất cả các liên kết quay lại với một số loại chuyển hướng.
Nếu bạn đọc xuất trực tiếp từ tab này. Bạn sẽ chỉ thấy dữ liệu được hiển thị trong cửa sổ trên cùng. Để xuất danh sách đầy đủ các trang bao gồm các liên kết được chuyển hướng, bạn sẽ phải chọn ”Redirection (3xx) In Links” trong menu ”Advanced Export”. Điều này sẽ trả về một CSV bao gồm vị trí của tất cả các liên kết được chuyển hướng của bạn.
4.5. Cách tìm các trang có chứa nội dung video hoặc âm thanh được nhúng
Các cơ hội liên kết nội bộ có thể mang lại ROI khổng lồ – đặc biệt khi bạn đang có chiến lược về việc phân phối, xếp hạng trang & giá trị liên kết, xếp hạng từ khóa và Neo giàu từ khóa. Tài nguyên truy cập của chúng tôi cho các cơ hội liên kết nội bộ đến với bảng điều khiển Power BI ấn tượng do Allison Hahn và Zaine Clark của chính chúng tôi tạo ra.
>>> Tìm hiểu thêm công cụ SEO: Rank Math: Hướng Dẫn Cài Đặt Và Sử Dụng Rank Math SEO
5. Tìm hiểu 4 cách chiết xuất dữ liệu nội dung trang web qua Screaming Frog
Dưới đây là phương pháp chiết xuất dữ liệu nội dung trang Web qua ứng dụng web một cách tối ưu nhất. Khách hàng hãy bỏ túi ngay mẹo tiết kiệm thời gian này nhé!
5.1. Cách xác định các trang có nội dung mỏng
Sau khi thu thập thông tin xong, hãy chuyển đến tab ”Internal”, lọc theo HTML. Sau đó cuộn sang phải đến cột ”Word Count”. Sắp xếp cột ”Word Count” từ thấp đến cao để tìm các trang có nội dung văn bản thấp. Bạn có thể kéo và thả cột ‘Đếm từ’ ở bên trái để đối sánh tốt hơn các giá trị đếm từ thấp với các URL thích hợp. Nhấp vào “Export” trong tab “Internal” nếu bạn muốn thao tác dữ liệu trong CSV.
Mặc dù phương pháp đếm từ ở trên sẽ định lượng văn bản thực của trang. Nhưng vẫn không có cách nào để biết văn bản được tìm thấy chỉ là tên sản phẩm hay văn bản nằm trong khối sao chép được tối ưu hóa từ khóa. Để tìm ra số lượng từ trong các khối văn bản của bạn, hãy sử dụng ImportXML2 by @iamchrisle để loại bỏ các khối văn bản trên bất kỳ danh sách trang nào, sau đó đếm các ký tự từ đó. Nếu các truy vấn xPath không phải là điểm mạnh của bạn, thì xPath Helper hoặc tiện ích mở rộng Xpather Chrome thực hiện một công việc khá vững chắc trong việc tìm ra xPath cho bạn. Rõ ràng, bạn cũng có thể sử dụng các khối văn bản cóp nhặt này để bắt đầu hiểu cách sử dụng từ tổng thể trên trang web được đề cập.
5.2. Tôi muốn một danh sách các liên kết hình ảnh trên một trang cụ thể
Nếu bạn đã thu thập thông tin toàn bộ trang web hoặc thư mục con, chỉ cần chọn trang trong cửa sổ trên cùng, sau đó nhấp vào tab ‘Thông tin hình ảnh’ trong cửa sổ dưới cùng để xem tất cả các hình ảnh được tìm thấy trên trang đó. Các hình ảnh sẽ được liệt kê trong cột “Tới”.
Nhấp chuột phải vào bất kỳ mục nhập nào trong cửa sổ dưới cùng để sao chép hoặc mở URL. Ngoài ra, bạn cũng có thể xem hình ảnh trên một trang bằng cách chỉ thu thập thông tin URL đó. Đảm bảo rằng độ sâu thu thập thông tin của bạn được đặt thành ‘1’ trong cài đặt Cấu hình Spider, sau đó khi trang được thu thập thông tin, hãy nhấp vào tab ‘Hình ảnh’ và bạn sẽ thấy bất kỳ hình ảnh nào mà con nhện tìm thấy.
5.3. Cách tìm hình ảnh thiếu văn bản thay thế hoặc hình ảnh có văn bản thay thế dài
Trước tiên, bạn sẽ muốn đảm bảo rằng ‘Kiểm tra hình ảnh’ được chọn trong menu Cấu hình nhện. Sau khi thu thập thông tin xong, hãy chuyển đến tab ‘Hình ảnh’ và lọc theo ‘Thiếu văn bản thay thế’ hoặc ‘Văn bản thay thế hơn 100 ký tự’. Bạn có thể tìm thấy các trang có bất kỳ hình ảnh nào bằng cách nhấp vào tab ‘Thông tin Hình ảnh’ trong cửa sổ dưới cùng. Các trang sẽ được liệt kê trong cột “Từ”.
Cuối cùng, nếu bạn thích CSV hơn, hãy sử dụng menu ‘Xuất hàng loạt’ để xuất ‘Tất cả hình ảnh’ hoặc ‘Hình ảnh thiếu liên kết văn bản thay thế’ để xem danh sách đầy đủ các hình ảnh, vị trí của chúng và bất kỳ văn bản thay thế nào được liên kết hoặc các vấn đề với thay thế Ngoài ra, sử dụng thanh bên phải để điều hướng đến phần hình ảnh của thu thập thông tin. Tại đây, bạn có thể dễ dàng xuất danh sách tất cả các hình ảnh bị thiếu văn bản thay thế.
5.4. Cách tìm mọi tệp CSS trên trang web của tôi
Trong menu Cấu hình Spider, chọn ‘Thu thập thông tin’ và ‘Lưu trữ’ CSS trước khi thu thập thông tin, sau đó khi quá trình thu thập thông tin kết thúc, hãy lọc kết quả trong tab ‘Nội bộ’ theo ‘CSS’.
>>> Tìm đọc: SEOquake Là Gì? Thành Thạo Các Tính Năng Quan Trọng Hàng Đầu 2023
6. Thu thập các dữ liệu meta và chỉ thị bằng Screaming Frog
Bên cạnh đó, ứng dụng Screaming Frog còn nhiều chức năng đa dạng để thu hút người dùng khác. Hãy cùng tham khảo một số phương pháp thu thập các dữ liệu Meta và một cách tối ưu mà công cụ có nhé!
6.1. Cách xác định các trang cow tiêu đề trang dài, mô tả meta hoặc URL
Sau khi thu thập thông tin xong, hãy chuyển đến tab ”Page Titles” và lọc theo ”Over 60 Characters” để xem tiêu đề trang quá dài. Bạn có thể làm tương tự trong tab ”Meta Description” hoặc trong tab ‘URL’.
6.2. Cách tìm tiêu đề trang, mô tả meta hoặc URL trùng lặp
Sau khi thu thập thông tin xong, hãy chuyển đến tab ”Page Titles”, sau đó lọc theo ”Duplicate”. Bạn có thể làm điều tương tự trong tab ”Meta Description” hoặc ‘URL’.
6.3. Cách tìm nội dung trùng lặp và / hoặc URL cần được viết lại / chuyển hướng / chuẩn hóa
Sau khi thu thập thông tin xong, hãy chuyển đến tab ‘URL’, sau đó lọc theo ”Underscores”, ”Uppercase” hoặc ”Non ASCII Characters” để xem các URL có khả năng được viết lại thành cấu trúc chuẩn hơn. Lọc theo ”Duplicate” và bạn sẽ thấy tất cả các trang có nhiều phiên bản URL. Lọc theo ”Parameters” và bạn sẽ thấy các URL bao gồm các tham số. Ngoài ra, nếu bạn chuyển đến tab ”Internal’ tab”, hãy lọc theo ”HTML”.
Cuộn đến cột ‘Băm’ ở ngoài cùng bên phải, bạn sẽ thấy một loạt các chữ cái và số duy nhất cho mỗi trang. Nếu bạn nhấp vào ‘Xuất’, bạn có thể sử dụng định dạng có điều kiện trong Excel để đánh dấu các giá trị trùng lặp trong cột này. Cuối cùng hiển thị cho bạn các trang giống hệt nhau và cần được giải quyết.
6.4. Cách xác định tất cả các trang bao gồm chỉ thị meta, ví dụ: nofollow / noindex /ooterp / canonical, v.v.
Sau khi con nhện thu thập xong, hãy nhấp vào tab ‘ Directives’. Để xem loại chuyển hướng, chỉ cần cuộn sang bên phải để xem cột nào được lấp đầy hoặc sử dụng bộ lọc để tìm bất kỳ thẻ nào sau đây:
- index.
- noindex.
- follow.
- nofollow.
- noarchive.
- nosnippet.
- noodp.
- noydir.
- noimageindex.
- notranslate.
- unavailable_after.
- refresh.
6.5. Cách xác minh rằng tệp robots.txt của tôi đang hoạt động như mong muốn
Theo mặc định, phần mềm sẽ tuân thủ robots.txt. Như một ưu tiên, nó sẽ tuân theo các chỉ thị dành riêng cho tác nhân người dùng Screaming Frog. Nếu không có chỉ thị nào dành riêng cho tác nhân người dùng Screaming Frog, thì trình thu thập dữ liệu sẽ tuân theo bất kỳ chỉ thị nào dành cho Googlebot. Ngoài ra, trình thu thập dữ liệu sẽ tuân theo các chỉ thị chung cho tất cả các tác nhân người dùng.
Spider sẽ chỉ tuân theo một bộ lệnh. Nếu có các quy tắc được đặt riêng, phần mềm chỉ tuân theo các quy tắc đó. Nếu bạn muốn chặn một số phần nhất định của trang web, hãy sử dụng cú pháp robots.txt thông thường. Khách hàng nên sử dụng ác nhân người dùng ‘Screaming Frog SEO Spider‘. Nếu bạn muốn bỏ qua robots.txt, chỉ cần chọn tùy chọn đó trong cài đặt Cấu hình Spider. Configuration > Robots.txt > Settings
6.6. Cách tìm hoặc xác minh đánh dấu Lược đồ hoặc vi dữ liệu khác trên trang web của tôi
Để tìm mọi trang có đánh dấu Lược đồ hoặc bất kỳ vi dữ liệu nào khác, bạn cần sử dụng bộ lọc tùy chỉnh. Chỉ cần nhấp vào ‘Tùy chỉnh’ → ‘Tìm kiếm’ trong Trình đơn cấu hình và nhập dấu chân mà bạn đang tìm kiếm. Để tìm mọi trang có chứa đánh dấu Lược đồ, chỉ cần thêm đoạn mã sau vào bộ lọc tùy chỉnh: itemtype = http: //schema.org. Để tìm một loại đánh dấu cụ thể, bạn sẽ phải cụ thể hơn.
Kể từ Screaming Frog 11.0, SEO spider cũng cung cấp cho chúng tôi khả năng thu thập dữ liệu, trích xuất và xác thực dữ liệu có cấu trúc trực tiếp. Xác thực mọi dữ liệu có cấu trúc JSON-LD, Microdata hoặc RDFa theo nguyên tắc từ Schema.org và thông số kỹ thuật. Giờ đây, tab Dữ liệu có cấu trúc trong giao diện chính sẽ cho phép bạn chuyển đổi giữa các trang chứa dữ liệu.
7. View lại sơ đồ trang web thông qua Screaming Frog
Một trong những tính năng nổi bật của ứng dụng đó là View lại sơ đồ trang Web một cách chi tiết. Đọc bài viết để dễ hiểu hơn về từ khóa này nhé!
- Cách tạo Sơ đồ trang web XML
Bạn cũng có thể tạo sơ đồ trang XML bằng cách tải lên URL từ một tệp hiện có hoặc dán thủ công vào ứng dụng. Thay đổi ‘Chế độ’ từ Spider thành Danh sách và nhấp vào menu thả xuống. Tải lên để chọn một trong hai tùy chọn. Nhấn vào nút Bắt đầu và thu thập dữ liệu các URL đã tải lên. Khi các URL được thu thập thông tin, bạn sẽ thực hiện theo cùng một quy trình được liệt kê ở trên.
>>> Tìm hiểu ngay kiến thức về công cụ SEO: Google Analytics Là Gì? Cách Sử Dụng Google Analytics 2022
8. Viết lại các Url thông qua Screaming Frog
Nếu khách hàng biết đến ứng dụng thì việc viết lại các Url không còn quá khó khăn. Chỉ vài bước đơn giản người dùng đã có thể tối ưu hóa bài viết của mình một cách nhanh nhất.
8.1. Cách tìm và xóa ID phiên hoặc các thông số khác khỏi các URL được thu thập thông tin của tôi
Để xác định URL bằng id hoặc các thông số khác, khách hàng chỉ cần thu thập dữ liệu trang web của bạn với cài đặt mặc định. Khi trình thu thập thông tin hoàn tất, hãy nhấp vào tab ‘URL’ và lọc thành ‘Tham số’ để xem tất cả các URL bao gồm tham số. Bạn sẽ phải chạy lại trình thu thập thông tin với các cài đặt này để việc viết lại diễn ra.
8.2. Cách viết lại các URL được thu thập thông tin (ví dụ: thay thế .com bằng .co.uk hoặc viết tất cả các URL bằng chữ thường)
Để viết lại bất kỳ URL nào mà bạn thu thập thông tin, hãy chọn ‘Viết lại URL’ trong menu Cấu hình. Sau đó trong tab ‘Thay thế Regex’, nhấp vào ‘Thêm’ để thêm RegEx. Khi bạn đã thêm tất cả các quy tắc mong muốn, bạn có thể kiểm tra các quy tắc của mình trong tab “Kiểm tra” bằng cách nhập URL kiểm tra. ‘URL sau khi viết lại’ sẽ được cập nhật tự động theo quy tắc của bạn.
Nếu bạn muốn đặt quy tắc rằng tất cả các URL đều được trả về chữ thường, chỉ cần chọn ‘Các URL được phát hiện bằng chữ thường’ trong tab “Tùy chọn”. Điều này sẽ loại bỏ bất kỳ sự trùng lặp nào bởi các URL được viết hoa trong quá trình thu thập thông tin. Hãy nhớ rằng bạn sẽ phải thực sự chạy trình thu thập thông tin với các cài đặt này để quá trình ghi lại URL diễn ra.
9. Screaming Frog – Nghiên cứu từ khóa
Một trong những bước cơ bản của một bài chuẩn SEO là nghiên cứu từ khóa. Hãy cùng Screaming Frog tìm hiểu về cách tối ưu từ khóa tiết kiệm thời gian và thu hút đông đảo sự quan tâm nhé!
9.1. Làm thế nào để biết đối thủ cạnh tranh của tôi đánh giá cao những trang nào
Các đối thủ cạnh tranh sẽ cố gắn hướng lưu lượng truy cập đến các trang có giá trị nhất của họ bằng cách liên kết nội bộ. Bất kỳ đối thủ cạnh tranh quan tâm đến SEO nào cũng có thể sẽ liên kết đến các trang quan trọng từ blog của công ty. Tìm các trang được đánh giá cao của đối thủ cạnh tranh bằng cách thu thập dữ liệu trang web. Sau đó sắp xếp tab ‘Nội bộ’ theo cột ‘Liên kết’ từ cao nhất đến thấp nhất.
Xem trang nào có nhiều liên kết nội bộ nhất. Liên kết bên ngoài thư mục ‘trong menu Cấu hình Spider và thu thập thông tin thư mục blog / tên miền phụ. Sau đó, trong tab ‘Bên ngoài’, lọc kết quả của bạn bằng cách sử dụng tìm kiếm URL của miền chính. Cuộn sang ngoài cùng bên phải và sắp xếp danh sách theo cột ‘Liên kết’ để xem những trang nào được liên kết thường xuyên nhất.
9.2. Làm thế nào để biết đối thủ cạnh tranh của tôi đang sử dụng anchor text nào để liên kết nội bộ
Trong menu ‘Xuất hàng loạt’, hãy chọn ‘Tất cả văn bản neo’ để xuất CSV chứa tất cả văn bản liên kết trên trang web, nơi nó được sử dụng và liên kết.
10. Screaming Frog – Xây dựng liên kết (Link Building)
Trong quá trình SEO thì các chuyên gia luôn cho rằng việc xây dựng liên kết là việc quan trọng. Chính vì vậy Screaming Frog giúp khách hàng rút gọn thời gian tìm kiếm. Tuy nhiên vẫn đảm bảo chất lượng, tối ưu đối với bài viết của bạn.
10.1. Cách phân tích danh sách các vị trí liên kết tiềm năng
Nếu bạn đã cóp nhặt hoặc đưa ra danh sách các URL cần được kiểm tra. Bạn đọc có thể tải lên và thu thập thông tin chúng ở chế độ “Danh sách”. Khi trình thu thập thông tin hoàn tất, hãy kiểm tra mã trạng thái trong tab ‘Mã phản hồi’ và xem xét các liên kết đi, loại liên kết, văn bản liên kết và lệnh nofollow trong tab ‘Liên kết ngoài’ ở cửa sổ dưới cùng. Điều này sẽ cung cấp cho bạn ý tưởng về những loại trang web khác nhau.
Để xem lại tab ‘Liên kết ngoài’, hãy đảm bảo rằng URL bạn quan tâm được chọn trong cửa sổ trên cùng. Tất nhiên, bạn đọc sẽ muốn sử dụng bộ lọc tùy chỉnh. Khách hàng cũng có thể xuất danh sách đầy đủ các liên kết ngoài bằng cách nhấp vào ‘Tất cả các liên kết ngoài’ trong ‘Menu Xuất Hàng loạt’. Công tố viên với phần mềm của chính @EthanLyon và @JHTScherck của SEER.
>>> Đọc ngay: Google Trends Là Gì? 8 Bước Sử Dụng Google Xu Hướng “Hiệu Quả” Cho MARKETERS
10.2. Cách tìm các liên kết bị hỏng để có cơ hội tiếp cận
Vì vậy, bạn đã tìm thấy một trang web mà bạn muốn có một liên kết từ đó? Sử dụng Screaming Frog để tìm các liên kết bị hỏng trên trang mong muốn hoặc trên toàn bộ trang web. Sau đó liên hệ với chủ sở hữu trang web, đề xuất trang web của bạn sẽ được thay thế cho liên kết bị hỏng.
10.3. Cách xác minh các liên kết ngược của tôi và xem văn bản liên kết
Tải lên danh sách các liên kết ngược của bạn và chạy trình thu thập thông tin ở chế độ ‘Danh sách’. Sau đó, xuất danh sách đầy đủ các liên kết ra ngoài bằng cách nhấp vào ‘Tất cả các liên kết ngoài’ trong ‘Menu Xuất Nâng cao’. Điều này sẽ cung cấp cho bạn các URL và văn bản liên kết / văn bản thay thế cho tất cả các liên kết trên các trang đó. Khách hàng có thể sử dụng bộ lọc trên cột “Đích” của CSV để xác minh.
10.4. Tôi đang trong quá trình dọn dẹp các liên kết ngược của mình và cần xác minh rằng các liên kết đang bị xóa theo yêu cầu
Đặt bộ lọc tùy chỉnh chứa URL miền gốc của người dùng. Sau đó tải lên danh sách các liên kết ngược của bạn đọc và chạy trình thu thập thông tin ở chế độ ‘Danh sách’. Khi trình thu thập thông tin hoàn tất, hãy chọn tab ‘Tùy chỉnh’ để xem tất cả các trang vẫn đang liên kết với khách hàng. Bạn có biết rằng bằng cách nhấp chuột phải vào bất kỳ URL nào trong cửa sổ có thể thực hiện bất kỳ thao tác nào sau đây không?
- Sao chép hoặc mở URL.
- Thu thập lại dữ liệu URL hoặc xóa khỏi quá trình thu thập thông tin của bạn.
- Xuất Thông tin URL, liên kết trong, liên kết ngoài hoặc thông tin hình ảnh cho trang.
- Kiểm tra lập chỉ mục của trang trong Google, Bing và Yahoo.
- Kiểm tra các liên kết ngược của trang trong Majestic, OSE, Ahrefs và Blekko.
- Xem phiên bản đã lưu trong bộ nhớ cache / ngày lưu trong bộ nhớ cache của trang.
- Xem các phiên bản cũ hơn của trang.
- Xác thực HTML của trang.
- Mở tệp robots.txt cho miền có trang.
- Tìm kiếm các miền khác trên cùng một IP.
10.5. Cách chỉnh sửa dữ liệu meta
Chế độ SERP cho phép bạn xem trước các đoạn mã SERP theo thiết bị. Khách hàng có thể hiển thị trực quan cách dữ liệu meta của bạn sẽ xuất hiện trong kết quả tìm kiếm. Tải lên URL, tiêu đề và mô tả meta vào Screaming Frog bằng tài liệu CSV hoặc Excel. Nếu người dùng đã chạy thu thập thông tin cho trang web của mình, bạn có thể xuất URL bằng cách chuyển đến ‘Reports → SERP Summary’’.
Điều này sẽ dễ dàng định dạng các URL và meta bạn muốn tải lại và chỉnh sửa. Chỉnh sửa dữ liệu meta trong Screaming Frog
Xuất hàng loạt dữ liệu meta được cập nhật để gửi trực tiếp đến các nhà phát triển để cập nhật
- Mode → SERP → Upload File
11. Xem HTML gốc và HTML được hiển thị
Nếu bạn muốn so sánh HTML thô và HTML được hiển thị để xác định bất kỳ sự khác biệt nào hoặc đảm bảo nội dung quan trọng nằm trong DOM, hãy chuyển đến ‘Configuration’ → ’Spider’ –> ‘Advanced’ và nhấn HTML cửa hàng & HTML được hiển thị trong cửa hàng. Trong cửa sổ dưới cùng, bạn sẽ có thể thấy HTML thô và được kết xuất. Điều này có thể giúp xác định các vấn đề về cách trình thu thập thông tin hiển thị và xem nội dung của bạn.
Trên đây là toàn bộ thông tin chi tiết về phần mềm Screaming frog. Ứng dụng giúp khách hàng tối ưu hóa nội dung bài viết một cách nhanh nhất, tiết kiệm thời gian. SEODO hy vọng qua bài viết khách hàng sẽ có cái nhìn đa chiều hơn về các tính năng của phần mềm, để việc tối ưu hóa trở nên dễ dàng hơn. Nếu như bạn đọc còn thắc mắc nào khác liên quan đến SEO hãy liên hệ qua Website để được đội ngũ tư vấn một cách nhanh nhất nhé!
Những câu hỏi thường gặp:
Sreaming Frog là gì?
Sreaming Frog là một chương trình SEO Deskop mà bạn có thể sử dụng để thu thập dữ liệu của các trang web và thu thập dữ liệu về chứng.
Cách thu thập thông tin toàn bộ trang web qua Screaming Frog
- Cách thu thập thông tin một thư mục con
- Cách thu thập thông tin một nhóm tên miền phụ hoặc thư mục con cụ thể
- Bạn muốn có một danh sách tất cả các trang trên trang web của mình
- Cách thu thập thông tin một trang thương mại điện tử hoặc các trang web lớn khác
- Cách thu thập thông tin các trang yêu cầu xác thực
Chinh phục top Google nhờ những công cụ SEO đắc lực trong các bài viết sau đây:
- Serprobot Là Gì? Công Cụ Kiểm Tra Rank Từ Khóa Hàng Đầu
- Majestic SEO Là Gì? Tìm Hiểu 6 Tính Năng Chính Majestic
- Tổng Hợp 16 Phần Mềm SEO Web & Công Cụ SEO Tốt Nhất 2024
- Google Discover Là Gì? Sử Dụng – Tối Ưu Discover 2024
Digital Marketing