Canonical là gì? Đây có lẽ là thắc mắc của rất nhiều người khi làm website. Đối với những website lớn, vấn đề nội dung trùng lặp sẽ rất dễ gặp phải. Để giải quyết tình trạng này, một giải pháp được đưa ra đó là “định dạng thành phần liên kết”, hay còn được biết đến là Canonical Tag. Để hiểu rõ hơn hãy cùng dịch vụ SEO tổng thể website SEODO theo dõi bài viết dưới đây nhé!
>>> BẠN ĐÃ HIỂU RÕ: SEO là gì? Tất tần tật về phương pháp SEO giúp bạn gia tăng tỷ lệ chuyển đổi
1. Thẻ Canonical là gì?
Canonical là một thẻ HTML giúp khai báo cho Google biết đâu là URL chính tắc của một trang web khi có nhiều trang có nội dung trùng lặp. Quy trình này giúp Google biết được trang nào là bản gốc, từ đó ưu tiên hiển thị URL chính tắc trong kết quả tìm kiếm.
1.1. Tại sao sử dụng Canonical lại quan trọng?
- Xử lý nội dung trùng lặp:
Nội dung trùng lặp là một vấn đề phổ biến trên nhiều website, đặc biệt khi có các phiên bản trang web khác nhau (chẳng hạn như các URL với hoặc không có tham số truy vấn). Khi có nội dung trùng lặp, Google có thể không biết đâu là phiên bản chính xác, dẫn đến việc phân bổ giá trị SEO không đúng cách.
Việc sử dụng thẻ canonical giúp Google nhận diện trang chính và tránh bị phạt vì nội dung trùng lặp. - Cải thiện khả năng xếp hạng:
Trùng lặp nội dung có thể làm giảm khả năng xếp hạng của các trang web. Canonical giúp giảm thiểu sự phân tán giá trị SEO (như link juice) giữa các trang trùng lặp, tăng cường cơ hội để một URL duy nhất được Google ưu tiên và xếp hạng cao hơn. - Giảm vấn đề về Duplicate Content:
Canonical giúp ngăn chặn tình trạng Google đánh giá một website có nhiều trang trùng lặp mà không mang lại giá trị, từ đó giảm khả năng bị Google xử phạt vì vấn đề duplicate content.

1.2. Cách sử dụng thẻ Canonical?
Để sử dụng thẻ canonical, bạn chỉ cần thêm một dòng mã trong phần <head>
của trang HTML, như sau:
Cách này giúp Google biết trang nào là chính thức trong số các phiên bản trùng lặp.
Việc áp dụng canonical đúng cách giúp cải thiện SEO, giải quyết vấn đề nội dung trùng lặp, và giúp các công cụ tìm kiếm hiểu rõ hơn về trang web của bạn, từ đó tối ưu hóa khả năng xếp hạng của trang chính trong kết quả tìm kiếm.
> ĐỌC THÊM:
- Rel Nofollow Và Follow Links Các Tác Động Và Hướng Dẫn Cài Đặt
- Tuyển tập thuật ngữ SEO bạn cần update để làm SEO hiệu quả
1.3. Vai trò của Canonical trong SEO
- Chỉ định URL chính tắc cho kết quả tìm kiếm
Canonical giúp bạn chỉ định URL chính tắc mà bạn muốn công cụ tìm kiếm hiển thị trong kết quả tìm kiếm. Điều này quan trọng khi website có nhiều phiên bản trùng lặp của cùng một nội dung. Việc này giúp đảm bảo rằng người dùng sẽ luôn truy cập vào URL mà bạn muốn, thay vì bị phân tán qua các URL trùng lặp. - Hợp nhất tín hiệu SEO từ các trang trùng lặp
Canonical giúp hợp nhất các tín hiệu SEO, chẳng hạn như backlink và các chỉ số khác từ các URL trùng lặp vào URL chính tắc. Canonical sẽ giúp các tín hiệu từ các URL này được gộp lại vào một URL ưu tiên, giúp trang chính nhận được giá trị SEO tốt nhất mà không bị phân tán. - Dễ dàng theo dõi và đo lường hiệu quả
Khi bạn sử dụng thẻ canonical, các chỉ số SEO (như lưu lượng truy cập, tỷ lệ thoát, thời gian trên trang, v.v.) sẽ được tập trung vào URL chính tắc. Điều này giúp bạn dễ dàng theo dõi hiệu quả của trang mà không phải lo lắng về việc phải theo dõi từng phiên bản trùng lặp riêng biệt. Các chỉ số SEO cũng trở nên chính xác và dễ dàng phân tích hơn. - Tiết kiệm tài nguyên của Googlebot
Googlebot sẽ không phải lãng phí tài nguyên để thu thập dữ liệu các trang trùng lặp mà thay vào đó sẽ tập trung vào việc thu thập dữ liệu từ trang chính tắc, cũng như các trang mới hoặc vừa được cập nhật. Điều này giúp tăng hiệu quả thu thập dữ liệu và đảm bảo Googlebot không bỏ sót bất kỳ trang quan trọng nào của bạn, đồng thời giảm nguy cơ các trang trùng lặp làm ảnh hưởng đến hiệu suất tổng thể của website.
2. Thẻ Canonical nên dùng khi nào?

Thẻ canonical là công cụ quan trọng để xử lý các URL trùng lặp và giúp Google hiểu đâu là trang chính tắc. Để tối ưu hóa SEO, bạn cần sử dụng thẻ canonical trong các trường hợp có nhiều phiên bản URL giống nhau hoặc nội dung trùng lặp trên website.
2.1. Trang web có nhiều phiên bản khác nhau
Nếu website của bạn có các phiên bản tương tự nhưng khác nhau một chút, như phiên bản với https
và http
, hoặc phiên bản www
và non-www
, bạn nên sử dụng thẻ canonical để chỉ định URL chính tắc.
2.2. Biến thể theo khu vực
Các website phục vụ cho các khu vực khác nhau (như Amazon tại Mỹ và Vương quốc Anh) có thể có các URL khác nhau cho cùng một nội dung. Mặc dù có sự khác biệt nhỏ như giá cả và đơn vị tiền tệ, nhưng các nội dung chính như sản phẩm và mô tả sản phẩm vẫn tương tự nhau, gây ra trùng lặp nội dung.
2.3. Các thiết bị khác nhau
Khi một trang web có các phiên bản cho thiết bị di động và máy tính, nếu cả hai phiên bản đều chứa nội dung giống nhau, việc sử dụng thẻ canonical là cần thiết để tránh trùng lặp. Thẻ canonical sẽ chỉ ra rằng phiên bản dành cho máy tính là trang chính tắc, còn phiên bản di động chỉ là phiên bản thay thế.
2.4. URL động và bộ lọc
Các thao tác như tìm kiếm hoặc lọc trên trang có thể tạo ra các URL động, dẫn đến việc tạo ra nhiều phiên bản của cùng một nội dung, gây ra trùng lặp. Thẻ canonical sẽ chỉ định trang chính tắc.
2.5. Bài đăng trên nhiều danh mục
Nếu một bài viết hiển thị trên nhiều danh mục, thẻ canonical sẽ chỉ định một danh mục chính để Google ưu tiên hiển thị. Điều này giúp tránh việc có quá nhiều URL trùng lặp cho cùng một nội dung.
2.6. Biến thể ngoài ý muốn
Các trang web thử nghiệm hoặc demo có thể bị công cụ tìm kiếm thu thập và index, gây trùng lặp với các trang chính thức. Thẻ canonical sẽ giúp chỉ định trang chính thức là phiên bản cần được index.
>>> QUÀ TẶNG CHO BẠN: Hướng dẫn SEO Onpage đầy đủ nhất giúp bạn làm SEO hiệu quả
3. Tìm hiểu 5 quy tắc khi sử dụng Canonical
3.1. Quy tắc 1: Sử dụng URL tuyệt đối
Dùng URL tuyệt đối hay nói cách khác là không sử dụng URl tương đối với phần tử rel=”canonical“. Để làm được điều này, bạn nên sử dụng cấu trúc dưới đây:
<link rel=“canonical” href=“https://example.com/sample-page/” />
3.2. Quy tắc 2: Sử dụng chữ viết thường trong URL
Thông thường, các công cụ tìm kiếm của Google sẽ thực hiện việc xếp URL viết thường và viết hoa là hai link khác nhau. Do đó, để có một Canonical Tag chuẩn, bạn nên sử dụng URL viết thường trên các website của mình.

3.3. Quy tắc 3: Sử dụng phiên bản miền HTTPS hoặc HTTP
Khi sử dụng Canonical Tag, nếu đã chuyển qua SSL (nghĩa là HTTP) thì hãy chắc chắn bạn không thông báo bất kỳ URL nào không phải là SSL. Bởi việc làm này về mặt lý thuyết sẽ khiến các công cụ nhầm lẫn và kết quả xếp hạng website thấp. Để áp dụng quy tắc này, các secure domain cần dùng phiên bản URL dưới đây:
<link rel=“canonical” href=“https://example.com/sample-page/” />.
Mặt khác, nếu bạn không sử dụng HTTPS thì nên dùng dạng URL sau:
<link rel=“canonical” href=“http://example.com/sample-page/” />
3.4. Quy tắc 4: Sử dụng Canonical Tag tự tham chiếu
Mặc dù Google không bắt buộc sử dụng Canonical Tag tự tham chiếu, nhưng dùng thẻ cũng là sự lựa chọn không tồi. Bởi việc này sẽ giúp các công cụ tìm kiếm hiểu được những trang mà bạn muốn index hoặc link sẽ có cấu trúc như thế nào khi được index.

Nói cách khác, tự tham chiếu là sử dụng Canonical trên một trang mà trỏ link tới chính trang đó. Đa số các CMS hiện đại thường tự động thêm URL tự tham chiếu. Bên cạnh đó, đối với các CMS tùy chỉnh thì bạn cần sự trợ giúp của các nhà phát triển web hardcode.
>>> TÌM HIỂU SÂU HƠN VỀ: Google index là gì? Cách giúp Google index nhanh trong thời kỳ update thuật toán liên tục
3.5. Quy tắc 5: Sử dụng 1 Canonical Tag cho mỗi trang
Bạn chỉ nên dùng một Canonical Tag cho mỗi trang. Bởi vì nếu có nhiều thẻ trong một trang thì các công cụ của google sẽ bỏ qua hết. Dưới đây là những cách để xác định link chính với những tín hiệu chuẩn hóa:
- HTML Tag
- HTTP Header
- Sitemap
- 301 Redirect
- Liên kết nội bộ (Internal links)
4. Tạo Canonical nhanh chóng với Yoast SEO
Sử dụng Yoast SEO sẽ giúp bạn tạo Canonical một cách nhanh chóng và đơn giản. Đối với những website được viết trên WordPress, việc tạo thẻ sẽ được thực hiện qua các bước sau đây:
- Bước 1: Cài đặt Plugins Yoast SEO.
- Bước 2: Sửa hoặc thêm bài viết mới (áp dụng cho các trang/danh mục/tags).

5. Kiểm tra trang web được cài đặt thẻ Canonical hay chưa?
Sau khi thêm thẻ Canonical thường xảy ra những lỗi như trỏ chính tắc vào một URL bị ngăn chặn bởi robots.txt (hay noindex). Điều này khiến các công cụ tìm kiếm của Google khó hiểu bởi những tín hiệu hỗn hợp. Do đó, bạn nên kiểm tra thẻ Canonical bằng cách sau đây:
5.1. Cách 1: Kiểm tra lại nguồn trang
Đa số các trình duyệt, để xem nguồn trang (View Page Source) bạn chỉ cần nhấp chuột phải hoặc ghi vào thanh địa chỉ theo cấu trúc sau: view-source:https://domain.com. Sau khi truy cập xong, TAB mã nguồn của trang sẽ hiển thị. Tiếp theo, bạn chỉ cần tìm kiếm thẻ chuẩn trong <head>. Nếu có mã nguồn thì sẽ hiện đường link như hình sau:

5.2. Cách 2: Kiểm tra bằng công cụ Mozbar, SeoQuake…
Hiện nay, có nhiều công cụ có thể giúp bạn kiểm tra Canonical Tag. Trong đó, Mozbar và SeoQuake là 2 công cụ được sử dụng phổ biến nhất. Bởi hai ứng dụng này hoàn toàn sử dụng miễn phí.
6. Những lỗi thường gặp khi dùng Rel Canonical là gì?
Khi đặt thẻ Rel Canonical trong SEO, bạn sẽ thường gặp phải một số lỗi phổ biến. Để tránh và khắc phục được những vấn đề này, bạn cần biết những điều sau:
6.1. Sử dụng Canonical với phần phân trang
Khi dùng Rel Canonical trong SEO, bạn có thể gặp lỗi sử dụng Canonical với phần phân trang. Ví dụ, bạn có một bài viết nhưng được chia làm nhiều trang như sau:
- example.com/article?story=cupcake-news&page=1
- example.com/article?story=cupcake-news&page=2
- …
Vì các trang cùng thuộc 1 bài viết nên bạn sẽ nhầm lẫn các URLs này có nội dung tương tự nhau. Tuy nhiên, các nội dung này lại hoàn toàn riêng lẻ.

Để khắc phục lỗi này, có 2 cách như sau: Trỏ Rel=Canonical của trang 1, 2… về trang có đủ nội dung hoặc dùng lệnh rel=”next” and rel=”prev”.
6.2. Lỗi sai khi viết URL tuyệt đối thành URL tương đối
Theo hình ảnh, dòng URL có màu đỏ là sai. Vì không có http:// thì URL sẽ được đánh giá là link tương đối. Khi viết ở dạng link tuyệt đối URL sẽ là: http://example.com/example.com/cupcake.html. Việc sử dụng link tương đối có thể khiến công cụ tìm kiếm loại bỏ lệnh rel=canonical. Do đó bạn hãy dùng URL tuyệt đối.

6.3. Gắn nhiều thẻ Canonical
Lỗi này thường xảy ra khi website của bạn sử dụng nhiều plugin SEO khác nhau. Điều này khiến việc khai báo nhiều Canonical Tag khác nhau cho trang. Do đó, các công cụ tìm kiếm lúc này sẽ bỏ qua các thẻ được thiết lập.
6.4. Gắn Canonical Tag trong phần <body>
Gắn Canonical Tag trong phần <body> rất dễ bị vô hiệu hóa. Vì vậy bạn nên thiết lập Rel=Canonical Tag càng gần phần <head> càng tốt.

6.5. Thông báo gây lẫn lộn
Thông báo gây lẫn lộn là lỗi thường gặp nhất khi thiết lập Canonical Tag. Cụ thể là khai báo các thẻ chồng chéo hoặc thành 1 vòng lặp gây hiểu lầm cho các công cụ tìm kiếm. Dẫn đến google sẽ bỏ qua Canonical. Vì vậy, bạn cần gửi tín hiệu cụ thể, rõ ràng hay có thể buộc các công cụ tìm kiếm đưa lựa chọn sai.

7. Những lưu ý khi sử dụng thẻ Canonical là gì?
7.1.Chủ động chuẩn hóa cho trang chủ
Các bản sao của trang chủ có thể xuất hiện do nhiều yếu tố như A/B testing hoặc UTM tracking, điều này có thể dẫn đến việc công cụ tìm kiếm gặp khó khăn trong việc xác định trang chính tắc. Vì vậy, bạn cần đảm bảo rằng thẻ Canonical trên trang chủ được thiết lập chính xác để tránh các sự cố không mong muốn. Đảm bảo thẻ Canonical trỏ về URL chính thức của trang chủ giúp công cụ tìm kiếm hiểu được đâu là trang chính tắc.
7.2. Tránh khai báo thẻ Canonical chồng chéo
Khi thiết lập thẻ Canonical, bạn cần chú ý không khai báo chồng chéo giữa các trang. Ví dụ, nếu bạn gắn Canonical từ trang A sang trang B, đồng thời lại chỉ định thẻ Canonical từ B về A, công cụ tìm kiếm sẽ không thể hiểu được đâu là trang chính tắc. Điều này có thể dẫn đến việc bỏ qua thẻ Canonical hoặc index sai trang.
7.3. Không nên thiết lập trang không đủ điều kiện index
Một trang được chỉ định làm chính tắc qua thẻ Canonical cần đảm bảo rằng nó đủ điều kiện để được index. Nếu trang đó không thể được công cụ tìm kiếm index (chẳng hạn, vì có tệp robots.txt
ngăn chặn hoặc bị cấm), việc sử dụng thẻ Canonical sẽ trở nên vô nghĩa. Đảm bảo rằng trang bạn chỉ định là chính tắc có thể được công cụ tìm kiếm lập chỉ mục.
7.4. Không nên thiết lập nhiều thẻ Canonical trên cùng một trang
Việc sử dụng nhiều thẻ Canonical trên một trang là một lỗi phổ biến, đặc biệt khi website sử dụng nhiều plugin SEO khác nhau. Điều này sẽ khiến công cụ tìm kiếm không biết đâu là thẻ Canonical chính xác và bỏ qua tất cả các thẻ này. Bạn chỉ nên sử dụng một thẻ Canonical duy nhất trên mỗi trang để đảm bảo rằng công cụ tìm kiếm hiểu rõ đâu là trang chính tắc cần được ưu tiên index.
7.5. Các lưu ý bổ sung quan trọng
- Khai báo URL tuyệt đối thay vì URL tương đối: Để tránh các vấn đề về thu thập dữ liệu không chính xác, bạn nên sử dụng URL tuyệt đối (ví dụ:
https://seongon.com/dich-vu/seo
) thay vì URL tương đối (dich-vu/seo
). - Cẩn trọng khi sử dụng Canonical với các trang phân trang: Nếu bạn sử dụng thẻ Canonical cho tất cả các trang phân trang và chỉ định trang đầu tiên là chính tắc, điều này có thể làm mất giá trị SEO của các trang phụ và giảm khả năng lập chỉ mục của các trang này. Thay vào đó, bạn nên sử dụng thuộc tính
rel="next"
vàrel="prev"
để chỉ ra mối quan hệ giữa các trang phân trang hoặc chỉ định thẻ Canonical riêng biệt cho từng trang. - Lưu ý về các trang có nhiều ngôn ngữ: Nếu trang web của bạn có nhiều phiên bản ngôn ngữ, hãy chỉ định trang chính tắc phù hợp với ngôn ngữ của người dùng hoặc sử dụng thẻ
hreflang
để thông báo về các phiên bản ngôn ngữ khác nhau của trang. - Gắn liên kết trong trang web đến URL chính tắc: Việc liên kết đến URL chính tắc từ các trang khác trong website sẽ giúp Google hiểu rõ lựa chọn ưu tiên của bạn.
SEODO hy vọng qua bài viết trên bạn đọc có thể giải đáp được thắc mắc “canonical là gì?” và biết được những quy tắc khi sử dụng thẻ canonical. Hãy áp dụng những kiến thức này trong việc SEO để nâng cấp website của bạn nhé. Cảm ơn bạn đã đọc bài viết!
Chinh phục top Google nhờ những phương pháp SEO kỹ thuật trong các bài viết sau đây:
- Snippet là gì? 6 bước tối ưu Features Snippet cho website
- AMP là gì? Hướng dẫn cài đặt và tối ưu AMP updated 2023
- Pagination là gì? 9 Mẹo để phân trang cực hiệu quả trong SEO 2023
- File robots.txt là gì? 3 cách tạo robots.txt chuẩn SEO 2023