Canonical là gì?
Canonical hay thẻ Canonical (rel=”canonical”) là một đoạn mã HTML được đặt trong phần <head> của trang web, dùng để khai báo với Google và các công cụ tìm kiếm rằng một URL cụ thể là phiên bản “chính” hoặc “chuẩn” (URL chính tắc) trong số các trang có nội dung giống hệt hoặc rất giống nhau.
Mục đích của quy trình này là giúp Google ưu tiên hiển thị và xếp hạng URL chính tắc đó trên công cụ tìm kiếm, đồng thời loại bỏ sự trùng lặp nội dung – một yếu tố có thể làm giảm khả năng xếp hạng của website.
Ví dụ: Cùng một nội dung về “Core web vitals là gì” nhưng được đăng trên hai danh mục khác nhau, tạo ra hai URL riêng biệt:
- https://foogleseo.com/blog/technical-seo/core-web-vitals-la-gi.html
- https://foogleseo.com/blog/seo-ux/core-web-vitals-la-gi.html

Khi bạn sử dụng Canonical để chỉ định một trong hai URL này là trang chính tắc trang bạn muốn ưu tiên hiển thị, Google sẽ tập trung vào trang đó trên kết quả tìm kiếm cho người dùng.
Cấu trúc một thẻ Canonical cơ bản sẽ trông như sau:
<link rel=”canonical” href=”URL tuyệt đối của trang chính” />
Trong đó, href sẽ chứa URL tuyệt đối của trang chính tắc mà bạn muốn công cụ tìm kiếm ưu tiên.
Vai trò của thẻ canonical trong SEO
Việc không sử dụng thẻ Canonical đúng cách có thể gây ra những hậu quả nghiêm trọng cho nỗ lực SEO của bạn. Ngược lại, việc áp dụng Canonical đúng sẽ mang lại nhiều lợi ích thiết thực.
- Giải quyết vấn đề Nội dung trùng lặp (Duplicate Content): Đây là lợi ích lớn nhất của thẻ Canonical. Nội dung trùng lặp là một vấn đề phổ biến và có thể khiến Google gặp khó khăn trong việc xác định phiên bản chính xác của trang, dẫn đến việc phân bổ giá trị SEO không đúng cách. Thẻ Canonical giúp Google nhận diện trang chính và tránh các hình phạt liên quan đến nội dung trùng lặp.
- Hợp nhất tín hiệu SEO và sức mạnh xếp hạng: Công cụ tìm kiếm sẽ kết hợp các tín hiệu và sức mạnh SEO (như PageRank, backlink) từ những URL trùng lặp về một URL ưu tiên. Điều này giúp tối đa hóa sức mạnh và tăng cơ hội xếp hạng cho URL chuẩn đó, thay vì làm phân tán sức mạnh này ra nhiều URL khác nhau.
- Dễ dàng theo dõi các chỉ số của một trang: Khi hợp nhất các URL trùng lặp về một URL chính tắc, bạn sẽ chỉ cần theo dõi các chỉ số SEO (lưu lượng truy cập, tỷ lệ thoát, thời gian trên trang) của trang chính tắc đó. Điều này giúp việc theo dõi và phân tích dữ liệu trở nên chính xác và đơn giản hơn.
- Tiết kiệm tài nguyên thu thập dữ liệu của Googlebot: Googlebot sẽ tránh lãng phí thời gian thu thập dữ liệu trên các trang có nội dung trùng lặp hoặc gần giống nhau. Thay vào đó, bot sẽ tập trung vào việc khai thác tối đa trang web của bạn, thu thập dữ liệu từ các trang mới hoặc vừa được cập nhật, giúp tăng hiệu quả thu thập dữ liệu tổng thể và đảm bảo Googlebot không bỏ sót trang quan trọng nào.
- Kiểm soát cách nội dung xuất hiện trên Google: Canonical giúp bạn chỉ định URL mà bạn muốn hiển thị cho người dùng trong kết quả tìm kiếm. Bạn có thể đảm bảo rằng URL gọn gàng, đẹp đẽ của mình sẽ xuất hiện, thay vì một URL dài với các tham số không cần thiết.

6 trường hợp nên sử dụng thẻ canonical
Thẻ Canonical là công cụ quan trọng để xử lý các URL có nội dung trùng lặp trên website. Dưới đây là 6 trường hợp điển hình mà các SEOer cần nắm vững để tối ưu hóa SEO.
- Trang web có nhiều phiên bản khác nhau: Khi website của bạn có các phiên bản gần như tương tự nhưng khác biệt nhỏ, bạn nên sử dụng Canonical. Ví dụ, các phiên bản có hoặc không có HTTPS (https://foogle.com và https://foogle.com), hoặc có/không có www (https://www.https://foogle.com và https://https://foogle.com). Nên chọn phiên bản HTTPS và non-www để tối ưu.
- Biến thể theo khu vực: Các website phục vụ cho các thị trường khác nhau có thể có nội dung cốt lõi giống nhau, dù URL và một số yếu tố như giá cả, tiền tệ khác biệt. Ví dụ như amazon.com (Mỹ) và amazon.co.uk (Vương quốc Anh).
- Các thiết bị khác nhau: Một trang web có thể có các phiên bản riêng biệt cho thiết bị di động và máy tính, nhưng cả hai đều chứa nội dung giống nhau. Điều này gây trùng lặp nội dung. Trong trường hợp này, phiên bản dành cho máy tính thường được xem là URL chính tắc, và phiên bản di động là phiên bản thay thế. Bạn có thể thiết lập URL chính tắc là phiên bản máy tính cho trang di động, và ngược lại, trên phiên bản máy tính, thiết lập URL chính tắc là chính nó, kèm theo rel=”alternate” trỏ đến phiên bản di động.
- URL động, bộ lọc: Khi người dùng thực hiện các thao tác như sắp xếp hoặc lọc sản phẩm trên một trang danh mục, các hàm website có thể tạo ra nhiều phiên bản URL khác nhau của cùng một nội dung (ví dụ: https://https://foogle.com/?s=adword hoặc. Điều này gây ra nội dung trùng lặp và cần Canonical về trang gốc.
- Bài đăng trên nhiều danh mục: Một bài viết hiển thị trên nhiều danh mục sẽ tạo ra các URL tương ứng với số lượng danh mục đó. Trường hợp này cần Canonical về một danh mục chính mà bạn muốn Google hiển thị.
- Biến thể ngoài ý muốn: Đôi khi, các trang web demo hoặc trang thử nghiệm vô tình được các công cụ tìm kiếm thu thập dữ liệu và lập chỉ mục. Những trang này chứa nội dung trùng lặp với phiên bản chính của website (ví dụ: https://staging.foogleseo.com và https://foogleseo.com), và cần Canonical về phiên bản website chính.
Các phương pháp thiết lập trang chính tắc
Bên cạnh thẻ Canonical, các chuyên viên SEO còn có thể sử dụng một vài phương thức khác để Google Search lựa chọn URL chính tắc. Việc kết hợp thẻ Canonical và các phương pháp khác có thể tăng hiệu quả trong việc lựa chọn URL chính tắc hiển thị khi tìm kiếm.
Dưới đây là các phương pháp chính để chỉ định một URL chuẩn, được sắp xếp từ tác động mạnh nhất đến yếu nhất:
1. Thêm thẻ rel=”canonical” trong phần <head> của HTML:
- Đây là phương pháp thông dụng và được khuyến khích nhất cho các trang HTML.
- Bạn chỉ cần thêm đoạn mã <link rel=”canonical” href=”URL tuyệt đối của trang chính” /> vào bên trong cặp thẻ <head>…</head> của các trang trùng lặp. Thay vào đó, bot sẽ tập trung vào các trang mới hoặc vừa được cập nhật, giúp đảm bảo quá trình Google index diễn ra hiệu quả và không bỏ sót trang quan trọng nào.
Lưu ý quan trọng: Trang chuẩn cũng nên có một thẻ Canonical trỏ về chính nó (self-referencing canonical) để khẳng định với Google rằng “đây chính là phiên bản gốc”.
Đối với website WordPress, việc này có thể thực hiện dễ dàng bằng cách cài đặt và sử dụng plugin Yoast SEO. Với website code tay, bạn cần thêm phần tử này vào đoạn mã của từng trang URL.

2. Sử dụng canonical trong HTTP Header:
Phương pháp này hữu ích cho các tệp không phải HTML như tài liệu PDF, file Word, hoặc hình ảnh. Khi người dùng truy cập vào URL của tệp, máy chủ sẽ trả về một phản hồi trong HTTP Header để chỉ định URL chuẩn.
Ví dụ: Link: <http://www.example.com/white-dresses.pdf>; rel=”canonical”.

3. Đưa vào sơ đồ trang web (Sitemap):
Mặc dù không phải là một tín hiệu mạnh như hai cách trên, việc chỉ bao gồm các URL chuẩn (canonical URLs) trong Sitemap.xml của bạn là một thực hành tốt. Điều này giúp Google hiểu rõ cấu trúc website và những trang nào bạn coi là quan trọng nhất để thu thập dữ liệu.

4. Lệnh chuyển hướng (301 Redirect)
Chuyển hướng vĩnh viễn (301) là một phương pháp mạnh mẽ để chuyển hướng HOÀN TOÀN một hoặc nhiều URL nhất định sang URL chuẩn. Phương pháp này chỉ nên sử dụng khi bài viết hoặc trang chuyển hướng không còn giá trị và bạn không muốn URL cũ tồn tại nữa.
Phân biệt với Canonical: rel=”canonical” dùng khi bạn muốn giữ cả hai phiên bản trang tồn tại và cho người dùng truy cập được, nhưng chỉ muốn Google index một phiên bản. 301 Redirect dùng khi bạn muốn vĩnh viễn chuyển hướng người dùng và công cụ tìm kiếm từ một URL cũ sang một URL mới.

Quy tắc quan trọng khi sử dụng canonical
Để tối ưu hiệu quả dự án SEO, các SEOer cần hết sức lưu ý các quy tắc và tránh những sai lầm phổ biến khi sử dụng thẻ Canonical.
1. Luôn sử dụng URL tuyệt đối thay vì tương đối:
Khi khai báo thẻ Canonical, hãy dùng URL tuyệt đối, tức là URL đầy đủ bao gồm cả giao thức (http:// hoặc https://) và tên miền. Việc sử dụng URL tương đối (ví dụ: dich-vu/seo thay vì https://foogle.com/dich-vu/seo) có thể gây ra vấn đề và khiến công cụ tìm kiếm bỏ qua thẻ Canonical hoặc thu thập dữ liệu không chính xác.
2. Sử dụng chữ viết thường trong URL:
Các công cụ tìm kiếm có thể xem URL viết thường và viết hoa là hai liên kết khác nhau. Để Canonical Tag chuẩn, bạn nên sử dụng URL viết thường trên website của mình.
3. Ưu tiên phiên bản HTTPS:
Nếu website của bạn đã chuyển sang HTTPS (có chứng chỉ SSL), hãy đảm bảo rằng bạn chỉ định URL chính tắc là phiên bản HTTPS. Việc thông báo một URL không phải SSL có thể gây nhầm lẫn cho công cụ tìm kiếm và ảnh hưởng đến thứ hạng.
1. Sử Dụng Canonical Tag Tự Tham Chiếu (Self-referencing canonical):
Mặc dù Google không bắt buộc, việc sử dụng thẻ Canonical trỏ về chính trang đó (trang chuẩn cũng có thẻ Canonical trỏ về chính nó) là một thực hành tốt. Điều này giúp các công cụ tìm kiếm hiểu rõ những trang mà bạn muốn lập chỉ mục và cấu trúc chúng sẽ như thế nào khi được lập chỉ mục.
2. Chỉ Dùng Một Thẻ Canonical Cho Mỗi Trang:
Đây là một lỗi phổ biến, đặc biệt khi website sử dụng nhiều plugin SEO khác nhau, dẫn đến việc khai báo nhiều thẻ Canonical khác nhau cho cùng một trang. Khi đó, công cụ tìm kiếm sẽ không biết đâu là thẻ Canonical chính xác và bỏ qua tất cả các thẻ được gắn. Bạn chỉ nên sử dụng một thẻ Canonical duy nhất trên mỗi trang.
3. Thận Trọng Với Trang Phân Trang (Pagination):
- Việc áp dụng thẻ Canonical trên tất cả các trang phân trang (ví dụ /page/1/, /page/2/) và chỉ định URL của trang đầu tiên là URL chuẩn là một sai lầm phổ biến.
- Điều này thông báo cho công cụ tìm kiếm rằng tất cả các trang phân trang là trùng lặp và chỉ trang đầu tiên là trang chính, dẫn đến việc mất giá trị SEO của các trang phụ và giảm khả năng lập chỉ mục của chúng.
Giải pháp: Thay vì Canonical về trang đầu tiên, bạn nên sử dụng thuộc tính rel=”next” và rel=”prev” để thông báo mối quan hệ giữa các trang phân trang theo thứ tự. Hoặc, chỉ định thẻ Canonical riêng biệt cho từng trang, đảm bảo mỗi trang được lập chỉ mục và đánh giá riêng lẻ dựa trên nội dung.
4. Không Thiết Lập Trang Không Đủ Điều Kiện Index:
Hãy đảm bảo rằng trang được chỉ định chính tắc bằng thẻ Canonical phải đủ điều kiện để được lập chỉ mục (indexable). Nếu trang đó bị chặn bởi robots.txt hoặc bị thiết lập noindex, việc sử dụng thẻ Canonical sẽ trở nên vô nghĩa, vì Google không thể hiển thị URL bạn mong muốn.
5. Tránh Khai Báo Chồng Chéo Hoặc Vòng Lặp:
Không nên gắn Canonical từ trang A sang trang B, đồng thời lại chỉ định thẻ Canonical từ B về A. Điều này sẽ khiến công cụ tìm kiếm bối rối và bỏ qua thẻ, hoặc tệ hơn là chọn sai trang chính tắc.
6. Gắn Canonical Trong Phần <head>:
Thẻ Canonical phải được đặt trong phần <head> của mã HTML. Nếu bạn đặt nó trong phần <body>, thẻ rất dễ bị vô hiệu hóa và công cụ tìm kiếm sẽ bỏ qua.
7. Gắn Liên Kết Nội Bộ Đến URL Chính Tắc:
Việc liên kết từ các trang khác trong website đến URL chính tắc sẽ giúp Google biết được lựa chọn ưu tiên của bạn.
Lưu ý các trang có nhiều ngôn ngữ:
Nếu website của bạn có nhiều phiên bản ngôn ngữ khác nhau, hãy chỉ định trang chính tắc cùng ngôn ngữ hoặc sử dụng thẻ hreflang để thông báo về các phiên bản ngôn ngữ thay thế phù hợp.
Cách kiểm tra thẻ canonical đã thiết lập
Sau khi thiết lập thẻ Canonical, việc kiểm tra lại là rất quan trọng để đảm bảo hiệu suất dự án SEO và tránh các lỗi phổ biến. Bạn cần kiểm tra xem thẻ Canonical của trang đã chuẩn chưa và URL chuẩn có thể thu thập dữ liệu và lập chỉ mục không.
Dưới đây là một số cách để kiểm tra:
Kiểm Tra Nguồn Trang (View Page Source): Đây là cách kiểm tra thủ công nhưng hiệu quả.
- Bước 1: Truy cập trang cần kiểm tra.
- Bước 2: Bấm chuột phải vào trang và chọn “View Page Source” (hoặc nhấn Ctrl + U trên Windows, Cmd + Option + U trên Mac).
- Bước 3: Sau khi mã nguồn hiển thị, tìm kiếm (Ctrl+F) từ khóa “canonical” trong phần <head> để đảm bảo thẻ đã được khai báo chính xác và chuẩn.

Sử Dụng Công Cụ SEO Chuyên Dụng:
- Google Search Console (GSC) – Công cụ kiểm tra URL (URL Inspection Tool): Dán URL của bạn vào công cụ này. Google sẽ cho bạn biết “URL do người dùng khai báo là chuẩn” là gì, giúp bạn xác nhận lựa chọn của mình.
- SeoQuake và Mozbar: Đây là hai công cụ SEO miễn phí phổ biến có thể giúp bạn kiểm tra thẻ Canonical nhanh chóng trên từng trang.
- Screaming Frog: Công cụ này giúp bạn kiểm tra các thẻ rel=”canonical” trên toàn bộ website, phát hiện các lỗi như: Canonical thiếu hoặc không hợp lệ, Canonical chỉ đến URL không tồn tại (404) hoặc bị chuyển hướng (redirect), hoặc đặt nhiều thẻ Canonical trên một trang. Các công cụ khác như Ahrefs’ Site Audit hay SEMrush Site Audit cũng có thể thực hiện tương tự.
Câu hỏi thường gặp (FAQs)
Kết luận
Tóm lại, việc hiểu rõ thẻ canonical là gì? không chỉ dừng lại ở định nghĩa, mà là nắm vững một công cụ SEO chiến lược. Bằng cách triển khai chính xác thẻ rel=”canonical”, bạn sẽ hợp nhất được sức mạnh xếp hạng, giải quyết triệt để vấn đề nội dung trùng lặp và kiểm soát cách Google nhìn nhận website, từ đó tối ưu thứ hạng một cách hiệu quả và bền vững.Nếu bạn cảm thấy việc triển khai các kỹ thuật này phức tạp, dịch vụ technical SEO của chúng tôi luôn sẵn sàng hỗ trợ để đảm bảo website của bạn được tối ưu một cách chuyên nghiệp và bền vững nhất.