SEO rất quan trọng đối với mọi website và một cửa hàng trực tuyến cũng không ngoại lệ. Các URL hợp quy đóng một vai trò quan trọng trong việc đảm bảo rằng trang web của khách hàng của bạn không bị công cụ tìm kiếm phạt. Chúng đảm bảo rằng các công cụ tìm kiếm không bị nhầm lẫn khi các URL khác nhau trỏ đến cùng một nội dung hoặc website và có thể giúp thông báo những URL nào có nội dung giống hệt nhau hoặc rất giống nhau.
Cho dù bạn đã quen thuộc với canonical URL hay bạn chưa từng thấy thuật ngữ rel = “canonical” trước đây, thì bài viết này sẽ giải nén các chi tiết bạn cần biết, để cửa hàng trực tuyến của khách hàng của bạn đang trên đường được tối ưu hóa hoàn toàn cho công cụ tìm kiếm.
Canonical URL là gì?
Canonical URL đề cập đến phần tử liên kết HTML, với thuộc tính rel = “canonical” (còn được gọi là thẻ canonical), được tìm thấy trong phần tử của website khách hàng của bạn. Nó chỉ định cho các công cụ tìm kiếm URL ưa thích của họ. Điều đó có nghĩa là phần tử canonical URL thông báo cho Google và các công cụ tìm kiếm khác thu thập thông tin một website và URL nào để lập chỉ mục nội dung của trang cụ thể đó.
Điều này rất quan trọng vì URL có thể có các biến thể, dựa trên nhiều yếu tố khác nhau, nhưng đang cung cấp nội dung giống nhau hoặc tương tự. Đặc điểm kỹ thuật đã xuất hiện trực tuyến vào tháng 4 năm 2012 và được mô tả trong RFC 6596.
“Điều đó có nghĩa là phần tử canonical URL thông báo cho Google và các công cụ tìm kiếm khác thu thập thông tin một website và URL nào để lập chỉ mục nội dung của trang cụ thể đó.”
Lấy ví dụ về các URL sau:

Mỗi URL đề cập đến cùng một nội dung trang chủ cho website áo thun ưa thích, tuy nhiên bản thân các URL này hơi khác nhau. Đây có thể là một vấn đề đối với các công cụ tìm kiếm, vì bản thân công cụ không nhất thiết phải biết trang nào nên là nguồn sự thật và nó có thể chỉ chọn một canonical URL theo thuật toán cho bạn.
Nói cách khác, nếu bạn có một website có thể truy cập bằng nhiều URL hoặc các trang khác nhau có nội dung tương tự (ví dụ: phiên bản dành cho thiết bị di động và máy tính để bàn riêng biệt), bạn nên chỉ định cho công cụ tìm kiếm URL nào là có thẩm quyền cho trang đó.
Tại sao URL canonical lại quan trọng?
Chúng giúp chỉ định URL nào bạn muốn mọi người nhìn thấy trong kết quả tìm kiếm
Bạn có thể muốn mọi người truy cập trang sản phẩm áo phông xanh của bạn qua:

Thay vì:

Sử dụng quy tắc chuẩn có thể giúp bạn giữ mọi thứ tường minh hơn.
Chúng đơn giản hóa các chỉ số theo dõi cho một sản phẩm/chủ đề duy nhất
Khi có nhiều URL, việc lấy số liệu tổng hợp cho một phần nội dung cụ thể trở nên khó khăn hơn. Các URL hợp quy giúp mọi thứ đơn giản và có tổ chức, đặc biệt là khi báo cáo hiệu suất cho khách hàng của bạn.
Canonical URL hợp nhất các tín hiệu liên kết cho các trang tương tự hoặc trùng lặp
URL hợp quy giúp các công cụ tìm kiếm hợp nhất thông tin mà chúng có cho các URL riêng lẻ (chẳng hạn như các liên kết đến chúng) thành một URL duy nhất, có thẩm quyền. Ngoài ra, nếu bạn cung cấp nội dung của mình để xuất bản trên các tên miền khác, canonical URL sẽ giúp củng cố xếp hạng trang với URL ưa thích của bạn.
Nói cách khác, nội dung tương tự hoặc trùng lặp trên các trang web sẽ không phải cạnh tranh về lưu lượng truy cập/xếp hạng trong các công cụ tìm kiếm.
Cách sử dụng Canonical URL hiệu quả

Tập trung vào các URL chuẩn chủ yếu thuộc danh mục SEO Onpage hơn là SEO Offpage (mặc dù bạn nên theo dõi chiến lược chuyển hướng tổng thể của mình ở đâu đó). Ngoài việc sử dụng rel = “canonical”, có nhiều cách để chuẩn hóa URL. Trong hầu hết các trường hợp, rel = “canonical” là cách được khuyến nghị để hợp nhất nội dung trùng lặp cho các công cụ tìm kiếm, tuy nhiên, đây là một vài cách chuẩn hóa khác cần xem xét.
Sử dụng chuyển hướng 301
Chuyển hướng 301 là mã trạng thái cho Google hoặc các công cụ tìm kiếm khác biết rằng bạn muốn tạo chuyển hướng vĩnh viễn từ URL này sang URL khác. Chuyển hướng 301 đưa khách truy cập và công cụ tìm kiếm đến một URL khác với URL mà họ yêu cầu ban đầu trong trình duyệt của họ hoặc nhấp vào từ trang kết quả tìm kiếm. Các chuyển hướng này cũng liên kết các URL khác nhau với nhau, để các công cụ tìm kiếm xếp hạng tất cả các địa chỉ dựa trên cơ quan quản lý miền từ các liên kết đến.
Sử dụng các thông số trong Google Search Console
Trong Google Search Console, bạn có thể tìm thấy tùy chọn để đặt thông số URL, sau khi trang web của bạn được xác minh. Điều này mang lại cho bạn khả năng cho Google biết những tham số nào bạn muốn coi là bị động.
Điều này có nghĩa là bạn có thể nói với Google rằng “Bất cứ khi nào bạn nhìn thấy thông số URL này, hãy xử lý nó như thể nó không tồn tại”. Có một hướng dẫn tuyệt vời về cách đặt các tham số bị động bằng công cụ tham số URL trong Google Search Console.
Sử dụng hashtag cho vị trí
Còn được gọi là số nhận dạng phân đoạn, URL phân đoạn là URL có dấu # ở cuối để chỉ định một phần cụ thể trên một trang (thường chuyển đến một id khớp với tên của số nhận dạng phân đoạn).
Một hashtag có thể tồn tại trong URL và Google, cùng với các công cụ tìm kiếm khác, sẽ coi nó là một URL duy nhất. Điều này có nghĩa là nội dung nhảy vọt đó sẽ không được xếp hạng khác và do đó không được lập chỉ mục khác. Về cơ bản, nó sẽ được chuẩn hóa cho cùng một URL.
Những điều cần lưu ý khi sử dụng canonical URL
Khi làm SEO và chuẩn hóa, điều quan trọng là phải hiểu đầy đủ các tác động của nó đối với xếp hạng tìm kiếm. Những điều này có thể tốt và xấu, nhưng để tránh những điều tồi tệ, tôi đã tổng hợp một số điều cần lưu ý khi sử dụng canonical URL.
Canonical URL hay chuyển hướng 301?
Theo chuyên gia SEO Joost de Valk tại Yoast, “Nếu không có lý do kỹ thuật nào để không thực hiện chuyển hướng, bạn nên thực hiện chuyển hướng luôn. Nếu bạn không thể chuyển hướng vì điều đó sẽ phá vỡ trải nghiệm người dùng hoặc có vấn đề, hãy đặt một canonical URL”.
Không chặn Google thu thập dữ liệu các URL cụ thể
Bạn có thể sử dụng robots.txt để cho Google biết những trang nào không cho phép, về cơ bản những trang nào nên thu thập thông tin và không nên thu thập thông tin.
Tuy nhiên, đây là vấn đề khi nói đến nội dung trùng lặp. Điều này là do về cơ bản bạn đang yêu cầu Google không xem một trang cụ thể, do đó Googlebot hoàn toàn không thu thập dữ liệu hoặc lập chỉ mục trang, có nghĩa là bất kỳ tín hiệu xếp hạng nào mà trang đó có thể có (mặc dù nội dung trùng lặp) có thể đã góp phần vào nguồn gốc nếu được chỉ định bằng canonical URL.
Điều này có nghĩa là bạn bỏ lỡ các tín hiệu tương tác, tín hiệu nội dung và bất kỳ thứ gì có thể giúp đóng góp vào xếp hạng của Google.
Vì vậy, đừng chặn Google thu thập dữ liệu các URL cụ thể khi có nội dung trùng lặp. Việc thiết lập các canonical URL phù hợp sẽ giải quyết vấn đề này và Google sẽ biết bạn nên xem những trang nào.
Đừng chỉ xóa các phiên bản không chuẩn
Ngoài ra, khi nói đến nội dung trùng lặp, đôi khi có xu hướng muốn “dọn dẹp” và xóa hoặc xóa các bài viết, sản phẩm cũ, v.v. Vấn đề với điều này là đôi khi nội dung đó đã được liên kết hoặc tham chiếu ở những nơi khác.
Ví dụ: ai đó có thể đã lưu một sản phẩm trên Pinterest và sẽ không thể truy cập sản phẩm đó sau khi sản phẩm bị xóa. Một giải pháp ở đây là thay vào đó chuyển hướng đến trang, sản phẩm mới, v.v., những trang này sẽ có sẵn cho khách hàng tiềm năng. Lần duy nhất bạn nên xóa các trang hoàn toàn mà không có chuyển hướng là nếu chúng được tạo ra do nhầm lẫn, rất mới hoặc có lưu lượng truy cập ít hoặc không có.
Trong trường hợp bạn vô tình xóa nội dung cũ, hãy đảm bảo rằng bạn đã thiết lập trang lỗi 404 cho ứng dụng khách của mình để cải thiện trải nghiệm người dùng (UX), thay vì làm hỏng nội dung đó. Một số trang 404 hay nhất đáng nhớ vì chúng bao gồm sự kết hợp hài hước và trải nghiệm người dùng mạnh mẽ.
Kết luận
SEO quan trọng đối với mọi website và việc sử dụng các canonical URL có thể giúp thông báo tốt hơn cho các công cụ tìm kiếm những URL nào có nội dung giống hệt nhau hoặc rất giống nhau. Hiểu cách sử dụng canonical URL là một trong nhiều kỹ năng thiết yếu của nhà phát triển front-end mà bạn cần để tối ưu hóa website của khách hàng.
Quý khách quan tâm đến dịch vụ của 2T Media vui lòng liên hệ:
Hotline/zalo: 0937 64 65 64
Email: 2tmedia.net@gmail.com