Tổng số lượt xem trang

Thứ Hai, 18 tháng 3, 2013

Hướng dẫn webmaster quản lý trang web

Làm theo các hướng dẫn này sẽ giúp Google tìm kiếm, lập chỉ mục và xếp hạng trang web của bạn. Thậm chí nếu bạn chọn không thực hiện bất kỳ các đề xuất này, Google mạnh mẽ khuyến khích bạn sử dụng Google Adwords

Làm theo các hướng dẫn này sẽ giúp Google tìm kiếm, lập chỉ mục và xếp hạng trang web của bạn. Thậm chí nếu bạn chọn không thực hiện bất kỳ các đề xuất này, chúng tôi mạnh mẽ khuyến khích bạn chú ý rất gần với "Nguyên tắc Chất lượng", đưa ra một số các thực hành bất hợp pháp có thể dẫn đến một trang web được xoá hoàn toàn khỏi chỉ mục của Google hoặc bằng cách khác ảnh hưởng bởi một hành động thư rác thuật toán hoặc bằng tay. Nếu một trang web đã bị ảnh hưởng bởi một hành động thư rác, nó không còn có thể hiển thị trong kết quả trên Google.com hoặc trên bất kỳ trang web đối tác của Google.


Khi site của bạn đã sẵn sàng:

Trình Google http://www.google.com/submityourcontent/ .

Gửi Sơ đồ trang web bằng cách sử dụng Google Webmaster Tools . Google sử dụng Sơ đồ trang web của bạn để tìm hiểu về cấu trúc của trang web của bạn và để tăng tốc độ của chúng ta về các trang web của bạn.
Hãy chắc chắn rằng tất cả các trang web cần biết về trang của bạn đều biết trang web của bạn trực tuyến.


Thiết kế và nội dung hướng dẫn

Tạo một trang web với một hệ thống phân cấp rõ ràng và liên kết văn bản. Mọi trang nên có thể truy cập từ ít nhất một liên kết văn bản tĩnh.

Cung cấp một bản đồ trang web cho người dùng của bạn với các liên kết trỏ đến những phần quan trọng của trang web của bạn. Nếu bản đồ trang web có một số lượng rất lớn các liên kết, bạn có thể muốn phá vỡ bản đồ trang web vào nhiều trang.

Giữ các liên kết trên một trang cho một số lượng hợp lý.
Tạo một trang web thông tin phong phú, hữu ích, và viết các trang rõ ràng và mô tả chính xác nội dung của bạn.

Hãy nghĩ đến những từ mà người dùng sẽ gõ vào để tìm trang của bạn, và đảm bảo rằng trang web của bạn thực sự bao gồm các từ này.

Cố gắng sử dụng văn bản thay vì hình ảnh để hiển thị tên, nội dung, hoặc liên kết quan trọng. Trình thu thập thông tin Google không nhận ra văn bản chứa trong hình ảnh. Nếu bạn phải sử dụng hình ảnh cho nội dung văn bản, xem xét việc sử dụng thuộc tính "ALT" để bao gồm một vài từ của văn bản mô tả.

Hãy chắc chắn rằng yếu tố

Kiểm tra các liên kết hỏng và sửa HTML.
Nếu bạn quyết định sử dụng các trang động (ví dụ, địa chỉ URL chứa một ký tự "?"), Ý thức được rằng không phải tất cả nhện công cụ tìm kiếm thu thập dữ liệu trang web động cũng như các trang tĩnh. Nó giúp để giữ cho các thông số ngắn và số ít số.

Xem lại các khuyến nghị thực hành tốt nhất của chúng tôi cho hình ảnh , video và các đoạn giàu .

Hướng dẫn kỹ thuật

Sử dụng trình duyệt văn bản như Lynx để kiểm tra trang web của bạn, bởi vì hầu hết các công cụ tìm kiếm nhện thấy trang web của bạn như Lynx. Nếu các tính năng như JavaScript, cookies, session ID, khung, DHTML, hoặc Flash giữ cho bạn khỏi nhìn thấy tất cả các trang web của bạn trong một trình duyệt văn bản, sau đó công cụ tìm kiếm nhện có thể có khó khăn trong thu thập dữ liệu trang web của bạn.

Cho phép các bot tìm kiếm thu thập dữ liệu các trang web của bạn mà không cần ID phiên hoặc các đối số theo dõi đường dẫn qua trang web. Những kỹ thuật này hữu ích cho việc theo dõi hành vi của người dùng cá nhân, nhưng cách thức truy cập của chương trình là hoàn toàn khác nhau.Sử dụng những kỹ thuật này có thể dẫn đến lập chỉ mục của trang web của bạn không đầy đủ, như các chương trình có thể không có thể loại bỏ các URL có dạng khác nhau nhưng lại chỉ đến cùng một trang.

Hãy chắc chắn rằng máy chủ web của bạn hỗ trợ If-Modified-Since HTTP header. Tính năng này cho phép máy chủ web của bạn nói với Google liệu nội dung của bạn đã thay đổi kể từ lần cuối chúng tôi thu thập thông tin trang web của bạn. Hỗ trợ tính năng này giúp bạn tiết kiệm băng thông và phí.

Hãy sử dụng file robots.txt trên máy chủ web của bạn. Tập tin này cho các trình thu thập thông tin những thư mục có thể hoặc không thể được thu thập thông tin. Hãy chắc chắn rằng đó là hiện tại cho trang web của bạn để bạn không vô tình chặn Googlebot thu thập thông tin. Http://code.google.com/web/controlcrawlindex/docs/faq.html để tìm hiểu làm thế nào để hướng dẫn robot khi họ truy cập vào trang web của bạn. Bạn có thể kiểm tra tệp robots.txt của bạn để chắc chắn rằng bạn đang sử dụng nó một cách chính xác với các công cụ phân tích robots.txt có sẵn trong Google Webmaster Tools.

Thực hiện những nỗ lực hợp lý để đảm bảo rằng quảng cáo không ảnh hưởng đến bảng xếp hạng công cụ tìm kiếm. Ví dụ, quảng cáo của Google AdSense và DoubleClick liên kết bị chặn không bị thu thập dữ liệu một file robots.txt.

Nếu công ty bạn mua một hệ thống quản lý nội dung, hãy chắc chắn rằng hệ thống tạo ra các trang web và các liên kết mà các công cụ tìm kiếm có thể thu thập dữ liệu.

Sử dụng robots.txt để ngăn chặn thu thập dữ liệu của các trang kết quả tìm kiếm hoặc tự động tạo ra các trang khác mà không thêm nhiều giá trị cho người sử dụng đến từ các công cụ tìm kiếm.

Kiểm tra trang web của bạn để đảm bảo rằng nó xuất hiện một cách chính xác trong các trình duyệt khác nhau .

Giám sát hiệu suất của trang web của bạn và tối ưu hóa thời gian tải. Mục tiêu của Google là cung cấp cho người sử dụng với các kết quả có liên quan nhất và người dùng một trải nghiệm tuyệt vời.Các trang web nhanh chóng tăng sự hài lòng của người sử dụng và nâng cao chất lượng tổng thể của các trang web (đặc biệt là đối với những người sử dụng với các kết nối Internet chậm), và chúng tôi hy vọng rằng, cũng như webmaster cải thiện trang web của họ, tốc độ tổng thể của trang web sẽ được cải thiện.

Google khuyến cáo rằng tất cả các quản trị web thường xuyên theo dõi hiệu suất trang web bằng cách sử dụng Page Speed ​​, YSlow , WebPagetest , hoặc các công cụ khác . Để biết thêm thông tin, công cụ, và các nguồn lực, làm cho trang web nhanh hơn . Ngoài ra, các công cụ hiệu suất trang web trong Công cụ Quản trị cho thấy tốc độ của trang web của bạn như kinh nghiệm của người dùng trên khắp thế giới.
Tắc về chất lượng

Những nguyên tắc chất lượng bao gồm các hình thức phổ biến nhất của hành vi lừa đảo hoặc hấp, nhưng Google có thể đáp ứng tiêu cực đối với các hành động sai trái khác không được liệt kê ở đây. Đó không phải là an toàn để giả định rằng chỉ vì một kỹ thuật lừa đảo cụ thể không được bao gồm trên trang này, Google đã phê chuẩn của nó. Người quản trị web dành năng lượng của mình phát huy tinh thần của các nguyên tắc cơ bản sẽ cung cấp một trải nghiệm người dùng tốt hơn nhiều và sau đó tận hưởng thứ hạng cao hơn so với những người dành nhiều thời gian tìm kiếm các lỗ hổng mà họ có thể khai thác.

Nếu bạn tin rằng một trang web khác đang lạm dụng các nguyên tắc về chất lượng của Google, xin vui lòng cho chúng tôi biết bằng cách nộp một báo cáo thư rác . Google ưu tiên phát triển các giải pháp mở rộng và tự động cho các vấn đề, ​​vì vậy chúng tôi cố gắng để giảm thiểu chiến đấu thư rác tay-to-hand.Trong khi chúng tôi không thể có hành động hướng dẫn sử dụng để đáp ứng tất cả các báo cáo, báo cáo thư rác được ưu tiên dựa vào người sử dụng tác động, và trong một số trường hợp có thể dẫn đến hoàn thành loại bỏ một trang web spam từ các kết quả tìm kiếm của Google. Không phải tất cả các hành động hướng dẫn sử dụng kết quả trong việc loại bỏ, tuy nhiên. Ngay cả trong trường hợp chúng tôi có hành động trên một trang web báo cáo, ảnh hưởng của những hành động này có thể không được rõ ràng.

Tắc về chất lượng - nguyên tắc cơ bản

Làm cho các trang chủ yếu dành cho người dùng, không phải cho công cụ tìm kiếm.

Không lừa đảo người dùng của bạn.

Tránh các thủ thuật nhằm cải thiện thứ hạng công cụ tìm kiếm. Một nguyên tắc của ngón tay cái là cho dù bạn sẽ cảm thấy thoải mái giải thích những gì bạn đã làm với một trang web cạnh tranh với bạn, hoặc một nhân viên Google. Một thử nghiệm hữu ích khác là hỏi, "Điều này giúp người dùng của tôi? Tôi sẽ làm điều này nếu các công cụ tìm kiếm không tồn tại?"

Hãy suy nghĩ về những gì làm cho trang web của bạn độc đáo, có giá trị, hoặc tham gia. Làm cho trang web của bạn nổi bật so với những người khác trong lĩnh vực của bạn.

Chất lượng hướng dẫn - hướng dẫn cụ thể

Tránh các kỹ thuật sau đây:

Tạo ra nội dung tự động

Tham gia chương trình liên kết

Cloaking

Chuyển hướng lén lút

Văn bản ẩn hoặc liên kết

Các trang ngõ

Cạo nội dung

Tham gia chương trình liên kết mà không cần thêm giá trị đầy đủ

Tải trang với từ khoá không phù hợp

Tạo các trang có hành vi nguy hiểm , như lừa đảo hoặc cài đặt vi rút, trojan, hay các phần mềm độc hại khác

Lợi dụng phong phú đoạn đánh dấu

Gửi truy vấn tự động tới Google

Tham gia vào các thực hành tốt như sau:


Giám sát trang web của bạn để hack và xoá nội dung tấn công ngay khi nó xuất hiện

Ngăn ngừa và loại bỏ các thư rác do người dùng tạo ra trên trang web của bạn

Nếu bạn xác định rằng trang web của bạn không đáp ứng các nguyên tắc này, bạn có thể sửa đổi trang web của bạn để nó và sau đó gửi trang web của bạn để xem xét lại .

(ST)
Làm theo các hướng dẫn này sẽ giúp Google tìm kiếm, lập chỉ mục và xếp hạng trang web của bạn. Thậm chí nếu bạn chọn không thực hiện bất kỳ các đề xuất này, Google mạnh mẽ khuyến khích bạn sử dụng Google Adwords

Làm theo các hướng dẫn này sẽ giúp Google tìm kiếm, lập chỉ mục và xếp hạng trang web của bạn. Thậm chí nếu bạn chọn không thực hiện bất kỳ các đề xuất này, chúng tôi mạnh mẽ khuyến khích bạn chú ý rất gần với "Nguyên tắc Chất lượng", đưa ra một số các thực hành bất hợp pháp có thể dẫn đến một trang web được xoá hoàn toàn khỏi chỉ mục của Google hoặc bằng cách khác ảnh hưởng bởi một hành động thư rác thuật toán hoặc bằng tay. Nếu một trang web đã bị ảnh hưởng bởi một hành động thư rác, nó không còn có thể hiển thị trong kết quả trên Google.com hoặc trên bất kỳ trang web đối tác của Google.


Khi site của bạn đã sẵn sàng:

Trình Google http://www.google.com/submityourcontent/ .

Gửi Sơ đồ trang web bằng cách sử dụng Google Webmaster Tools . Google sử dụng Sơ đồ trang web của bạn để tìm hiểu về cấu trúc của trang web của bạn và để tăng tốc độ của chúng ta về các trang web của bạn.
Hãy chắc chắn rằng tất cả các trang web cần biết về trang của bạn đều biết trang web của bạn trực tuyến.


Thiết kế và nội dung hướng dẫn

Tạo một trang web với một hệ thống phân cấp rõ ràng và liên kết văn bản. Mọi trang nên có thể truy cập từ ít nhất một liên kết văn bản tĩnh.

Cung cấp một bản đồ trang web cho người dùng của bạn với các liên kết trỏ đến những phần quan trọng của trang web của bạn. Nếu bản đồ trang web có một số lượng rất lớn các liên kết, bạn có thể muốn phá vỡ bản đồ trang web vào nhiều trang.

Giữ các liên kết trên một trang cho một số lượng hợp lý.
Tạo một trang web thông tin phong phú, hữu ích, và viết các trang rõ ràng và mô tả chính xác nội dung của bạn.

Hãy nghĩ đến những từ mà người dùng sẽ gõ vào để tìm trang của bạn, và đảm bảo rằng trang web của bạn thực sự bao gồm các từ này.

Cố gắng sử dụng văn bản thay vì hình ảnh để hiển thị tên, nội dung, hoặc liên kết quan trọng. Trình thu thập thông tin Google không nhận ra văn bản chứa trong hình ảnh. Nếu bạn phải sử dụng hình ảnh cho nội dung văn bản, xem xét việc sử dụng thuộc tính "ALT" để bao gồm một vài từ của văn bản mô tả.

Hãy chắc chắn rằng yếu tố

Kiểm tra các liên kết hỏng và sửa HTML.
Nếu bạn quyết định sử dụng các trang động (ví dụ, địa chỉ URL chứa một ký tự "?"), Ý thức được rằng không phải tất cả nhện công cụ tìm kiếm thu thập dữ liệu trang web động cũng như các trang tĩnh. Nó giúp để giữ cho các thông số ngắn và số ít số.

Xem lại các khuyến nghị thực hành tốt nhất của chúng tôi cho hình ảnh , video và các đoạn giàu .

Hướng dẫn kỹ thuật

Sử dụng trình duyệt văn bản như Lynx để kiểm tra trang web của bạn, bởi vì hầu hết các công cụ tìm kiếm nhện thấy trang web của bạn như Lynx. Nếu các tính năng như JavaScript, cookies, session ID, khung, DHTML, hoặc Flash giữ cho bạn khỏi nhìn thấy tất cả các trang web của bạn trong một trình duyệt văn bản, sau đó công cụ tìm kiếm nhện có thể có khó khăn trong thu thập dữ liệu trang web của bạn.

Cho phép các bot tìm kiếm thu thập dữ liệu các trang web của bạn mà không cần ID phiên hoặc các đối số theo dõi đường dẫn qua trang web. Những kỹ thuật này hữu ích cho việc theo dõi hành vi của người dùng cá nhân, nhưng cách thức truy cập của chương trình là hoàn toàn khác nhau.Sử dụng những kỹ thuật này có thể dẫn đến lập chỉ mục của trang web của bạn không đầy đủ, như các chương trình có thể không có thể loại bỏ các URL có dạng khác nhau nhưng lại chỉ đến cùng một trang.

Hãy chắc chắn rằng máy chủ web của bạn hỗ trợ If-Modified-Since HTTP header. Tính năng này cho phép máy chủ web của bạn nói với Google liệu nội dung của bạn đã thay đổi kể từ lần cuối chúng tôi thu thập thông tin trang web của bạn. Hỗ trợ tính năng này giúp bạn tiết kiệm băng thông và phí.

Hãy sử dụng file robots.txt trên máy chủ web của bạn. Tập tin này cho các trình thu thập thông tin những thư mục có thể hoặc không thể được thu thập thông tin. Hãy chắc chắn rằng đó là hiện tại cho trang web của bạn để bạn không vô tình chặn Googlebot thu thập thông tin. Http://code.google.com/web/controlcrawlindex/docs/faq.html để tìm hiểu làm thế nào để hướng dẫn robot khi họ truy cập vào trang web của bạn. Bạn có thể kiểm tra tệp robots.txt của bạn để chắc chắn rằng bạn đang sử dụng nó một cách chính xác với các công cụ phân tích robots.txt có sẵn trong Google Webmaster Tools.

Thực hiện những nỗ lực hợp lý để đảm bảo rằng quảng cáo không ảnh hưởng đến bảng xếp hạng công cụ tìm kiếm. Ví dụ, quảng cáo của Google AdSense và DoubleClick liên kết bị chặn không bị thu thập dữ liệu một file robots.txt.

Nếu công ty bạn mua một hệ thống quản lý nội dung, hãy chắc chắn rằng hệ thống tạo ra các trang web và các liên kết mà các công cụ tìm kiếm có thể thu thập dữ liệu.

Sử dụng robots.txt để ngăn chặn thu thập dữ liệu của các trang kết quả tìm kiếm hoặc tự động tạo ra các trang khác mà không thêm nhiều giá trị cho người sử dụng đến từ các công cụ tìm kiếm.

Kiểm tra trang web của bạn để đảm bảo rằng nó xuất hiện một cách chính xác trong các trình duyệt khác nhau .

Giám sát hiệu suất của trang web của bạn và tối ưu hóa thời gian tải. Mục tiêu của Google là cung cấp cho người sử dụng với các kết quả có liên quan nhất và người dùng một trải nghiệm tuyệt vời.Các trang web nhanh chóng tăng sự hài lòng của người sử dụng và nâng cao chất lượng tổng thể của các trang web (đặc biệt là đối với những người sử dụng với các kết nối Internet chậm), và chúng tôi hy vọng rằng, cũng như webmaster cải thiện trang web của họ, tốc độ tổng thể của trang web sẽ được cải thiện.

Google khuyến cáo rằng tất cả các quản trị web thường xuyên theo dõi hiệu suất trang web bằng cách sử dụng Page Speed ​​, YSlow , WebPagetest , hoặc các công cụ khác . Để biết thêm thông tin, công cụ, và các nguồn lực, làm cho trang web nhanh hơn . Ngoài ra, các công cụ hiệu suất trang web trong Công cụ Quản trị cho thấy tốc độ của trang web của bạn như kinh nghiệm của người dùng trên khắp thế giới.
Tắc về chất lượng

Những nguyên tắc chất lượng bao gồm các hình thức phổ biến nhất của hành vi lừa đảo hoặc hấp, nhưng Google có thể đáp ứng tiêu cực đối với các hành động sai trái khác không được liệt kê ở đây. Đó không phải là an toàn để giả định rằng chỉ vì một kỹ thuật lừa đảo cụ thể không được bao gồm trên trang này, Google đã phê chuẩn của nó. Người quản trị web dành năng lượng của mình phát huy tinh thần của các nguyên tắc cơ bản sẽ cung cấp một trải nghiệm người dùng tốt hơn nhiều và sau đó tận hưởng thứ hạng cao hơn so với những người dành nhiều thời gian tìm kiếm các lỗ hổng mà họ có thể khai thác.

Nếu bạn tin rằng một trang web khác đang lạm dụng các nguyên tắc về chất lượng của Google, xin vui lòng cho chúng tôi biết bằng cách nộp một báo cáo thư rác . Google ưu tiên phát triển các giải pháp mở rộng và tự động cho các vấn đề, ​​vì vậy chúng tôi cố gắng để giảm thiểu chiến đấu thư rác tay-to-hand.Trong khi chúng tôi không thể có hành động hướng dẫn sử dụng để đáp ứng tất cả các báo cáo, báo cáo thư rác được ưu tiên dựa vào người sử dụng tác động, và trong một số trường hợp có thể dẫn đến hoàn thành loại bỏ một trang web spam từ các kết quả tìm kiếm của Google. Không phải tất cả các hành động hướng dẫn sử dụng kết quả trong việc loại bỏ, tuy nhiên. Ngay cả trong trường hợp chúng tôi có hành động trên một trang web báo cáo, ảnh hưởng của những hành động này có thể không được rõ ràng.

Tắc về chất lượng - nguyên tắc cơ bản

Làm cho các trang chủ yếu dành cho người dùng, không phải cho công cụ tìm kiếm.

Không lừa đảo người dùng của bạn.

Tránh các thủ thuật nhằm cải thiện thứ hạng công cụ tìm kiếm. Một nguyên tắc của ngón tay cái là cho dù bạn sẽ cảm thấy thoải mái giải thích những gì bạn đã làm với một trang web cạnh tranh với bạn, hoặc một nhân viên Google. Một thử nghiệm hữu ích khác là hỏi, "Điều này giúp người dùng của tôi? Tôi sẽ làm điều này nếu các công cụ tìm kiếm không tồn tại?"

Hãy suy nghĩ về những gì làm cho trang web của bạn độc đáo, có giá trị, hoặc tham gia. Làm cho trang web của bạn nổi bật so với những người khác trong lĩnh vực của bạn.

Chất lượng hướng dẫn - hướng dẫn cụ thể

Tránh các kỹ thuật sau đây:

Tạo ra nội dung tự động

Tham gia chương trình liên kết

Cloaking

Chuyển hướng lén lút

Văn bản ẩn hoặc liên kết

Các trang ngõ

Cạo nội dung

Tham gia chương trình liên kết mà không cần thêm giá trị đầy đủ

Tải trang với từ khoá không phù hợp

Tạo các trang có hành vi nguy hiểm , như lừa đảo hoặc cài đặt vi rút, trojan, hay các phần mềm độc hại khác

Lợi dụng phong phú đoạn đánh dấu

Gửi truy vấn tự động tới Google

Tham gia vào các thực hành tốt như sau:

Giám sát trang web của bạn để hack và xoá nội dung tấn công ngay khi nó xuất hiện

Ngăn ngừa và loại bỏ các thư rác do người dùng tạo ra trên trang web của bạn

Nếu bạn xác định rằng trang web của bạn không đáp ứng các nguyên tắc này, bạn có thể sửa đổi trang web của bạn để nó và sau đó gửi trang web của bạn để xem xét lại .

(ST)

Robots.txt và Meta Robots.txt

Robots.txt cùng với Title Tag, Meta Description, On-Page Factors, Duplicate Content, HTTP Status Codes là những khái niệm vô cùng quan trọng mà các SEOer cần tìm hiểu khi bắt đầu làm SEO.

Robots.txt là gì?

The robots exclusion protocol (REP) hoặc robots.txt là một text file mà người quản trị web tạo ra để hướng dẫn robot (robot của công cụ tìm kiếm) làm thế nào để thu thập dữ liệu và index các pages trên trang web của họ.

Mẫu codeChặn tất cả robot với tất cả các nội dung

User-agent: *
Disallow: /
Chặn 1 robot với 1 folder


User-agent: Googlebot
Disallow: /no-google/
Chặn 1 robot với 1 trang


User-agent: Googlebot
Disallow: /no-google/blocked-page.html
Cho phép 1 robot vào 1 trang


User-agent: *
Disallow: /no-bots/block-all-bots-except-rogerbot-page.html
User-agent: rogerbot
Allow: /no-bots/block-all-bots-except-rogerbot-page.html

Thông số sitemap


User-agent: *
Disallow:
Sitemap: http://www.example.com/none-standard-location/sitemap.xml
Format tối ưu
Robots.txt cần được đặt ở thư mục gốc của tên miền để có thể phát huy tác dụng

Ví dụ: http:/www.example.com/robots.txt

Khái niệm Robots.txt

Robots Exclusion Protocol (REP) là một nhóm các tiêu chuẩn web để điều chỉnh hành vi Robot Web và lập chỉ mục cho công cụ tìm kiếm. REP bao gồm những điều sau đây:

REP xuất hiện năm 1994, trở nên phổ biến hơn năm 1997, dùng để xác định chỉ thị thu thập thông tin cho robots.txt. Một số công cụ tìm kiếm hỗ trợ phần mở rộng như mô hình URI (thẻ wild).

Từ năm 1996, REP được mở rộng để xác định các chỉ thị chỉ mục (REP tags) để sử dụng trong các yếu tố meta robot, còn được gọi là "robot meta tag." Khi đó, công cụ tìm kiếm hỗ trợ thêm thẻ REP với một Tag-X-Robots. Người quản trị web có thể sử dụng REP tag trong tiêu đề HTTP của các nguồn tài nguyên không phải HTML như tài liệu PDF hoặc hình ảnh.

Từ năm 2005, phiên bản Microformat rel-nofollow để xác định xem công cụ tìm kiếm nên xử lý thế nào với các liên kết có thuộc tính REL của một phần tử chứa giá trị "nofollow."

Robots Exclusion Protocol Tags

Áp dụng cho thẻ URI, REP (noindex, nofollow, unavailable_after) điều chỉnh việc robot index, và trong một số trường hợp (nosnippet, noarchive, noodp) thậm chí dùng để truy vấn bộ máy tìm kiếm trong thời gian chạy một truy vấn tìm kiếm. Khác với chỉ thị cho Google Spider , mỗi công cụ tìm kiếm hiểu thẻ REP theo một cách khác nhau. Ví dụ: Google thậm chí còn xóa danh sách URL-only và tài liệu tham khảo ODP trên SERPs của họ khi một resource được đánh dấu “noindex”. Nhưng Bing đôi khi lại liệt kê các tài liệu tham khảo khác đối với các URL bị cấm trên SERPs. Khi thẻ REP có thể được sử dụng trong các yếu tố META của nội dung X / HTML cũng như trong các HTTP header của bất kỳ đối tượng web nào, cần tránh các chỉ thị xung đột trong các yếu tố META.

Microformats

Cách hiển thị Index theo hình thức trang đặc biệt Microformats sẽ bỏ qua các cài đặt cho các phần tử HTML ở trên trang. Phương pháp này đòi hỏi phải có kỹ năng lập trình và hiểu biết tốt về các máy chủ web và giao thức HTTP.

Mô hình kết hợpGoogle và Bing đều sử dụng hai biểu thức thông thường mà có thể được sử dụng để xác định các trang hoặc thư mục con muốn loại trừ. Hai ký tự là dấu hoa thị (*) và dấu hiệu đồng đô la ($).
* Là một ký tự đại diện đại diện cho chuỗi ký tự bất kỳ

$ Phù hợp với kết thúc của URL

Công khai thông tinCông khai thư mục robots.txt - Hãy biết rằng file robots.txt là một tập tin công bố công khai. Người quản trị web có thể công khai cho tất cả mọi người đều có thể nhìn thấy những thư mục mà họ không muốn bị thu thập dữ liệu. Điều này có nghĩa là nếu bạn có thông tin người dùng nhưng không muốn công khai tìm kiếm, bạn nên sử dụng phương pháp an toàn hơn để giữ khách truy cập xem bất kỳ trang nào bí mật mà không muốn lập chỉ mục (chẳng hạn như mật khẩu bảo vệ).

Quy định quan trọng

Trong hầu hết các trường hợp, robot meta với các thông số "noindex, follow" nên được sử dụng như một cách để hạn chế thu thập thông tin hoặc chỉ số index.

Điều quan trọng cần lưu ý rằng các trình thu thập thông tin độc hại có khả năng hoàn toàn bỏ qua robots.txt và như vậy, giao thức này không tạo được một cơ chế bảo mật tốt.

Chỉ dùngmột "Disallow:" cho 1 dòng - cho mỗi URL.

Mỗi tên miền phụ của một tên miền gốc sẽ sử dụng các tập tin robots.txt khác nhau.

Google và Bing chấp nhận hai nhân vật biểu hiện cụ thể thường xuyên để loại trừ mẫu (* và $).

Các tên tập tin robots.txt là trường hợp nhạy cảm. Hãy sử dụng "robots.txt", chứ không phải Robots.TXT ".

Khoảng trắng không được chấp nhận để thể hiện cách tách các tham số truy vấn. Ví dụ, "/ category / / trang sản phẩm" sẽ không được chấp nhận bởi robots.txt.

Áp dụng tốt nhất trong SEO

Chặn trang (Blocking page)Có một số cách để ngăn chặn các công cụ tìm kiếm truy cập một tên miền nhất định:

Chặn với Robots.txt

Điều này nói cho Google Spider không nên thu thập dữ liệu URL được nhắc tới, nhưng cũng nói cho Google Spider rằng có thể giữ cho các trang trong chỉ mục và hiển thị nó trong trong kết quả. (Xem hình ảnh của trang kết quả của Google bên dưới)

Chặn bằng Meta ngăn lập chỉ mục (Block with Meta NoIndex)

Điều này cho cho phép có thể truy cập, nhưng không được phép để hiển thị các URL trong trang kết quả. (Đây là phương pháp được đề nghị)

Chặn bởi Nofollowing Liên kết (Block by Nofollowing Links)

Đây gần như là cách làm kém hiệu quả nhất. Bởi vì vẫn có thể cho các công cụ tìm kiếm khám phá các trang theo những cách khác. (Thông qua thanh công cụ trình duyệt, các liên kết từ các trang khác, analytics, ...)

Tại sao sử dụng Robots Meta lại tốt hơn robots.txtDưới đây là một ví dụ về tập tin robots.txt của trang about.com. Chú ý rằng chúng đang chặn thư mục /library/nosearch/



Bây giờ nhận thấy điều gì sẽ xảy ra khi URL được tìm kiếm trong Google.



Google có 2.760 kết quả từ thư mục "disallowed". Google Spider đã không thu thập thông tin các URL, do đó, nó xuất hiện như một URL chứ không phải là một danh sách kết quả bình thường..

Điều này sẽ trở thành một lỗi khi các trang này tích lũy liên kết. Nhiều trang có thể tích lũy liên kết và truy vấn độc lập số liệu khác xếp hạng (như popularity and trust), nhưng các trang này không thể vượt qua bất kỳ trang nào khác vì các liên kết đó không bao giờ nhận được thu thập thông tin.



Điều này có nghĩa là để loại trừ các trang cá nhân từ các chỉ số công cụ tìm kiếm, meta tag noindexthực sự vượt trội hơn so với robots.txt.

Công cụ liên quan

mozBar
mozBar giúp xem các số liệu có liên quan SEO khi bạn lướt web được dễ dàng hơn.

Tài liệu tham khảo thêm

Robots Exclusion Protocol
Nguồn thông tin chính thức về Robots Exclusion Protocol.

W3 và Robots Exclusion Protocol
Tài liệu chính thức về Robots Exclusion của W3


(ST)
Robots.txt cùng với Title Tag, Meta Description, On-Page Factors, Duplicate Content, HTTP Status Codes là những khái niệm vô cùng quan trọng mà các SEOer cần tìm hiểu khi bắt đầu làm SEO.

Robots.txt là gì?

The robots exclusion protocol (REP) hoặc robots.txt là một text file mà người quản trị web tạo ra để hướng dẫn robot (robot của công cụ tìm kiếm) làm thế nào để thu thập dữ liệu và index các pages trên trang web của họ.

Mẫu codeChặn tất cả robot với tất cả các nội dung

User-agent: *
Disallow: /
Chặn 1 robot với 1 folder


User-agent: Googlebot
Disallow: /no-google/
Chặn 1 robot với 1 trang


User-agent: Googlebot
Disallow: /no-google/blocked-page.html
Cho phép 1 robot vào 1 trang


User-agent: *
Disallow: /no-bots/block-all-bots-except-rogerbot-page.html
User-agent: rogerbot
Allow: /no-bots/block-all-bots-except-rogerbot-page.html

Thông số sitemap


User-agent: *
Disallow:
Sitemap: http://www.example.com/none-standard-location/sitemap.xml
Format tối ưu
Robots.txt cần được đặt ở thư mục gốc của tên miền để có thể phát huy tác dụng

Ví dụ: http:/www.example.com/robots.txt

Khái niệm Robots.txt

Robots Exclusion Protocol (REP) là một nhóm các tiêu chuẩn web để điều chỉnh hành vi Robot Web và lập chỉ mục cho công cụ tìm kiếm. REP bao gồm những điều sau đây:

REP xuất hiện năm 1994, trở nên phổ biến hơn năm 1997, dùng để xác định chỉ thị thu thập thông tin cho robots.txt. Một số công cụ tìm kiếm hỗ trợ phần mở rộng như mô hình URI (thẻ wild).

Từ năm 1996, REP được mở rộng để xác định các chỉ thị chỉ mục (REP tags) để sử dụng trong các yếu tố meta robot, còn được gọi là "robot meta tag." Khi đó, công cụ tìm kiếm hỗ trợ thêm thẻ REP với một Tag-X-Robots. Người quản trị web có thể sử dụng REP tag trong tiêu đề HTTP của các nguồn tài nguyên không phải HTML như tài liệu PDF hoặc hình ảnh.

Từ năm 2005, phiên bản Microformat rel-nofollow để xác định xem công cụ tìm kiếm nên xử lý thế nào với các liên kết có thuộc tính REL của một phần tử chứa giá trị "nofollow."

Robots Exclusion Protocol Tags

Áp dụng cho thẻ URI, REP (noindex, nofollow, unavailable_after) điều chỉnh việc robot index, và trong một số trường hợp (nosnippet, noarchive, noodp) thậm chí dùng để truy vấn bộ máy tìm kiếm trong thời gian chạy một truy vấn tìm kiếm. Khác với chỉ thị cho Google Spider , mỗi công cụ tìm kiếm hiểu thẻ REP theo một cách khác nhau. Ví dụ: Google thậm chí còn xóa danh sách URL-only và tài liệu tham khảo ODP trên SERPs của họ khi một resource được đánh dấu “noindex”. Nhưng Bing đôi khi lại liệt kê các tài liệu tham khảo khác đối với các URL bị cấm trên SERPs. Khi thẻ REP có thể được sử dụng trong các yếu tố META của nội dung X / HTML cũng như trong các HTTP header của bất kỳ đối tượng web nào, cần tránh các chỉ thị xung đột trong các yếu tố META.

Microformats

Cách hiển thị Index theo hình thức trang đặc biệt Microformats sẽ bỏ qua các cài đặt cho các phần tử HTML ở trên trang. Phương pháp này đòi hỏi phải có kỹ năng lập trình và hiểu biết tốt về các máy chủ web và giao thức HTTP.

Mô hình kết hợpGoogle và Bing đều sử dụng hai biểu thức thông thường mà có thể được sử dụng để xác định các trang hoặc thư mục con muốn loại trừ. Hai ký tự là dấu hoa thị (*) và dấu hiệu đồng đô la ($).
* Là một ký tự đại diện đại diện cho chuỗi ký tự bất kỳ

$ Phù hợp với kết thúc của URL

Công khai thông tinCông khai thư mục robots.txt - Hãy biết rằng file robots.txt là một tập tin công bố công khai. Người quản trị web có thể công khai cho tất cả mọi người đều có thể nhìn thấy những thư mục mà họ không muốn bị thu thập dữ liệu. Điều này có nghĩa là nếu bạn có thông tin người dùng nhưng không muốn công khai tìm kiếm, bạn nên sử dụng phương pháp an toàn hơn để giữ khách truy cập xem bất kỳ trang nào bí mật mà không muốn lập chỉ mục (chẳng hạn như mật khẩu bảo vệ).

Quy định quan trọng

Trong hầu hết các trường hợp, robot meta với các thông số "noindex, follow" nên được sử dụng như một cách để hạn chế thu thập thông tin hoặc chỉ số index.

Điều quan trọng cần lưu ý rằng các trình thu thập thông tin độc hại có khả năng hoàn toàn bỏ qua robots.txt và như vậy, giao thức này không tạo được một cơ chế bảo mật tốt.

Chỉ dùngmột "Disallow:" cho 1 dòng - cho mỗi URL.

Mỗi tên miền phụ của một tên miền gốc sẽ sử dụng các tập tin robots.txt khác nhau.

Google và Bing chấp nhận hai nhân vật biểu hiện cụ thể thường xuyên để loại trừ mẫu (* và $).

Các tên tập tin robots.txt là trường hợp nhạy cảm. Hãy sử dụng "robots.txt", chứ không phải Robots.TXT ".

Khoảng trắng không được chấp nhận để thể hiện cách tách các tham số truy vấn. Ví dụ, "/ category / / trang sản phẩm" sẽ không được chấp nhận bởi robots.txt.

Áp dụng tốt nhất trong SEO

Chặn trang (Blocking page)Có một số cách để ngăn chặn các công cụ tìm kiếm truy cập một tên miền nhất định:

Chặn với Robots.txt

Điều này nói cho Google Spider không nên thu thập dữ liệu URL được nhắc tới, nhưng cũng nói cho Google Spider rằng có thể giữ cho các trang trong chỉ mục và hiển thị nó trong trong kết quả. (Xem hình ảnh của trang kết quả của Google bên dưới)

Chặn bằng Meta ngăn lập chỉ mục (Block with Meta NoIndex)

Điều này cho cho phép có thể truy cập, nhưng không được phép để hiển thị các URL trong trang kết quả. (Đây là phương pháp được đề nghị)

Chặn bởi Nofollowing Liên kết (Block by Nofollowing Links)

Đây gần như là cách làm kém hiệu quả nhất. Bởi vì vẫn có thể cho các công cụ tìm kiếm khám phá các trang theo những cách khác. (Thông qua thanh công cụ trình duyệt, các liên kết từ các trang khác, analytics, ...)

Tại sao sử dụng Robots Meta lại tốt hơn robots.txtDưới đây là một ví dụ về tập tin robots.txt của trang about.com. Chú ý rằng chúng đang chặn thư mục /library/nosearch/



Bây giờ nhận thấy điều gì sẽ xảy ra khi URL được tìm kiếm trong Google.



Google có 2.760 kết quả từ thư mục "disallowed". Google Spider đã không thu thập thông tin các URL, do đó, nó xuất hiện như một URL chứ không phải là một danh sách kết quả bình thường..

Điều này sẽ trở thành một lỗi khi các trang này tích lũy liên kết. Nhiều trang có thể tích lũy liên kết và truy vấn độc lập số liệu khác xếp hạng (như popularity and trust), nhưng các trang này không thể vượt qua bất kỳ trang nào khác vì các liên kết đó không bao giờ nhận được thu thập thông tin.



Điều này có nghĩa là để loại trừ các trang cá nhân từ các chỉ số công cụ tìm kiếm, meta tag noindexthực sự vượt trội hơn so với robots.txt.

Công cụ liên quan

mozBar
mozBar giúp xem các số liệu có liên quan SEO khi bạn lướt web được dễ dàng hơn.

Tài liệu tham khảo thêm

Robots Exclusion Protocol
Nguồn thông tin chính thức về Robots Exclusion Protocol.

W3 và Robots Exclusion Protocol
Tài liệu chính thức về Robots Exclusion của W3

(ST)

Mã trạng thái HTTP - HTTP Status Codes

Mã trạng thái là một khái niệm rất quan trọng trong SEO, tuy nhiên tại Việt Nam rất ít tài liệu liên quan chia sẻ về khái niệm này. Tài liệu về mã trạng thái HTTP được chuyên gia Lê Thu Minh của VietMoz biên dịch lại rất chi tiết từ tổ chức SEO uy tín trên thế giới.

Mã trạng thái HTTP được phản hồi lại mỗi khi Search Engine hoặc người dùng đưa ra yêu cầu gì cho web server. Loại code 3 chữ số này thể hiện phản hồi và trạng thái của yêu cầu HTTP.

Các lưu ý quan trọng

Sử dụng code 301 thay vì 302 khi chuyển hướng URL trên một website để đảm bảo link juice (ranking power) được thông giữa các trang được chuyển hướng.

Các trang web phản hồi 404 (File Not Found) trong thời gian dài và có các liên kết có giá trị thì nên dùng code 301 để chuyển hướng đến web khác.

Cần phải tạo 1 trang báo lỗi 404 riêng có các gợi ý chuyển hướng khi người dùng truy cập vào trang web và nhận được phản hồi 404.

Mã trạng thái HTTP là gì?


Mã trạng thái HTTP là loại mã bao gồm 3 chữ số được server phản hồi lại để biểu thị tình trạng của một web.

Một điều rất quan trọng cần phải hiểu là : chữ số đầu tiên của mỗi mã là từ 1 đến 5, Trong khoảng từ 100 đến 500, các mã được phân loại như sau:

1xx: Informational - yêu cầu (request) đã được nhận, tiếp tục tiến trình xử lí
2xx: Success - thành công
3xx: Redirection - chuyển hướng
4xx: Client Error - yêu cầu sai cú pháp hoặc không thỏa đáng
5xx: Server Error - máy chủ gặp lỗiMặc dù có rất nhiều mã trạng thái, nhưng chỉ một số ít là có ý nghĩa trong SEO.

Các mã trạng thái quan trọng đối với SEO và SE:

200 OKRequest thành công. Mã này được xem là đúng trong hầu hết các trường hợp.

301 Moved Permanently (301 Đã di chuyển vĩnh viễn)Nguồn tài nguyên được yêu cầu đã được di chuyển vĩnh viễn sang 1 URI hoàn toàn mới và bất cứ references nào liên quan đến nguồn tài nguyên này trong tương lai cũng sẽ sử dụng 1 trong những URI được trả lại. Trong SEO, Mã 301 nên được sử dụng bất cứ khi nào 1 URL cần được redirect.

302 Found (302 Tìm thấy)Ở vị trí cách xa nhau, người dùng đưa ra yêu cầu và server đang xử lý. Cách tiếp cận này không được khuyến khích nhiều. Đây không phải cách hiệu quả để báo cho bot tìm kiếm biết rằng page đã bị di chuyển. Việc sử dụng mã 302 sẽ khiến bot tìm kiếm nhầm tưởng việc di chuyển page chỉ là tạm thời và sẽ không cho phép link juice ( rank power ) giống như mã 301.

404 File Not Found (404 Không tìm thấy file)Server không tìm thấy gì phù hợp với URI yêu cầu. Không có dấu hiệu nào cho biết tình trạng này là tạm thời hay vĩnh viễn. Điều này sẽ xảy ra bất kỳ khi nào các máy chủ không thể tìm thấy một trang phù hợp với yêu cầu. Thông thường khi đó, webmasters sẽ hiển thị thông báo lỗi 404 nhưng mã phản hồi là 200. Điều này báo cho bọ tìm kiếm của SE biết rằng các trang đã phản hồi 1 cách chính xác và không cần thiết phải lập chỉ mục nhiều lần cho trang đó nữa.

410 Gone (410 Đã di dời)Nội dung được yêu cầu đã không còn có sẵn tại server, và không tìm thấy địa chỉ chuyển tiếp nào khác. Trạng thái này được xem là vĩnh viễn. Clients với khả năng chỉnh sửa liên kết NÊN xóa tham chiếu URI Yêu cầu sau khi được phê duyệt của người sử dụng. Nếu máy chủ không biết, hoặc không có cơ sở để xác định, có hoặc không có điều kiện vĩnh viễn, mã trạng thái 404 (Not Found) NÊN được sử dụng để thay thế. Phản hồi này được lưu cache trừ khi được chỉ định khác.

503 Service Unavailable (505 Dịch vụ không sẵn sàng)Server hiện không thể xử lý yêu cầu do quá tải tạm thời hoặc bảo trì máy chủ. Mã 503 nên được sử dụng khi bị mất điện tạm thời. Ví dụ, trường hợp server không hoạt động trong một thời gian ngắn để bảo trì. Điều này sẽ đảm bảo rằng SE biết để sớm quay trở lại bởi vì các trang chỉ tạm ngừng hoạt động một thời gian ngắn.

Áp dụng tốt nhất trong SEO

Sử dụng mã 301 để chuyển hướngMã 301 được đề nghị sử dụng mỗi khi cần chuyển hướng site hoặc page. Bởi vì mã 302 không làm cho SE hiểu rằng page hoặc site đã bị di chuyển vĩnh viễn. Để tìm hiểu rõ hơn về kỹ thuật thực hành với mã 301, xem hướng dẫn của Jen Sable Lope tại URL Rewrites and 301 Redirects.

Chú ý: nếu bạn muốn chuyển hướng toàn bộ domain, chúng tôi khuyên bạn nên tuân theo hướng dẫn di chuyển toàn bộ domain

Hình: Người dùng truy cập thẳng vào URL cũ => mã 301 chuyển hướng => quá trình viết lại URL bắt đầu => URL hits server => URL mới chỉ đến URL cũ => URL cũ đưa ra code sẵn có => code hiển thị ở URL mới.

Sử dụng mã chuyển hướng 404s đúng lúcNếu 1 page nhận được các link quan trọng, có được lượng traffic nhất định, hoặc có 1 URL cụ thể mà người dùng hoặc links muốn hướng đến, thì bạn nên sử dụng mã 301 để chuyển hướng đến 1 trang liên quan nhất có thể. Ngoài ra, một điều cần thiết là bạn nên có 1 URL trả lại mã 404 (để tránh SE tiếp tục crawl và index)

Một sai lầm phổ biến là khi mọi người thực hành SEO với mã chuyển hướng 301 thì thường trả mã 404 về trang chủ của domain đó. Đây thực sự là một lựa chọn sai lầm trong tất cả các trường hợp vì điều đó có thể khiến người dùng hiểu lầm rằng webpage mà họ đang cố gắng truy cập không hề tồn tại. Để tìm hiểu rõ hơn, hãy đọc bài viết của Rank Fishkin tại when it's appropriate to redirect 404 pages.



Tạo một trang thông báo lỗi

Khi người dùng gặp phải trang lỗi 404, hãy khiến họ thấy rằng đây không phải là trang copy của trang nào khác để họ không rời khỏi trang. Trang báo lỗi 404 tối ưu phải bao gồm:

Thông báo rằng người dùng đang vào 1 trang không tồn tại.

1 thanh tìm kiếm.

1 diễn giải dễ hiểu nào đó để người dùng biết ban đầu họ đang định tìm kiếm trang nào.

1 link đến home page.Để thêm 1 trang báo lỗi vào 1 website, người quản trị web có thể tự tạo hoặc sửa theo mẫu tại Google Webmaster Tools' 404 solution. Hoặc có thể tham khảo các bài viết ở báo Smashing Magazine năm 2007, 2008, 2009.

Công cụ liên quan

Live HTTP Headers for Firefox
Một plugin miễn phí cho thấy tiêu đề HTTP trong Firefox.

mozBar
mozBar giúp xem các số liệu có liên quan SEO khi bạn lướt web được dễ dàng hơn.

Open Site Explorer
Open Site Explorer là một công cụ miễn phí cung cấp cho quản trị web khả năng nhìn thấy lên đến 10000 liên kết tới bất kỳ trang web hoặc trang web thông qua chỉ số web Linkscape.

Tài liệu tham khảo thêm


HTTP/1.1: Status Code Definitions
Tài liệu chính thức về mã trạng thái HTTP của W3.

HTTP Status Codes
Tài liệu chính thức của Google về mã trạng thái HTTP cho các webmaster.

(ST)
Mã trạng thái là một khái niệm rất quan trọng trong SEO, tuy nhiên tại Việt Nam rất ít tài liệu liên quan chia sẻ về khái niệm này. Tài liệu về mã trạng thái HTTP được chuyên gia Lê Thu Minh của VietMoz biên dịch lại rất chi tiết từ tổ chức SEO uy tín trên thế giới.

Mã trạng thái HTTP được phản hồi lại mỗi khi Search Engine hoặc người dùng đưa ra yêu cầu gì cho web server. Loại code 3 chữ số này thể hiện phản hồi và trạng thái của yêu cầu HTTP.

Các lưu ý quan trọng

Sử dụng code 301 thay vì 302 khi chuyển hướng URL trên một website để đảm bảo link juice (ranking power) được thông giữa các trang được chuyển hướng.

Các trang web phản hồi 404 (File Not Found) trong thời gian dài và có các liên kết có giá trị thì nên dùng code 301 để chuyển hướng đến web khác.

Cần phải tạo 1 trang báo lỗi 404 riêng có các gợi ý chuyển hướng khi người dùng truy cập vào trang web và nhận được phản hồi 404.

Mã trạng thái HTTP là gì?


Mã trạng thái HTTP là loại mã bao gồm 3 chữ số được server phản hồi lại để biểu thị tình trạng của một web.

Một điều rất quan trọng cần phải hiểu là : chữ số đầu tiên của mỗi mã là từ 1 đến 5, Trong khoảng từ 100 đến 500, các mã được phân loại như sau:

1xx: Informational - yêu cầu (request) đã được nhận, tiếp tục tiến trình xử lí
2xx: Success - thành công
3xx: Redirection - chuyển hướng
4xx: Client Error - yêu cầu sai cú pháp hoặc không thỏa đáng
5xx: Server Error - máy chủ gặp lỗiMặc dù có rất nhiều mã trạng thái, nhưng chỉ một số ít là có ý nghĩa trong SEO.

Các mã trạng thái quan trọng đối với SEO và SE:

200 OKRequest thành công. Mã này được xem là đúng trong hầu hết các trường hợp.

301 Moved Permanently (301 Đã di chuyển vĩnh viễn)Nguồn tài nguyên được yêu cầu đã được di chuyển vĩnh viễn sang 1 URI hoàn toàn mới và bất cứ references nào liên quan đến nguồn tài nguyên này trong tương lai cũng sẽ sử dụng 1 trong những URI được trả lại. Trong SEO, Mã 301 nên được sử dụng bất cứ khi nào 1 URL cần được redirect.

302 Found (302 Tìm thấy)Ở vị trí cách xa nhau, người dùng đưa ra yêu cầu và server đang xử lý. Cách tiếp cận này không được khuyến khích nhiều. Đây không phải cách hiệu quả để báo cho bot tìm kiếm biết rằng page đã bị di chuyển. Việc sử dụng mã 302 sẽ khiến bot tìm kiếm nhầm tưởng việc di chuyển page chỉ là tạm thời và sẽ không cho phép link juice ( rank power ) giống như mã 301.

404 File Not Found (404 Không tìm thấy file)Server không tìm thấy gì phù hợp với URI yêu cầu. Không có dấu hiệu nào cho biết tình trạng này là tạm thời hay vĩnh viễn. Điều này sẽ xảy ra bất kỳ khi nào các máy chủ không thể tìm thấy một trang phù hợp với yêu cầu. Thông thường khi đó, webmasters sẽ hiển thị thông báo lỗi 404 nhưng mã phản hồi là 200. Điều này báo cho bọ tìm kiếm của SE biết rằng các trang đã phản hồi 1 cách chính xác và không cần thiết phải lập chỉ mục nhiều lần cho trang đó nữa.

410 Gone (410 Đã di dời)Nội dung được yêu cầu đã không còn có sẵn tại server, và không tìm thấy địa chỉ chuyển tiếp nào khác. Trạng thái này được xem là vĩnh viễn. Clients với khả năng chỉnh sửa liên kết NÊN xóa tham chiếu URI Yêu cầu sau khi được phê duyệt của người sử dụng. Nếu máy chủ không biết, hoặc không có cơ sở để xác định, có hoặc không có điều kiện vĩnh viễn, mã trạng thái 404 (Not Found) NÊN được sử dụng để thay thế. Phản hồi này được lưu cache trừ khi được chỉ định khác.

503 Service Unavailable (505 Dịch vụ không sẵn sàng)Server hiện không thể xử lý yêu cầu do quá tải tạm thời hoặc bảo trì máy chủ. Mã 503 nên được sử dụng khi bị mất điện tạm thời. Ví dụ, trường hợp server không hoạt động trong một thời gian ngắn để bảo trì. Điều này sẽ đảm bảo rằng SE biết để sớm quay trở lại bởi vì các trang chỉ tạm ngừng hoạt động một thời gian ngắn.

Áp dụng tốt nhất trong SEO

Sử dụng mã 301 để chuyển hướngMã 301 được đề nghị sử dụng mỗi khi cần chuyển hướng site hoặc page. Bởi vì mã 302 không làm cho SE hiểu rằng page hoặc site đã bị di chuyển vĩnh viễn. Để tìm hiểu rõ hơn về kỹ thuật thực hành với mã 301, xem hướng dẫn của Jen Sable Lope tại URL Rewrites and 301 Redirects.

Chú ý: nếu bạn muốn chuyển hướng toàn bộ domain, chúng tôi khuyên bạn nên tuân theo hướng dẫn di chuyển toàn bộ domain

Hình: Người dùng truy cập thẳng vào URL cũ => mã 301 chuyển hướng => quá trình viết lại URL bắt đầu => URL hits server => URL mới chỉ đến URL cũ => URL cũ đưa ra code sẵn có => code hiển thị ở URL mới.

Sử dụng mã chuyển hướng 404s đúng lúcNếu 1 page nhận được các link quan trọng, có được lượng traffic nhất định, hoặc có 1 URL cụ thể mà người dùng hoặc links muốn hướng đến, thì bạn nên sử dụng mã 301 để chuyển hướng đến 1 trang liên quan nhất có thể. Ngoài ra, một điều cần thiết là bạn nên có 1 URL trả lại mã 404 (để tránh SE tiếp tục crawl và index)

Một sai lầm phổ biến là khi mọi người thực hành SEO với mã chuyển hướng 301 thì thường trả mã 404 về trang chủ của domain đó. Đây thực sự là một lựa chọn sai lầm trong tất cả các trường hợp vì điều đó có thể khiến người dùng hiểu lầm rằng webpage mà họ đang cố gắng truy cập không hề tồn tại. Để tìm hiểu rõ hơn, hãy đọc bài viết của Rank Fishkin tại when it's appropriate to redirect 404 pages.



Tạo một trang thông báo lỗi

Khi người dùng gặp phải trang lỗi 404, hãy khiến họ thấy rằng đây không phải là trang copy của trang nào khác để họ không rời khỏi trang. Trang báo lỗi 404 tối ưu phải bao gồm:

Thông báo rằng người dùng đang vào 1 trang không tồn tại.

1 thanh tìm kiếm.

1 diễn giải dễ hiểu nào đó để người dùng biết ban đầu họ đang định tìm kiếm trang nào.

1 link đến home page.Để thêm 1 trang báo lỗi vào 1 website, người quản trị web có thể tự tạo hoặc sửa theo mẫu tại Google Webmaster Tools' 404 solution. Hoặc có thể tham khảo các bài viết ở báo Smashing Magazine năm 2007, 2008, 2009.

Công cụ liên quan

Live HTTP Headers for Firefox
Một plugin miễn phí cho thấy tiêu đề HTTP trong Firefox.

mozBar
mozBar giúp xem các số liệu có liên quan SEO khi bạn lướt web được dễ dàng hơn.

Open Site Explorer
Open Site Explorer là một công cụ miễn phí cung cấp cho quản trị web khả năng nhìn thấy lên đến 10000 liên kết tới bất kỳ trang web hoặc trang web thông qua chỉ số web Linkscape.

Tài liệu tham khảo thêm

HTTP/1.1: Status Code Definitions
Tài liệu chính thức về mã trạng thái HTTP của W3.

HTTP Status Codes
Tài liệu chính thức của Google về mã trạng thái HTTP cho các webmaster.

(ST)

Thẻ tiêu đề - Title trang web

Những kiến thức cơ bản nhất về thẻ tiêu đề (title trang web) đây là phần quan trọng bậc nhất trong SEO

Những kiến thức cơ bản nhất về thẻ tiêu đề (title trang web) đây là phần quan trọng bậc nhất trong SEO

Thẻ tiêu đềThẻ tiêu đề, hay còn gọi là mục tiêu đề, nêu lên nội dung của 1 văn bản, và bắt buộc phải có đối với các văn bản HTML/XHTML.

Lệnh Code:


Cấu trúc tối ưu nhất:Keyword chính - keyword phụ | Tên thương hiệu

Hoặc:

Tên thương hiệu | keyword chính - keyword phụ

Áp dụng tối ưu nhất:Ít hơn 70 ký tự, giống như giới hạn số ký tự mà Google cho phép hiển thị ở kết quả tìm kiếm.

Thẻ tiêu đề là gì?Là phần nội dung miêu tả cho 1 tài liệu trực tuyến. Nó là yếu tố quan trọng nhất trong các yếu tố on-page SEO (đứng sau nội dung) và xuất hiện tại 3 vị trí chính:

Trình duyệt:Nó xuất hiện ở phần trên cùng của trình duyệt cũng như của các tab.


Trang kết quả tìm kiếm:Nó cũng xuất hiện ở trang kết quả tìm kiếm


Các web khác:Rất nhiều khi các web khác (đặc biệt là mạng xã hội) sẽ sử dụng thẻ tiêu đề của 1 trang web làm link anchor text.

Áp dụng tối ưu nhất trong SEOTiêu đề của một trang web là phần miêu tả ngắn gọn và chính xác nhất về nội dung của trang. Yếu tố này tạo ra giá trị trong 3 lĩnh vực cụ thể (sẽ được nêu dưới đây ), và rất quan trọng đối với người dùng cũng như SEO (Tối ưu hóa công cụ tìm kiếm):

Sự liên quanTạo ra một thẻ tiêu đề có chứa từ khóa là một điều rất quan trọng để tăng thứ hạng đối với công cụ tìm kiếm. Ảnh chụp màn hình dưới đây trích từ 1 kháo sát của VietMoz với 37 chuyên gia hàng đầu trong lĩnh vực SEO về yếu tố xếp hạng của công cụ tìm kiếm. Trong cuộc khảo sát đó, 35/37 người tham gia nói rằng việc để key-word trong thẻ tiêu đề là nơi quan trọng nhất để sử dụng từ khóa để đạt được thứ hạng cao.


Vì thẻ tiêu đề là phần quan trọng như vậy trong SEO, việc thực hành để tạo 1 thẻ tiêu đề tốt là nhiệm vụ đơn giản nhất và có hiệu quả nhất. Các lưu ý dưới đây bao gồm việc làm thế nào để tối ưu hóa thẻ tiêu đề với công cụ tìm kiếm và cho mục đích sử dụng:

- Chú ý về độ dài:

70 là số ký tự tối đa sẽ được hiển thị trên kết quả tìm kiếm ( và sẽ là dấu “...” để thể hiện rằng thẻ tiêu đề đã được cắt bỏ)

- Đặt từ khóa quan trọng gần phần đầu thẻ tiêu đề

Theo thử nghiệm và kinh nghiệm của SEOMoz, từ khóa được đặt càng gần đầu tiên của thẻ tiêu đề thì nó càng giúp ích hơn cho việc xếp hạng và khả năng người dùng sẽ click vào kết quả tìm kiếm nhiều hơn.


- Đòn bẩy thương hiệu

Nhiều công ty SEO khuyên bạn nên đặt tên thương hiệu ở phần cuối thẻ tiêu đề, và nhiều khi lời khuyên này cũng có tác dụng tốt, thay vì ở phía đầu. Yếu tố tạo nên sự khác biệt ở đây là sức mạnh và độ phổ biến của thương hiệu đó trong thị trường mục tiêu. Nếu đó là một thương hiệu nổi tiếng, hãy đặt ở đầu để tạo đột phá về số lượt click qua kết quả tìm kiếm. Nếu không, key-word nên đặt ở trước tiên.

- Xem xét khả năng đọc và tác động cảm xúc

Càng tạo được một thẻ tiêu đề hấp dẫn sẽ kéo được càng nhiều lượt truy cập vào trang web hơn từ kết quả tìm kiếm. Do đó, điều quan trọng là không chỉ cần nghĩ đến tối ưu hóa và sử dụng từ khóa, mà còn phải nghĩ đến trải nghiệm của người dùng. Thẻ tiêu đề là sự tương tác đầu tiên của 1 khách hàng đối với thương hiệu của bạn khi họ tìm thấy trong kết quả tìm kiếm. Cho nên, hãy truyền tải những án tượng tích cực nhất có thể.

Trình duyệtThẻ tiêu đề của bất kỳ trang nào đều xuất hiện ở thanh trên cùng của trình duyệt. Mặc dù thẻ tiêu đề rất quan trọng đối với trải nghiệm của người dùng, nhưng vị trí này được đánh giá là được người dùng rất ít chú ý đến.


Trang kết quả tìm kiếmSử dụng các từ khóa trong thẻ tiêu đề có nghĩa là công cụ tìm kiếm sẽ “tô đậm” các từ đó trong kết quả tìm kiếm khi người dùng thực hiện một thao tác tìm kiếm với các từ đó. Điều này giúp người dùng dễ nhìn hơn và giúp tăng tỉ lệ click.




(ST)

Thẻ miêu tả - Meta Description Tag

Thẻ miêu tả có tên tiếng Anh là Meta Description, là một thẻ meta rất quan trọng trong quá trình tối ưu website. Bài viết được Ms. Thu Minh biên dịch.

Meta Description Tag - Thẻ miêu tảThẻ miêu tả, một thuộc tính của HTML, cung cấp giải thích ngắn gọn về nội dụng của trang web, thường được công cụ tìm kiếm sử dụng trong các kết quả tìm kiếm để hiển thị các đoạn xem trước của một trang nhất định.

Mẫu code:


Độ dài tối ưu đối với công cụ tìm kiếm:Khoảng 155 ký tự.
Thẻ miêu tả là gì?Thẻ miêu tả, mặc dù không đóng vai trò quan trọng trong việc xếp thứ hạng, nhưng lại vô cùng quan trọng trong việc giành được click của người dùng trong trang kết quả tìm kiếm (SERPs). Đoạn văn ngắn này là cơ hội chính để quảng cáo nội dung đến người dùng và cho họ biết chính xác những gì mà trang đó có liên quan đến những gì họ đang tìm kiếm.

Thẻ miêu tả nên sử dụng từ khóa một cách thông minh, đồng thời cũng phải là một miêu tả hấp dẫn để người tìm kiếm sẽ muốn click. Điểm mấu chốt là nó phải liên quan đến trang và miêu tả của các trang phải khác nhau. Miêu tả tối ưu nên chứa khoảng 150-160 ký tự.

Áp dụng tối ưu nhất trong SEO

Viết một bản quảng cáoThẻ miêu tả thực hiện chức năng như một bản quảng cáo, thu hút người đọc đến website qua kết quả tìm kiếm và do đó, nó là một phần rất quan trọng của tiếp thị tìm kiếm. Một miêu tả dễ đọc, hấp dẫn sẽ đem lại tỉ lệ click rất cao cho trang web. Để tối đa tỉ lệ này, cần chú ý rằng Google và các công cụ tìm kiếm khác đều bôi đậm keyword trong phần miêu tả khi nó phù hợp với truy vấn tìm kiếm.

Lưu ý về độ dàiThẻ miêu tả có thể có độ dài tùy ý, nhưng công cụ tìm kiếm thường cắt đi đoạn dài hơn 160 ký tự. Vì thế, tốt nhất nên để độ dài vào khoảng 150-160 ký tự.

Tránh trùng lặp thẻ miêu tảCũng giống như thẻ tiêu đề, điều quan trọng là thẻ miêu tả cho mỗi trang phải là duy nhất. Một cách để chống lại trùng lặp là tạo ra phương pháp linh hoạt và theo thứ tự để tạo một thẻ miêu tả độc đáo cho các trang tự động.


Không phải là yếu tố xếp hạng GoogleGoogle công bố vào tháng 9/2009 là thẻ miêu tả cũng như meta keyword đều không phải là yếu tố được sử dụng trong thuật toán xếp hạng của Google. Google sử dụng thẻ miêu tả để trả lại kết quả tìm kiếm khi người dùng sử dụng thao tác tìm kiếm nâng cao để phù hợp với nội dụng thẻ, cũng như để xem trước trang web trên trang kết quả tìm kiếm. Điều quan trọng để lưu ý rằng thẻ miêu tả không ảnh hưởng đến các thuật toán xếp hạng của Google để tìm kiếm web bình thường.

Dấu “” cắt mô tảBất cứ khi nào dấu “” được sử dụng trong thẻ miêu tả, Google sẽ cắt phần miêu tả sau đó. Để tránh trường hợp này, cách tốt nhất là loại bỏ các ký tự không phải thuộc bảng chữ cái và chữ số. Nếu bắt buộc phải để dấu “”, nên chuyển thành dấu ‘ ‘ thay cho dấu “ “.

Đôi khi không cần thiết phải viết thẻ miêu tảTheo logic thông thường, tốt hơn hết là viết một thẻ miêu tả chuẩn, tuy nhiên, điều này không phải luôn luôn đúng. Sử dụng nguyên tắc thông thường rằng, nếu trang web đang nhắm vào 1-3 từ được tìm kiếm rất nhiều, kèm theo 1 thẻ miêu tả tốt sẽ tăng lượt người truy cập. Tuy nhiên, nếu trang web nhắm vào các cụm từ khóa dài (+3 từ), ví dụ như với hàng trăm bài báo hoặc bài viết blogs, hoặc danh mục hàng trăm sản phẩm, thì sẽ khôn ngoan hơn khi để các công cụ tìm kiếm tự trích dẫn các đoạn văn bản liên quan. Lý do rất đơn giản, khi bộ máy tìm kiếm hoạt động, nó luôn hiển thị các keyword (và các từ xung quanh đó) mà người dùng tìm kiếm. Nếu người quản trị web viết 1 thẻ miêu tả, sẽ làm giảm sự liên quan đó.

Tài liệu tham khảo thêm



(ST)

Nội dung trùng lặp - Duplicate Content

Google không thích các web bị trùng lặp nội dung, bài viết này hướng dẫn và giải thích chi tiết về khái niệm trùng lặp nội dung trong SEO.

Nội dung trùng lặp là gì?Nội dung trùng lặp là nội dung xuất hiện trên Internet tại hơn một địa chỉ ( URL). Đây là một vấn đề, bởi vì khi có nhiều hơn 1 đoạn nội dung giống hệt nhau trên Internet sẽ gây khó khăn cho công cụ tìm kiếm để quyết định phiên bản nào phù hợp hơn với một truy vấn tìm kiếm nhất định. Để đưa ra kết quả tìm kiếm tốt nhất, công cụ tìm kiếm sẽ hạn chế hiển thị các nội dung bị sao chép, vì thế bắt buộc phải lựa chọn phiên bản nhiều khả năng là bản gốc nhất (hoặc tốt nhất).

Mẫu code Rel=Canonical


Mẫu code Meta Robots


Ba vấn đề lớn nhất mà duplicate content gây ra:

Search engine (SE) không thể phân biệt phiên bản nào được copy, phiên bản nào là gốc.

SE không biết nên hướng các link metrics (mozrank, moztrust, bản quyền, anchor text, link juice …) đến một trang web, hay giữ tách rời giữa nhiều phiên bản.

SE không biết nên chọn phiên bản nào để xếp hạng cho kết quả tìm kiếm.

Khi xuất hiện nội dung trùng lặp, người quản trị web đối mặt với vấn đề mất thứ hạng và giảm traffic, và SE sẽ đưa ra kết quả tìm kiếm kém chính xác hơn.

(Hình: Không thể xếp hạng tất cả được. Bắt buộc phải tìm ra bản gốc! )

Ví dụ về nội dung trùng lặp:

1. Các tham số của URLCác thông số URL như theo dõi nhấp chuột và một số mã phân tích có thể gây ra các vấn đề nội dung trùng lặp.
(hình: hệ thống category URL tạo nên các phiên bản giống nhau của cùng 1 trang web)

2. Phiên bản in ấnCác phiên bản để in ấn của một nội dung có thể gây ra duplicate content khi nhiều phiên bản của trang được xếp hạng.
(hình: URL của phiên bản để in gây ra trùng lặp nội dung)

3. Senssion IDsCác senssion IDs là nguyên nhân chủ yếu gây ra nội dung trùng lặp. Việc này xảy ra khi mỗi người dùng vào website và để lại 1 senssion ID và được lưu lại ở URL.
(hình: Senssion ID tạo nên các phiên bản giống nhau của cùng 1 trang web)

Áp dụng trong SEOBất cứ khi nào nội dung của một trang web có thể được tìm thấy tại nhiều URL, nó nên được khai báo với công cụ tìm kiếm. Điều này có thể được thực hiện bằng cách sử dụng một chuyển hướng 301 đến URL chính xác, sử dụng rel = canonical hoặc trong một số trường hợp có thể sử dụng công cụ xử lý thông số trong Trung tâm Quản trị Trang web của Google.

Chuyển hướng 301Trong nhiều trường hợp, cách tốt nhất để chống lại nội dung trùng lặp là thiết lập một trang chuyển hướng 301 từ trang "bản sao" các trang nội dung ban đầu. Khi các trang với nhiều khả năng được xếp hạng tốt được kết hợp thành một trang duy nhất, chúng không còn cạnh tranh với nhau, mà tạo ra một sự liên quan mạnh mẽ hơn và tín hiệu phổ biến tổng thể. Điều này sẽ tác động tích cực đến khả năng được xếp hạng tốt trong công cụ tìm kiếm.


(HÌnh: giờ thì xếp hạng trang này được rồi!)

Rel="canonical"Một tùy chọn khác để đối phó với nội dung trùng lặp là sử dụng rel = canonical tag. Các rel = canonical đi cùng một link juice (ranking power) cũng giống như là một chuyển hướng 301, và để thực hiện thì thường mất it thời gian hơn.

Thẻ này là một phần của HTML head của một trang web. Thẻ meta này không phải là mới, nhưng như nofollow, chỉ cần sử dụng một tham số rel mới. Ví dụ:


Thẻ này báo cho Bing và Google rằng trang đã đưa nhất định phải được xem là bản sao của www.example.com/canonical-version-of-page/ URL và tất cả các liên kết, các số liệu nội dung mà SE áp dụng phải được công nhận cho URL kia.

(Hình: Đúng rồi! Đây chỉ là bản sao của SEOMoz blog URL.

Đây cũng giống như 301, nhưng không phải sửa chữa gì nhiều)
Các ví dụ sau đây cho thấy lỗi viết hoa gây ra trùng lặp nội dung:

http://www.simplyhired.com/a/jobs/list/q-software+developer
http://www.simplyhired.com/a/jobs/list/q-Software+developer
http://www.simplyhired.com/a/jobs/list/q-software+Developer

Sự khác biệt duy nhất giữa các URL này chữ viết hoa của các từ "software" và "developer". Công cụ tìm kiếm sẽ coi tất cả các URL trên là các trang khác nhau và xét chúng là dublicate content. Bằng cách thực hiện rel = "canolical" đối với trường hợp thứ 2 và thứ 3, chúng sẽ chỉ trỏ lại vào URL 1, các công cụ tìm kiếm sẽ biết để coi tất cả các URL này là URL # 1.

Noindex, followThẻ meta robot với các giá trị "no index, no follow" có thể được thực hiện trên các trang web mà không cần phải được bao gồm trong chỉ mục của công cụ tìm kiếm. Điều này cho phép các bot tìm kiếm craw links trên 1 trang web nhất định, nhưng vẫn không bao gồm chúng trong mục xếp hạng. Điều này đặc biệt hữu ích với vấn đề ngắt trang.

Parameter Handling trong Google Webmaster ToolsGoogle Webmaster Tools cho phép bạn thiết lập tên miền ưa thích của trang web của bạn và xử lý các thông số URL khác nhau khác nhau. Hạn chế chính của những phương pháp này là họ chỉ làm việc cho Google. Bất kỳ sự thay đổi của bạn ở đây sẽ không ảnh hưởng đến Bing hoặc bất kỳ công cụ tìm kiếm các khác.

Đặt tên miền ưa thíchĐiều này nên được thiết lập cho tất cả các trang web. Đó là một cách đơn giản để báo cho Google xem một trang web nhất định nên được hiển thị có hoặc không có www trong các trang kết quả tìm kiếm.

Các phương pháp khác nhằm loại bỏ Duplicate Content1. Duy trì tính thống nhất các liên kết nội bộ trong suốt một trang web. Ví dụ, nếu người quản trị trang web xác định rằng phiên bản canonical của một tên miền là www.example.com/, thì tất cả các liên kết nội bộ nên là http://www.example.com/example.html hơn là http://example. com / page.html. (chú ý không có www).

2. Khi sử dụng nội dung của trang khác, cần đảm bảo rằng phải có link back đến trang đó. Xem phần “Đối phó với nội dung trùng lặp” để biết thêm thông tin.

3. Giảm thiểu nội dung tương tự. Thay vì 1 trang web về áo mưa cho bé trai và 1 trang web về áo mưa cho bé gái, nội dung giống nhau đến 95%, hãy thêm nội dung để chúng trở nên khác biệt. Hoặc có thể ghép thành 1 trang chung về áo mưa cho trẻ em.

Công cụ liên quan

\

(ST)

Neo văn bản - Anchor text

Anchor Text là văn bản khi click có thể nhìn thấy một siêu liên kết. Trong các trình duyệt hiện đại, nó thường là màu xanh và gạch dưới

Neo văn bản - Anchor TextAnchor Text là văn bản khi click có thể nhìn thấy một siêu liên kết. Trong các trình duyệt hiện đại, nó thường là màu xanh và gạch dưới, chẳng hạn như liên kết đến trang chủ vietmoz .


Mẫu code:


Tối ưu định dạng:Để làm SEO thân thiện thì anchor text (neo văn bản) nên ngắn gọn và có liên quan đến trang mục tiêu.

Anchor text là gì?Anchor text hay còn gọi mỏ neo văn bản nghĩa là mọi người có thể nhìn thấy từ đó liên kết hiển thị liên kết đến một tài liệu hoặc vị trí trên trang web. Ví dụ: Trong cụm từ "vietmoz" là một nguồn tin tức, nhưng tôi thực sự thích cụm từ "đào tạo SEO", hai cụm từ của anchor text (neo văn bản) tồn tại cho hai liên kết khác nhau - "vietmoz" là anchor text (neo văn bản) chỉ vào http://vietmoz.com, trong khi "đào tạo SEO" điểm đến là http://vietmoz.com/dao-tao-seo/.

Công cụ tìm kiếm sử dụng văn bản này để giúp xác định đối tượng của các tài liệu được liên kết đến. Trong ví dụ trên, các liên kết sẽ cho các công cụ tìm kiếm khi người dùng tìm kiếm "vietmoz", Mình nghĩhttp://vietmoz.com/ đó là một trang web có liên quan cho thuật ngữ "vietmoz" vàhttp://vietmoz.com/dao-tao-seo/ có liên quan đến "đào tạo SEO". Nếu trang web được nhiều người nghĩ rằng một trang cụ thể có liên quan cho một tập hợp các thuật ngữ, trang đó có thể quản lý để xếp hạng tốt ngay cả nếu các điều khoản không bao giờ xuất hiện trong các văn bản chính nó. (Đoạn này hơi khó hiểu các bạn cố gắng đọc kỹ nhé).


Trong ví dụ trên, "Jon wye’s custom designed belts" sẽ là anchor text (neo văn bản) của liên kết này

Áp dụng tốt nhất trong SEOLà công cụ tìm kiếm đã trưởng thành, họ đã bắt đầu xác định nhiều số liệu để xác định thứ hạng . Một số liệu mà đứng ra giữa các phần còn là liên kết thích hợp. Liên quan liên kết được xác định trong cả nội dung của trang nguồn và nội dung của các văn bản neo (anchor text). Đó là một hiện tượng tự nhiên xảy ra khi mọi người liên kết các nội dung khác trên trang web.

Điều này rất dễ hiểu với một ví dụ. Hãy tưởng tượng rằng giả sử mình viết một blog về "làm đẹp". Và bạn đang tìm hiểu thêm về "làm đẹp", mình đánh dấu lại một phần đọc trực tuyến ngày xưa những gì người khác đã nói về "làm đẹp". Bây giờ tưởng tượng rằng trong khi đọc về chủ đề yêu thích của bạn, bạn tìm thấy một bài viết về "thủ thuật làm đẹp mái tóc". Bạn cảm thấy vui mừng, bạn quay trở lại trang web của bạn và về bài viết để bạn bè của bạn có thể đọc về nó.

Khi bạn viết các bài đăng blog và liên kết đến bài viết, bạn nhận được để lựa chọn các neo văn bản cho các liên kết trỏ vào bài viết. Bạn có thể chọn một cái gì đó giống như "bấm vào đây", nhưng nhiều khả năng bạn sẽ chọn một cái gì đó có liên quan đến bài viết. Trong trường hợp này, bạn chọn "thủ thuật làm đẹp mái tóc" Một người nào khác liên kết đến bài viết đó có thể sử dụng liên kết là anchor text (neo văn bản) "các biện pháp làm đẹp tóc".

Thông tin này là điều cần thiết để các công cụ tìm kiếm có thể sử dụng nó để xác định những gì có liên quan tới các trang mục tiêu và do đó truy vấn nó. Những mô tả này là tương đối khách quan và được chia sẻ bởi những người thực sự. Số liệu này, kết hợp với việc xử lý ngôn ngữ tự nhiên phức tạp, chia sẻ của các chỉ số liên quan liên kết trực tuyến.

Các chỉ số liên quan liên kết quan trọng khác là những nguồn liên kết và hệ thống phân cấp thông tin. Ví dụ, các công cụ tìm kiếm cũng có thể sử dụng thực tế là một người nào đó liên quan đến bài viết đánh dấu "làm đẹp tóc" từ một blog về "kỹ thuật nhuộm màu tóc" để bổ sung thuật toán của họ sự hiểu biết về sự liên quan của trang đã cho. Tương tự như vậy, các công cụ có thể sử dụng thực tế là bài viết gốc được nằm tại URL để xác định các vị trí cấp cao và phù hợp của nội dung.

Những điểm chính:

Nếu các liên kết trỏ đến một trang với các từ khóa trong văn bản neo của bạn, trang đó sẽ có khả năng được xếp hạng cao. Ví dụ thực tế ngày nay bao gồm các trang kết quả tìm kiếm tạo động cơ cho các truy vấn, "bấm vào đây "và "xem tiếp". Nhiều người trong số các kết quả của Google cho các truy vấn xếp hạng chỉ vì neo văn bản (anchor text) của liên kết trong nước.

Mọi người có xu hướng liên kết với nội dung bằng cách sử dụng neo văn bản của tên miền hoặc tiêu đề của trang. Đây là một lợi thế để SEO bao gồm các từ khóa mà họ muốn xếp hạng trong hai yếu tố.

Tầm quan trọng của Anchor Text thứ nhấtThí nghiệm VietMoz đã chỉ ra rằng nếu hai liên kết được nhắm mục tiêu cùng một URL, chỉ có các anchor text (neo văn bản) được sử dụng trong liên kết đầu tiên được tính bởi Google.

Gần đây, một số quản trị trang web đã chạy thí nghiệm cho thấy cách để đếm nhiều cụm từ neo văn bản chứa trên cùng một trang và trỏ đến cùng một mục tiêu. Điều này được thực hiện bằng cách tạo ra neo trên trang mục tiêu và liên kết với những người neo bằng cách sử dụng hashags, chẳng hạn như cách SEOmoz liên kết với blog của bài:


Công cụ liên quan

mozBar
mozBar giúp xem các số liệu có liên quan SEO khi bạn lướt web được dễ dàng hơn.

Open Site Explorer
Open Site Explorer là một công cụ miễn phí cung cấp cho quản trị web khả năng nhìn thấy lên đến 10000 liên kết tới bất kỳ trang web hoặc trang web thông qua chỉ số web Linkscape.

Tài liệu tham khảo thêm


The Anatomy of a Large-Scale Hypertextual Web Search Engine
Nghiên cứu thuật toán PageRank gốc bài báo được viết bởi người đồng sáng lập Google Larry Page và Sergey Brin.

Webmaster Guidelines
Tài liệu chính thức của Google nói về việc xây dựng các trang web thân thiện của Google.

Text Links and PageRank
Matt Cutts, người đứng đầu của nhóm Webspam tại Google, suy nghĩ về siêu liên kết liên quan đến SEO và Google..

(ST)
Anchor Text là văn bản khi click có thể nhìn thấy một siêu liên kết. Trong các trình duyệt hiện đại, nó thường là màu xanh và gạch dưới

Neo văn bản - Anchor TextAnchor Text là văn bản khi click có thể nhìn thấy một siêu liên kết. Trong các trình duyệt hiện đại, nó thường là màu xanh và gạch dưới, chẳng hạn như liên kết đến trang chủ vietmoz .


Mẫu code:


Tối ưu định dạng:Để làm SEO thân thiện thì anchor text (neo văn bản) nên ngắn gọn và có liên quan đến trang mục tiêu.

Anchor text là gì?Anchor text hay còn gọi mỏ neo văn bản nghĩa là mọi người có thể nhìn thấy từ đó liên kết hiển thị liên kết đến một tài liệu hoặc vị trí trên trang web. Ví dụ: Trong cụm từ "vietmoz" là một nguồn tin tức, nhưng tôi thực sự thích cụm từ "đào tạo SEO", hai cụm từ của anchor text (neo văn bản) tồn tại cho hai liên kết khác nhau - "vietmoz" là anchor text (neo văn bản) chỉ vào http://vietmoz.com, trong khi "đào tạo SEO" điểm đến là http://vietmoz.com/dao-tao-seo/.

Công cụ tìm kiếm sử dụng văn bản này để giúp xác định đối tượng của các tài liệu được liên kết đến. Trong ví dụ trên, các liên kết sẽ cho các công cụ tìm kiếm khi người dùng tìm kiếm "vietmoz", Mình nghĩhttp://vietmoz.com/ đó là một trang web có liên quan cho thuật ngữ "vietmoz" vàhttp://vietmoz.com/dao-tao-seo/ có liên quan đến "đào tạo SEO". Nếu trang web được nhiều người nghĩ rằng một trang cụ thể có liên quan cho một tập hợp các thuật ngữ, trang đó có thể quản lý để xếp hạng tốt ngay cả nếu các điều khoản không bao giờ xuất hiện trong các văn bản chính nó. (Đoạn này hơi khó hiểu các bạn cố gắng đọc kỹ nhé).


Trong ví dụ trên, "Jon wye’s custom designed belts" sẽ là anchor text (neo văn bản) của liên kết này

Áp dụng tốt nhất trong SEOLà công cụ tìm kiếm đã trưởng thành, họ đã bắt đầu xác định nhiều số liệu để xác định thứ hạng . Một số liệu mà đứng ra giữa các phần còn là liên kết thích hợp. Liên quan liên kết được xác định trong cả nội dung của trang nguồn và nội dung của các văn bản neo (anchor text). Đó là một hiện tượng tự nhiên xảy ra khi mọi người liên kết các nội dung khác trên trang web.

Điều này rất dễ hiểu với một ví dụ. Hãy tưởng tượng rằng giả sử mình viết một blog về "làm đẹp". Và bạn đang tìm hiểu thêm về "làm đẹp", mình đánh dấu lại một phần đọc trực tuyến ngày xưa những gì người khác đã nói về "làm đẹp". Bây giờ tưởng tượng rằng trong khi đọc về chủ đề yêu thích của bạn, bạn tìm thấy một bài viết về "thủ thuật làm đẹp mái tóc". Bạn cảm thấy vui mừng, bạn quay trở lại trang web của bạn và về bài viết để bạn bè của bạn có thể đọc về nó.

Khi bạn viết các bài đăng blog và liên kết đến bài viết, bạn nhận được để lựa chọn các neo văn bản cho các liên kết trỏ vào bài viết. Bạn có thể chọn một cái gì đó giống như "bấm vào đây", nhưng nhiều khả năng bạn sẽ chọn một cái gì đó có liên quan đến bài viết. Trong trường hợp này, bạn chọn "thủ thuật làm đẹp mái tóc" Một người nào khác liên kết đến bài viết đó có thể sử dụng liên kết là anchor text (neo văn bản) "các biện pháp làm đẹp tóc".

Thông tin này là điều cần thiết để các công cụ tìm kiếm có thể sử dụng nó để xác định những gì có liên quan tới các trang mục tiêu và do đó truy vấn nó. Những mô tả này là tương đối khách quan và được chia sẻ bởi những người thực sự. Số liệu này, kết hợp với việc xử lý ngôn ngữ tự nhiên phức tạp, chia sẻ của các chỉ số liên quan liên kết trực tuyến.

Các chỉ số liên quan liên kết quan trọng khác là những nguồn liên kết và hệ thống phân cấp thông tin. Ví dụ, các công cụ tìm kiếm cũng có thể sử dụng thực tế là một người nào đó liên quan đến bài viết đánh dấu "làm đẹp tóc" từ một blog về "kỹ thuật nhuộm màu tóc" để bổ sung thuật toán của họ sự hiểu biết về sự liên quan của trang đã cho. Tương tự như vậy, các công cụ có thể sử dụng thực tế là bài viết gốc được nằm tại URL để xác định các vị trí cấp cao và phù hợp của nội dung.

Những điểm chính:

Nếu các liên kết trỏ đến một trang với các từ khóa trong văn bản neo của bạn, trang đó sẽ có khả năng được xếp hạng cao. Ví dụ thực tế ngày nay bao gồm các trang kết quả tìm kiếm tạo động cơ cho các truy vấn, "bấm vào đây "và "xem tiếp". Nhiều người trong số các kết quả của Google cho các truy vấn xếp hạng chỉ vì neo văn bản (anchor text) của liên kết trong nước.

Mọi người có xu hướng liên kết với nội dung bằng cách sử dụng neo văn bản của tên miền hoặc tiêu đề của trang. Đây là một lợi thế để SEO bao gồm các từ khóa mà họ muốn xếp hạng trong hai yếu tố.

Tầm quan trọng của Anchor Text thứ nhấtThí nghiệm VietMoz đã chỉ ra rằng nếu hai liên kết được nhắm mục tiêu cùng một URL, chỉ có các anchor text (neo văn bản) được sử dụng trong liên kết đầu tiên được tính bởi Google.

Gần đây, một số quản trị trang web đã chạy thí nghiệm cho thấy cách để đếm nhiều cụm từ neo văn bản chứa trên cùng một trang và trỏ đến cùng một mục tiêu. Điều này được thực hiện bằng cách tạo ra neo trên trang mục tiêu và liên kết với những người neo bằng cách sử dụng hashags, chẳng hạn như cách SEOmoz liên kết với blog của bài:


Công cụ liên quan

mozBar
mozBar giúp xem các số liệu có liên quan SEO khi bạn lướt web được dễ dàng hơn.

Open Site Explorer
Open Site Explorer là một công cụ miễn phí cung cấp cho quản trị web khả năng nhìn thấy lên đến 10000 liên kết tới bất kỳ trang web hoặc trang web thông qua chỉ số web Linkscape.

Tài liệu tham khảo thêm

The Anatomy of a Large-Scale Hypertextual Web Search Engine
Nghiên cứu thuật toán PageRank gốc bài báo được viết bởi người đồng sáng lập Google Larry Page và Sergey Brin.

Webmaster Guidelines
Tài liệu chính thức của Google nói về việc xây dựng các trang web thân thiện của Google.

Text Links and PageRank
Matt Cutts, người đứng đầu của nhóm Webspam tại Google, suy nghĩ về siêu liên kết liên quan đến SEO và Google..

(ST)