Thủ thuật chống
backlink xấu bằng HTTP
Referer không hiệu quả
Cách chặn liên kết trỏ tới từ domain không mong muốn này
là dùng file .htaccess để block những liên kết từ site mà mình
không mong muốn đến site mình dựa trên nguyên lý bắt
HTTP Referer header với nội dung hướng dẫn như sau:
Nhân dịp khai trương box này mình muốn chia sẽ với mọi
người thủ thuật “Chặn liên kết trỏ tới từ domain không
muốn” bằng .htaccess
Từ tình huống thực tế “Seo idol 2011″, xuất hiện tình huống
chơi xấu đội vietnamtours247.com bằng cách tạo link farm
với số lượng cực lớn từ blogspot. Mà tiêu biểu là
site .
Và từ thực tế để tiếp tục chiến đấu cùng Seoidol chắc hẳn
phải tìm ra cách di đó ngăn chặn phần nào việc chơi xấu
này. Mình cố gắng tìm tòi và lần mò khắc các diễn đàn seo
trên thế giới với hy vọng kiếm được giải pháp ngăn chặn việc
này tái diễn. Và mình tìm thấy được 1 giải pháp có thể “sử
dụng được”
Mình xin cung cấp 1 đoạn code trong file .htaccess như sau:
SetEnvIfNoCase Referer “.*(cụm từ chứa trong domain).*”
ban
SetEnvIfNoCase Referer “.*(blogspot).*” ban
SetEnvIfNoCase Referer “.*(azfreeapps).*” ban
order allow,deny
deny from env=ban
allow from all
Vì sao cách này lại không hiệu quả? Theo tôi thì nếu như bạn
hiểu được nguyên lý Google Crawl và Indexwebsite như thế
nào sẽ không khó để hiểu được điều này. Các bạn có thể
tham khảo thêm bài viết Google thu thập nội dung website
của bạn như thế nào. Ở đây tôi xin phép giải thích như sau:
Đoạn code trên dựa vào HTTP Referer header của một
request để chặn những backlink được cho là không mong
muốn. Trước tiên bạn cần phải hiểu được rằng HTTP
Referer là gì và được sinh ra như thế nào? HTTP Referer là một tham số được truyền đi trong request
thông qua header xảy ra khi bạn click chuột từ một trang web
A đến một trang web B. Lúc đó thông số HTTP Referer được
truyền đến trang B khi request là đường dẫn URL của trang
A. Tuy nhiên, khi kết hợp với quá trình Crawl và Index của
Google như tôi giới thiệu trong bài ở trên thì nó bao gồm
nhiều tiến trình nhỏ và có thể mô tả như sau: Một con Googlebot thứ nhất (gọi tắt là Googlebot #1) Crawl
trang A và thu thập nội dung của trang A, đồng thời thu thập
tất cả các URL liên kết có trong trang A, sau đó Googlebot
#1 này đem dữ kiện báo cáo về trung tâm lưu trữ. Các URL
liên kết được đưa tập hợp vào một danh sách và sắp xếp thứ
tự ưu tiên để phân công nhiệm vụ cho các Googlebot khác
tiếp tục đi Crawl và Index các danh sách URL đó. (Tham
thuật toán của Google trong việc xếp hạng các trang web.