Server - System - Manager - CentOS, Operation System, VBB, HACKING AND SECURITY

Go Back   Server - System - Manager - CentOS, Operation System, VBB, HACKING AND SECURITY > Dành cho webmaster > Công cụ cho Webmaster > Quảng bá thương hiệu

Reply
 
LinkBack Thread Tools Display Modes
  #1 (permalink)  
Old 08-07-2008
sieuhosting's Avatar
Moderator
 
Join Date: Jul 2008
Posts: 73
Thanks: 7
Thanked 2 Times in 2 Posts
Default Nội dung kép và phương pháp phát hiện mới của Google

Google không thích các nội dung kép. Lư do là Google muốn trong trang kết quả t́m kiếm, mười kết quả đầu tiên sẽ là mười trang khác nhau với nội dung khác nhau. Điều này giúp cho người t́m kiếm có nhiều lựa chọn chính xác và đa dạng, hơn là một loạt các nội dung trùng lặp trong top mười này.


Google sử dụng mô h́nh ứng dụng mới để xác định các nội dung trùng lặp, nội dung kép. Bọ lọc này sẽ giúp người t́m kiếm không phải chọn phải các nội dung trùng nhau trong trang kết quả t́m kiếm.

Nội dung bị trùng lặp như thế nào ?
Có rất nhiều lư do để nội dung bị lặp lại trên nhiều địa chỉ khác nhau, hoặc các tài liệu này có nội dung tương tự :

Nội dung trang Web tồn tại dưới nhiều định dạng : Trang Web, phiên bản in, phiên bản PDF, phiên bản Word, phiên bản PDA, mobile phone page, v.v
Nội dung được truyền đi từ trang Web : Ví dụ RSS, XML của các blog cá nhân hay bài viết mới.
Hệ thống quản trị tách lọc nội dung (CMS) hiển thị cùng một nội dung cho nhiều lựa chọn khác nhau. Ví dụ các mục được sắp xếp theo ngày tháng, tiêu đề, tên hay thể loại.
Trang Web có một phiên bản dự pḥng hay một bản sao nhằm tránh trường hợp trang chính không truy cập được hoặc khi có quá nhiều người truy cập vào cùng một trang.
Trường hợp ai đó đánh cắp hay lưu lại nội dung trang của bạn để rồi đặt nội dung đó trên một trang Web khác.
Để tránh hiển thị cùng một nội dung nhiều lần trong trang kết quả t́m kiếm, các máy t́m kiếm sẽ xác định những trang trùng lặp này.

Mô h́nh ứng dụng lọc nội dung kép
Mô h́nh ứng dụng lọc nội dung kép mà Google sử dụng được kết hợp từ nhiều phương pháp đă tồn tại trước đây. Nó cho phép xác định nhưng nội dung sao chép, trùng lặp trên Internet.

Mô h́nh ứng dụng mới này cho thấy Google rất coi trọng việc lọc nội dung kép. Đây có lẽ là bước cuối cùng trong kế hoặc tách lọc nội dung kép của Google. Các bạn có thể tham khảo thêm sâu về các bước Google tiến hành trước đây qua hai tài liệu sau :

Decting Near-Duplicates for Web Crawling.
Methods and Apparatus for Estimating Similarity.
Google làm ǵ khi phát hiện ra nội dung kép ?
Rất khó có thể nói chính xác Google sẽ làm ǵ khi t́m thấy nội dung kép. Có rất nhiều nguyên nhân mà việc nhân bản nội dung là hợp lư.

Nếu như Google chỉ bỏ nội dung kép khỏi một vài lệnh t́m kiếm th́ đó là điều chấp nhận được. Nhưng nếu Google áp dụng các mức phạt bằng cách loại bỏ những trang này ra khỏi chỉ mục Web th́ kết quả t́m kiếm của Google sẽ không c̣n chính xác đối với một số lệnh t́m kiếm nhất định. Và đương nhiên khi đó, Google có thể phạt nhầm các trang Web mà nội dung hoàn toàn hợp lư.

Có vẻ như Google sẽ hiển thị trang Web nổi tiếng nhất với nhiều liên kết trỏ đến nhất trong kết quả t́m kiếm khi nó t́m thấy nội dung kép trên nhiều địa chỉ khác nhau.

Làm ǵ với Website của bạn
Nếu như bạn muốn trang Web của ḿnh có thứ hạng cao th́ bạn nên loại bỏ các nội dung trùng lặp (Sẽ quay trở lại với bài viết về cách loại bỏ nội dung trung lặp với thẻ nofollow, meta, robots.txt, remove URL. C̣n tạm thời bạn có thể theo dơi Video Matt Cutts).

Hăy tạo ra những nội dung có ích và phong phú trên trang của ḿnh. Đây là cách làm tốt nhất v́ tớ luôn quan niệm “Content is King“.

Ngoài ra, nếu trang Web của bạn sử dụng cùng nội dung như nhiều trang khác th́ hăy cố gắng có nhiều liên kết trỏ đến hơn tất cả những trang c̣n lại mà có cùng một nội dung.

Hoài Nam - Quảng bá Web .

Tags: Duplicate Content, Google Search, noi dung kep, google penalty
Nội dung kép và phương pháp phát hiện mới của Google
Reply With Quote
Reply

Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off
Trackbacks are On
Pingbacks are On
Refbacks are On


Similar Threads
Thread Thread Starter Forum Replies Last Post
Phương thức tối ưu hóa của bộ máy t́m kiếm Google Admin Tin tức công nghệ 1 03-08-2008 11:35 PM
Sử dụng file ROBOTS.TXT để chặn các nội dung ko cho search tui3gang Quảng bá thương hiệu 0 23-07-2008 07:40 PM
Các h́nh ảnh kinh điển của thế giới cổ tích thời hiện đại hadesty Giai tri - chat chit - Relax 0 21-07-2008 06:59 PM
Từng buớc một để triển khai hệ thống Cluster Lovelinux Cài đặt CentOS và ứng dụng 1 09-07-2008 08:12 PM
Thủ thuật Google Adsense dành cho Webmaster Vietnam sieuhosting Kiếm tiền trên mạng 0 08-07-2008 07:18 AM


All times are GMT +1. The time now is 10:26 PM.


© Diễn đàn HackingArt (HA) được xây dựng và phát triển bởi các thành viên.
+ Diễn đàn HackingArt là nơi trao đổi của các webmaster chuyên nghiệp.