Wednesday, November 21, 2012

Cách thức hoạt động của bộ máy tìm kiếm



Một Search Engine hoạt động trình tự theo các bước sau:

Crawling =>  Indexing =>  Searching


Search Engine làm việc bằng cách lưu trữ thông tin về nhiều trang web. Những thông tin này sẽ được thu thập bởi các Spider (chính là Web crawling) và nội dung của mỗi trang sẽ được phân tích để Search Engine quyết định nên index cái nào (ví dụ, những từ khoá được thu thập từ các titles, heading hay một số trường đặc biệt gọi là meta tags) để trả về những thông tin mà người tìm kiếm mong muốn nhất. Dữ liệu về những trang Web sẽ được lưu trữ tại các cơ sở dữ liệu chỉ mục để sử dụng cho những lần truy vấn sau. Một số Search Engine, như Google chẳng hạn, sẽ lưu trữ toàn bộ hay một phần trang gốc (được xem như một cache) cũng như thông tin về trang Web đó, trái lại với một số Search Engine khác, như AltaVista, sẽ lữu trữ tất cả các từ của những trang mà nó tìm thấy.

Khi người dùng nhập vào các Search Engine một truy vấn (chủ yếu là các keyword), các Search Engine này sẽ kiểm các index của nó và cung cấp danh sách các trang Web phù hợp nhất, thường là các cụm từ ngắn hay một phần của một đoạn văn bản. Hầu hết các Search Engine đều sử dụng các Boolean Operators (toán tử luận lý) như AND, OR và NOT để xác định các search query (truy vấn tìm kiếm). Một số SE khác lại sử dụng những phương pháp tiên tiến hơn như Proximity Search (tìm kiếm gần kề) để cho phép người dùng xác định được khoảng cách giữa các từ khoá.

Sự hữu ích của các Search Engine phụ thuộc vào mức độ phù hợp của các kết quả mà nó mang lại. Ta có thể tìm được hàng triệu trang Web chứa từ khoá mà ta cần tìm, tuy nhiên, những trang có Search Engine mạnh sẽ cho ra các kết quả phù hợp hơn cả. Hiện nay, đa số các Search Engines được điều hành bởi các công ty tư nhân sử dụng những thuật toán chuyên dụng và một cơ sỡ dữ liệu kín, mặc dù vậy một số Search Engine vẫn là nguồn mở.

Trên thế giới hiện có khoảng 263 công cụ tìm kiếm, phổ biến nhất là Google, Yahoo và Bing. Tuy nhiên ở Việt Nam, Google là công cụ tìm kiếm được sử dụng phổ biến nhất, chiếm đến 90% số lượng tìm kiếm. Khoảng 74% người dùng Internet ở Việt Nam truy cập hàng ngày vào Google trong khi đó Yahoo chí có 14%. Vì vậy, hầu hết các trang web chỉ tập trung làm SEO trên công cụ tìm kiếm Google.


Học viện đào tạo seo master iNET!
---------------------------------------------------------------------------------------
Trang chủ: http://truongdaotaoseoinet.blogspot.com/

No comments:

Post a Comment