Một Search Engine hoạt động trình tự theo các bước sau:
Crawling => Indexing => Searching
Search Engine làm việc bằng cách lưu trữ thông tin về nhiều
trang web. Những thông tin này sẽ được thu thập bởi các Spider (chính là Web
crawling) và nội dung của mỗi trang sẽ được phân tích để Search Engine quyết định
nên index cái nào (ví dụ, những từ khoá được thu thập từ các titles, heading
hay một số trường đặc biệt gọi là meta tags) để trả về những thông tin mà người
tìm kiếm mong muốn nhất. Dữ liệu về những trang Web sẽ được lưu trữ tại các cơ
sở dữ liệu chỉ mục để sử dụng cho những lần truy vấn sau. Một số Search Engine,
như Google chẳng hạn, sẽ lưu trữ toàn bộ hay một phần trang gốc (được xem như một
cache) cũng như thông tin về trang Web đó, trái lại với một số Search Engine
khác, như AltaVista, sẽ lữu trữ tất cả các từ của những trang mà nó tìm thấy.
Khi người dùng nhập vào các Search Engine một truy vấn (chủ
yếu là các keyword), các Search Engine này sẽ kiểm các index của nó và cung cấp
danh sách các trang Web phù hợp nhất, thường là các cụm từ ngắn hay một phần của
một đoạn văn bản. Hầu hết các Search Engine đều sử dụng các Boolean Operators
(toán tử luận lý) như AND, OR và NOT để xác định các search query (truy vấn tìm
kiếm). Một số SE khác lại sử dụng những phương pháp tiên tiến hơn như Proximity
Search (tìm kiếm gần kề) để cho phép người dùng xác định được khoảng cách giữa
các từ khoá.
Sự hữu ích của các Search Engine phụ thuộc vào mức độ phù hợp
của các kết quả mà nó mang lại. Ta có thể tìm được hàng triệu trang Web chứa từ
khoá mà ta cần tìm, tuy nhiên, những trang có Search Engine mạnh sẽ cho ra các
kết quả phù hợp hơn cả. Hiện nay, đa số các Search Engines được điều hành bởi
các công ty tư nhân sử dụng những thuật toán chuyên dụng và một cơ sỡ dữ liệu
kín, mặc dù vậy một số Search Engine vẫn là nguồn mở.
Trên thế giới hiện có khoảng 263 công cụ tìm kiếm, phổ biến
nhất là Google, Yahoo và Bing. Tuy nhiên ở Việt Nam, Google là công cụ tìm kiếm
được sử dụng phổ biến nhất, chiếm đến 90% số lượng tìm kiếm. Khoảng 74% người
dùng Internet ở Việt Nam truy cập hàng ngày vào Google trong khi đó Yahoo chí
có 14%. Vì vậy, hầu hết các trang web chỉ
tập trung làm SEO trên công cụ tìm kiếm Google.
Học viện đào tạo seo master iNET!
---------------------------------------------------------------------------------------
Trang chủ: http://truongdaotaoseoinet.blogspot.com/
No comments:
Post a Comment