Hệ thống đánh chỉ mục Caffeine mà Google vừa áp dụng cho công cụ tìm kiếm của họ giúp tăng tốc độ tìm kiếm nhanh hơn nhiều so với kĩ thuật cũ.

Ảnh

Khi bạn gõ vào 1 từ tìm kiếm, không phải là bạn đang tìm "trực tiếp" 1 từ nào đó trong thế giới web mà Google kết nối, nhưng với Caffeine, đó là bạn đang tìm theo dạng từ khoá trong "mục lục", nên kết quả vừa nhanh, vừa chính xác.
Theo Google, nội dung trên web đang "nở" rất nhanh, từ tin tức đơn thuần đến video, hình ảnh... nên nội dung trở nên rất phức tạp. Người dùng muốn tìm gặp được thông tin gì mới nhất và Caffeine chú trọng vào điều này hơn hệ thống chỉ mục cũ.

Mô hình chỉ mục cũ của Google chia theo lớp, một số lớp này truy xuất nhanh hơn một số lớp khác và lớp chính được cập nhật mỗi vài tuần nên sẽ có độ trễ giữa thời gian tìm thấy lớp đó và hiển thị lớp đó lên trang kết quả.

Trong khi đó, cách đánh chỉ mục Caffeine hoạt động theo cách khác. Google phân tích web theo những mục nhỏ và cập nhật chỉ mục liên tục. Khi 1 thông tin mới xuất hiện, họ đưa ngay vào chỉ mục nên thông tin sẽ mới hơn, nhanh hơn. Thực chất, mỗi giây trôi qua, Caffeine xử lý song song hàng trăm nghìn trang thông tin. Caffeine chiếm đến gần 100 triệu GB lưu trữ và mỗi ngày "ngốn" thêm khoảng 100.000 GB để lưu thông tin mới.

Theo PCWorld



Bình luận

  • TTCN (0)