Có rất nhiều biến cố xảy ra trong tháng 9 mà chúng ta không có dịp đề cập. Nhưng một thương vụ quan trọng không thể bỏ qua, lại ít được báo chí Việt Nam nhắc đến: Google thâu tóm reCaptcha. Vụ mua bán diễn ra 3 tuần trước, vào hôm 16/9 theo như tuyên bố trên blog chính thức của Google.

reCaptcha là một sản phẩm xuất phát từ khoa Khoa học máy tính của Đại học Carnegie Mellon. Mục tiêu của reCaptcha vừa tăng cường bảo mật, vừa giúp cho việc số hóa tài liệu. Do đó, reCaptcha thật khớp với những dự tính của Google: cải thiện hệ thống captchasố hóa sách.

Captcha là câu đố nhằm phân biệt con người và máy tính. Thông thường, captcha là các chữ biến dạng, hoặc những bài toán nhỏ mà con người có thể nhận biết dễ dàng, còn máy tính đành “bó tay”.

Một trong những nội dung máy tính chào thua là bản scan của các tài liệu in cũ. Với các tài liệu xa xưa, kiểu chữ cổ hoặc bị biến dạng nhiều, máy tính không thể nhận biết được. reCaptcha tận dụng yếu tố này để xây dựng hệ thống captcha “một viên đạn trúng hai chim”: vừa giúp phân biệt người và máy, vừa giúp nhận dạng chữ viết.

reCaptcha đưa ra hai từ để người dùng nhập vào, trong đó từ đầu tiên máy tính đã biết chính xác nội dung. Hai từ này được làm nhiễu thêm để ngăn các robot nhận dạng chữ viết. Người dùng sẽ nhập cả hai từ này để vượt qua vòng kiểm tra. Các nội dung mới nhập này không những giúp phân biệt người (nhập đúng từ thứ nhất - từ mà reCaptcha đã biết trước) và máy, mà còn được tổng hợp, đánh giá để hiệu chỉnh lại các tài liệu được số hóa.

Vụ mua bán này có thể là một thành công lớn của Google. Hiện tại reCaptcha đang rất phát triển, và được hơn 100.000 website sử dụng. Giá trị của thương vụ này không được tiết lộ.

Hải Nam.




Bình luận

  • TTCN (8)
Tuấn Phạm  361

Chà, mình mới biết cái vụ dùng capcha để giúp số hóa sách.

Bùi Anh Tuấn  624

chà cái này lâu rồi mà bác Nam cũng có hứng đăng lại sao ? bác bắt đầu có sở thích sưu tầm đồ cổ từ bao giờ thế ?

cái này congdongthongtin.com là site đầu tiên đăng tin này, ngày 17-9: Google thâu tóm ReCaptcha để tăng cường bảo mật và … ?

Hải Nam  30903

Chắc bạn quên đọc intro nó nói gì rồi Wink

Bùi Anh Tuấn  624

bác vẫn thích nhai kẹo cao su như ngày nào !?!

Hải Nam  30903

Không hiểu? Đăng sớm hay muộn chỉ là một trong nhiều tiêu chuẩn. Biết tin sớm, mà chỉ viết trong sổ tay chẳng hạn, thì cũng không giúp ích gì cho người khác. Thử tìm “Google thâu tóm reCaptcha” (hay mua, nuốt gì cũng được) xem có bao nhiêu bài viết đăng trước bài này, và bao nhiêu bài đăng sau bài này (ngày 8/10), và bao nhiêu độc giả VN biết tin này nhờ TTCN Wink

Hình như kỉ lục đăng bài trễ thuộc về TechCrunch, họ mới đăng một bài về sự tồn tại của Google Store trong khi sản phẩm này đã xuất hiện từ năm 2006. Thế nhưng, nhờ TC mà nhiều người mới biết đến Google Store đấy.

Bùi Anh Tuấn  624

hê hê ! còn cái này nữa sao bác không đăng luôn đi, bỏ qua tiếc lắm: Công ty mẹ của Wordpress thâu tóm công cụ kiểm lỗi chính tả tốt hơn: After The Deadline

Hải Nam  30903

Ồ không đọc bài đó thì đến giờ cũng không biết AtD là gì. Cũng là công cụ tốt, nhưng không quá nổi bật. Nếu lúc đó có CTV viết thì bài đó được đăng đấy, giờ thì cho qua phà luôn Big Grin

son  2

tại sao khi cài Pc vim security thì không kết nối mạng được? ai biết chỉ giùm cách khắc phục. xin cảm ơn