Với công nghệ vệ tinh, cáp và các trạm phát sóng truyền hình mặt đất cùng hàng trăm công ty cung cấp nội dung giải trí trên Internet, có thể nói việc tìm kiếm cái gì đó để xem đang là một thách thức ngày càng tăng đối với nhiều người. Để giúp đơn giản hóa vấn đề này, các nhà nghiên cứu của hãng truyền hình Nippon Hoso Kyokai của Nhật Bản (còn được biết đến với tên gọi NHK) có kế hoạch bắt đầu thử nghiệm công nghệ tự động đánh giá sự quan tâm của người xem theo thời gian thực đối với một chương trình truyền hình hoặc video, và sau đó đề xuất các chương trình khác để xem dựa trên kết quả có được.

Để đánh giá những gì người xem quan tâm, hệ thống của đài NHK sử dụng một bộ cảm biến chuyển động và chiều sâu Kinect của Microsoft gắn trước TV. Kinect sẽ kết hợp với bộ phát triển phần mềm SDK (software development kit) của Microsoft để theo dõi khuôn mặt của người xem, đưa những hình ảnh này vào một số mô-đun phần mềm trong máy tính.

Dấu hiệu đầu tiên chứng tỏ người xem đang quan tâm đến một chương trình TV là người đó sẽ thực sự đứng lại ở phía trước TV. Vì vậy, một mô-đun được sử dụng để cảm nhận người xem có đang đứng trước TV không sẽ chọn các điểm quỹ đạo để đo những cử động từ người này dựa vào một chuỗi các khung hình video. Khoảng 200 điểm như vậy có thể được chọn từ một khung hình duy nhất. Thông số từ những quỹ đạo sẽ được chuyển đổi thành các từ mã và được sử dụng để đào tạo một chương trình học máy (machine-learning) nhằm xác định sự hiện diện của một người xem.

Trong lúc đó, hai mô-đun khác sẽ làm việc song song để ước tính vị trí 2D và 3D đầu của người xem dựa trên màu sắc và hình ảnh chụp từ Kinect. Kết quả của tất cả ba mô-đun này sau đó được kết hợp để ước tính xem người xem có nhìn chăm chú vào màn hình hay không.

"Ánh mắt của một người xem nhìn vào màn hình rất quan trọng đối với sự hấp dẫn của nội dung một chương trình", kĩ sư nghiên cứu chính của đài NHK cho biết. "Các bộ cảm biến nhận diện khuôn mặt khác có xu hướng thất bại khi một người xem quay mặt đi chỗ khác so với vị trí máy ảnh. Trong khi đó, công nghệ chọn các điểm quỹ đạo được cho là phù hợp hơn vì nó có chứa một lịch sử lâu dài về vị trí của các điểm".

Các nhà nghiên cứu mới đây đã bổ sung hai mô-đun nữa để nhận ra các biểu hiện nét mặt. Một mô-đun sẽ ước tính cường độ của sáu biểu hiện chính trên khuôn mặt của con người, trong đó mỉm cười và ngạc nhiên là hiệu quả nhất. Một mô-đun khác sẽ phán đoán sự hiện diện có hay không có các nét mặt bằng cách so sánh các thông số của chuyển động từ làn da so với một cơ sở dữ liệu hình ảnh của các biểu hiện khuôn mặt có sẵn.

Dựa trên mức độ quan tâm ước tính của người xem trong khi xem một chương trình, các từ khóa sẽ được chọn từ dòng phụ đề của chương trình và được liệt kê trên một máy tính bảng cùng với các biểu tượng cảm xúc đại diện cho bất kì biểu hiện khuôn mặt được phát hiện vào thời điểm đó (khoảng 70% các chương trình của đài NHK nói chung cung cấp phụ đề khép kín).

Các từ khóa được chọn từ phụ đề bằng cách sử dụng phương pháp được gọi là phân tích hình thái. "Danh từ riêng như tên người và địa danh là những yếu tố thu hút sự quan tâm của người xem", kĩ sư nghiên cứu của NHK nói. "Chúng tôi liên kết chúng vào cơ sở dữ liệu Wikipedia và trang chủ của chương trình để theo dõi việc tìm kiếm. Chúng tôi cũng đang phát triển một hệ thống dẫn chương trình truyền hình dựa trên lợi ích của người xem".

Hệ thống này sử dụng một bản đồ chương trình truyền hình được tự động tạo ra, có thể liên kết một khối lượng lớn các chương trình truyền hình và từ vựng tiếng Nhật bằng cách sử dụng một số loại mối quan hệ ngữ nghĩa. Điều này sẽ cho phép người xem quan tâm đến các từ khóa được liệt kê để xem một số từ liên quan trên máy tính bảng và lần lượt có thể cung cấp liên kết đến các chương trình có liên quan.

Nhóm nghiên cứu sẽ bắt đầu thử nghiệm sự quan tâm của khán giả trong giai đoạn đầu tiên của hệ thống: cung cấp các từ khóa có liên hệ với Wikipedia và trang chủ của chương trình. "Chúng tôi muốn xem hệ thống hoạt động trong nhà như thế nào và những gì người dùng quan tâm. Sau đó chúng tôi hi vọng sẽ bắt đầu thử nghiệm hệ thống dẫn chương trình", đại diện của nhóm nói.

Tuy nhiên, hiện vẫn còn một số thách thức lớn về mặt kĩ thuật đối với công nghệ này. Trước tiên, hệ thống NHK đã phát triển cho đến nay chỉ dành cho một người dùng duy nhất và như vậy cần phải được mở rộng để bao gồm cả một gia đình. Một vấn đề liên quan khác là làm thế nào để phân biệt khi một người xem đang thưởng thức chương trình hay đang nói chuyện cười đùa với một người bên cạnh. Nhưng NHK tin tưởng tất cả những thách thức này có thể được khắc phục. Công nghệ này sẽ sẵn sàng để sử dụng trong vòng 2-3 năm tới.

Theo PC World VN.



Bình luận

  • TTCN (0)