Nhịp cầu sư phạmChuyện học đường

Hệ thống tóm tắt video rất thiết thực

Tạp Chí Giáo Dục

Nguyễn Duy Cường và Nguyễn Thành Gô nhận giải đặc biệt của cuộc thi Euréka năm 2014
Thông qua việc xây dựng hệ thống tóm tắt video dựa vào các phương pháp phân tích ảnh hai chiều, hình ảnh do camera quay lại sẽ được co gọn lại. Qua đó dung lượng lưu trữ của camera sẽ tăng lên, người dùng muốn xem lại thông tin hình ảnh cũng dễ dàng và không tốn nhiều thời gian.
Hệ thống tóm tắt video trên là đề tài nghiên cứu của hai sinh viên Nguyễn Duy Cường và Nguyễn Thành Gô (Khoa Công nghệ thông tin Trường ĐH Khoa học Tự nhiên TP.HCM). Đề tài trên vừa đạt giải đặc biệt tại vòng chung kết cuộc thi Euréka năm 2014 bởi tính mới mẻ và ứng dụng thực tiễn cao.
Thời gian lưu trữ tăng
Chia sẻ về lý do chọn đề tài trên, Duy Cường cho rằng hiện nay hầu hết các cơ quan, công ty, quán xá… đều gắn camera nhằm quay lại hình ảnh các hoạt động diễn ra hàng ngày. Mục đích là để tăng cường giám sát, an ninh cũng như phòng khi có sự cố, người sử dụng có thể xem lại video, lấy thông tin làm căn cứ… Tuy nhiên, cứ trung bình khoảng hai tuần thì người sử dụng phải xóa dữ liệu một lần, tùy thuộc vào điều kiện kinh tế đầu tư ổ cứng. Cách duy nhất để tăng thời gian lưu trữ là mua thêm ổ cứng mới, trong khi video lưu trữ có rất nhiều đoạn thừa. Ngoài ra, khi muốn xem dữ liệu cần thiết thì bắt buộc chúng ta phải xem từ đầu, mặc dù có những thời điểm không có hình ảnh sự việc được lưu, điều này dẫn đến tốn kém thời gian.
Duy Cường kể: “Một lần đứa bạn của em gửi xe trong ký túc xá, không may bị kẻ gian lấy mất. Đến vài ngày sau bạn ấy vẫn chưa biết nguyên nhân vì sao xe mình bị mất do nhân viên giữ xe chưa xem xong video an ninh. Xuất phát từ lí do này, em và Thành Gô nhận thấy việc tóm tắt video, nhất là với video an ninh rất thực tiễn và cấp thiết. Và đề tài Xây dựng hệ thống tóm tắt video dựa vào các phương pháp phân tích ảnh hai chiều của chúng em đã ra đời”.
Giải thích rõ hơn về tính ứng dụng của đề tài, Thành Gô đưa ví dụ: “Ở một trạm ATM, camera phải quay 24/24 giờ, đồng nghĩa một ngày camera phải lưu 24 tiếng. Nhưng ngày đó chỉ có 10 lượt giao dịch, mỗi giao dịch chỉ trong 10 phút. Vậy thì chúng ta chỉ cần lưu 10×10 = 100 phút thay vì 24 tiếng. Và bài toán đặt ra là chúng ta sẽ giảm đi lượng dư thừa để tăng thêm thời gian lưu trữ và điều kiện bắt buộc là không mất đi đối tượng nào, thời gian xem lại thông tin cũng nhanh hơn”.
Ứng dụng tối đa kiến thức công nghệ
Sau khi hình thành ý tưởng, trong hai tháng đầu, Duy Cường và Thành Gô tập trung khảo sát các phương pháp trên thế giới đã làm như thế nào? Những phương pháp đó có giải quyết được bài toán đề tài đặt ra hay không? Điểm mạnh – điểm yếu của các phương pháp đó là gì?… Sau khi thực hiện khảo sát kỹ, Duy Cường và Thành Gô đã trao đổi thêm với người hướng dẫn là TS. Trần Thái Sơn, Phó bộ môn thị giác máy tính và khoa học robot của trường, để đề ra phương pháp hợp lý nhất. Theo đó, Duy Cường và Thành Gô đã vận dụng những kiến thức nền của lĩnh vực công nghệ thông tin đã được học vào công việc như: Cách lập trình và tư duy lập trình; kiến thức chuyên ngành thị giác máy tính và khoa học robot, liên quan đến xử lý ảnh và video. Việc tóm tắt video được hai em dựa vào “phương pháp trích chọn biến động cục bộ”, nghĩa là trích chọn các ô có vật thể biến động trong khung hình để tạo tập đặc trưng, quyết định khung hình nào nên bỏ, khung hình nào nên giữ lại. Mặt khác, nhờ vào việc tích lũy cách nghiên cứu khoa học từ môn học “phương pháp nghiên cứu khoa học”, hai em có thêm nhiều kiến thức để thực hiện.
Do lần đầu tiên bước vào nghiên cứu khoa học thực thụ nên Duy Cường và Thành Gô gặp không ít khó khăn về kinh nghiệm lẫn thời gian. Đáng nhớ nhất là trong phương pháp thứ nhất, do sử dụng các yếu tố toàn cục nên hệ thống tóm tắt không thể phân biệt được nhiễu và các vật thể nhỏ. Thất bại khiến hai em muốn bỏ cuộc, thậm chí rơi vào tình trạng stress. Tuy nhiên, với sự quyết tâm, nỗ lực và sự động viên của thầy hướng dẫn, Duy Cường và Thành Gô đã nhanh chóng lấy lại động lực, tiếp tục thực hiện và có những cải tiến mới trong việc cài đặt. Kết quả sau 8 tháng tìm tòi, thực hiện, hệ thống tóm tắt đã hoàn chỉnh mỹ mãn.
Điểm thực nghiệm đầu tiên cho hệ thống là một bãi giữ xe. Đó là tóm tắt video từ 14 phút 40 giây còn lại 50 giây, hệ thống sử dụng cùng tốc độ phát, đồng nghĩa với giảm gần 17 lần dung lượng lưu trữ video mà hình ảnh, thông tin không bị mất. Việc giảm này phụ thuộc vào độ dư thừa của dữ liệu chứ không phụ thuộc vào chiều dài video gốc. Ngoài ra hệ thống tóm tắt video của Duy Cường và Thành Gô có thể truy vấn tìm quỹ đạo các vật thể đi qua vùng quan tâm, giúp người dùng có thể xem lại một đoạn video nhỏ xung quanh vật thể đó, và phần mềm sẽ tiết kiệm thời gian khi xem lại sự kiện trong video.
Ban giám khảo cuộc thi Euréka năm 2014 đã đánh giá cao về tính mới mẻ, sáng tạo và tính ứng dụng vào thực tiễn của hệ thống tóm tắt video này. Theo đó, sản phẩm này rất cần thiết, hữu ích cho các cơ sở có lắp camera an ninh…
Bài, ảnh: Trinh Ngọc
“Đối tượng mà nhóm hướng tới là các hệ thống ngân hàng, siêu thị, tòa nhà văn phòng có lắp camera an ninh. Ngoài ra sản phẩm cũng có thể mở rộng đến các bãi giữ xe hay nhà riêng. Bởi giá thành sản phẩm không đắt so với việc người dùng phải mua thêm ổ cứng để tăng thời gian lưu trữ. Để sản phẩm được hoàn chỉnh hơn, trong tương lai chúng em sẽ cải thiện tính năng phù hợp với nhu cầu mà khách hàng mong muốn”, Thành Gô cho biết.
 

Bình luận (0)