Công nghệ nén file ảnh cho Trí tuệ nhân tạo và Máy học

08/07/2021, 15:56

TNNN - Theo xu hướng chung của dữ liệu hình ảnh, thế hệ camera mới cung cấp độ phân giải cao hơn cùng với tốc độ khung hình cao hơn thế hệ trước. Lượng dữ liệu được tạo ra càng ngày càng lớn và thời gian lưu trừ càng lâu hơn.

Trong các nghiên cứu khoa học, lượng dữ liệu hình ảnh rất lớn và thời gian lưu trữ gần như vĩnh viễn, ngày càng chiếm nhiều không gian bộ nhớ trong hệ thống CNTT, nhanh chóng tăng khối lượng công việc máy chủ của các cơ quan nghiên cứu. Gerhard Holst, Trưởng bộ phận khoa học & nghiên cứu tại Công ty PCO (Kelheim, Đức) cho biết, vấn đề thường xuyên được đặt ra từ ba xu hướng phát triển ảnh: tốc độ khung hình cao hơn, độ phân giải cao hơn và yêu cầu tạo bản ghi ba chiều. Dữ liệu hình ảnh có thể được nén, nhưng các phương pháp hiện nay chỉ được phép nén sau khi hình ảnh đã được tạo ra hoặc với ghi lại với tốc độ nén thấp.

Là nhà sản xuất tiên phong trong lĩnh vực hệ thống camera cao cấp và quang điện tử, trong quá trình nghiên cứu giải pháp nén dữ liệu hình ảnh mới, PCO đã liên kết với Dotphoton, công ty khởi nghiệp Thụy Sĩ chuyên sâu về nén hình ảnh cho các ứng dụng quan trọng Máy học và AI, phát triển phần mềm nén file clip xuống 10 lần mà không làm mất chất lượng ảnh.

Phần mềm Jetraw của Dotphoton khởi động trước khi hình ảnh được tạo và sử dụng thông tin về hiệu suất nhiễu của cảm biến hình ảnh để nén dữ liệu hình ảnh một cách hiệu quả.

Công nghệ Jetraw của Dotphoton sử dụng thông tin cụ thể về nhiễu của camera để nén dữ liệu ảnh RAW đến mười lần nhưng không làm mất thông tin.

Bruno Sanguinetti, Giám đốc Công nghệ (CTO) và đồng sáng lập Dotphoton giải thích: "Những thiết lập thử nghiệm với cảm biến chuyển đổi quang anh sang tin hiệu CCD/CMOS để định lượng mức độ ngẫu nhiên (entropy), mối quan hệ giữa tín hiệu và nhiễu cho thấy, ngay cả với những cảm biến hoàn hảo nhất, phần lớn nhất của entropy là nhiễu.

Thử nghiệm với cảm biến chuyển đổi 16 bit, có thể thấy trong một entropy có tới 9 bit là nhiễu và chỉ có 1 bit tín hiệu. Phát hiện từ những thử nghiệm cho thấy rằng các cảm biến tốt cũng làm tăng tín hiệu nhiễu".

Từ nhận thức này, Dotphoton sử dụng phương pháp nén nhiễu khiến những tệp ảnh không bị mất thông tin. Cụ thể hơn, phần mềm Dotphoton sử dụng thông tin về nhiễu không gian và thời gian của chính cảm biến để nén ảnh. Gerhard Holst cho biết, dữ liệu đo lường cụ thể hình ảnh là điều kiện tiên quyết đầu vào để nén ảnh đạt hiệu quả cao.

PCO tuân thủ triệt để tiêu chuẩn xử lý hình ảnh EMVA 1288, xác định các thông số chất lượng của camera. Dữ liệu đo lường theo tiêu chuẩn EMVA 1288 tương ứng với những thông số bắt buộc trong phần mềm của Dotphoton và có sẵn trong mọi camera của PCO. Một phiên bản phần mềm tích hợp đầy đủ trong camera là bước tiếp theo để máy ảnh chỉ truyền dữ liệu đã được nén.

Công nghệ mới được sử dụng hiệu quả cho những ứng dụng ghi ảnh tốc độ cao khác trong phạm vi nghiên cứu khoa học với nhu cầu lưu trữ dữ liệu cao. Một yếu tố khác, thúc đẩy sự phát triển phần mềm nén ảnh Jetraw của Dotphoton là các ứng dụng Trí tuệ Nhân tạo AI sử dụng ngày càng nhiều dữ liệu hình ảnh. Bruno Sanguinetti cho biết dung lượng hình ảnh được tạo ra cho mục đích phân tích tăng lên nhanh chóng trong các ứng dụng AI và Máy học.

Cơ sở dữ liệu ảnh được lưu trữ và phục vụ cho đào tạo các ứng dụng AI và Máy học sâu. Đây là cơ hội cho thuật toán nén ảnh của Dotphoton do vẫn giữ nguyên các thuộc tính đo lường ảnh RAW, cho phép AI và Máy học hoạt động hiệu quả với hình ảnh thu được.

Nguồn: Khoa học & Đời sống