Mô hình YOLOv8 có khả năng nhận diện và xóa vật thể thừa như người quay phim ngay trên sóng trực tiếp. Ảnh: Alamy. |
Theo các nhà khoa học, khi một người quay phim xuất hiện trên màn hình, điều này sẽ làm giảm đi những khoảnh khắc quan trọng của trận đấu và có thể dẫn đến tổn hại về doanh thu cho đài truyền hình vì người xem không hài lòng.
Để giải quyết sự mất tập trung về mặt thị giác này, các nhà nghiên cứu đã phát triển một hệ thống đầu cuối có khả năng phát hiện và loại bỏ theo cách tương tự như một biên tập viên loại bỏ một vật thể thừa khỏi ảnh.
Theo PetaPixel, công nghệ được nhóm nghiên cứu tại Đại học Công nghệ Kaunas ở Litva sử dụng để tự động xóa vật thể thừa trên sóng trực tiếp là YOLOv8.
Công nghệ này là viết tắt của “You Only Look Once”, có thể phát hiện và phân loại các đối tượng chỉ trong một lần quét, rất lý tưởng cho các sự kiện thời gian thực như chương trình phát sóng thể thao trực tiếp.
“YOLO hoạt động bằng cách chia hình ảnh thành một lưới và dự đoán các hộp giới hạn, xác suất lớp và đa giác phân đoạn cho mỗi ô lưới. Điều này cho phép nó xác định và phân đoạn những vật thể thừa như người quay phim”, thành viên nhóm nghiên cứu Serhii Postupaiev cho biết.
Minh họa cách YOLOv8 nhận diện và xóa vật thể thừa trong khung trình trực tiếp. Ảnh: PetaPixel. |
Để đào tạo cho mô hình YOLOv8 phát hiện và phân đoạn chính xác người quay phim trong các trận đấu, nhóm của Postupaiev đã tạo ra một tập dữ liệu gồm hàng nghìn gigabyte nội dung quay được với kích thước, hình dạng và loại thiết bị khác nhau trong trong nhiều điều kiện.
Bên cạnh đó, nhóm nghiên cứu còn sử dụng đến Video Inpainting, một công cụ máy sâu (deep learning) - kỹ thuật AI giúp dạy máy tính xử lý dữ liệu như não người và công cụ, với cách hoạt động tương tự công cụ loại bỏ nhược điểm trên da Spot Healing Brush trên Photoshop.
Việc kết hợp AI và công nghệ dựa trên thị giác máy tính sẽ giúp mô hình phân tích các khung hình video để phát hiện những vật thể thừa và lấp đầy các khu vực bị xóa bằng các chi tiết nền có liên quan. Các khung hình đã sửa đổi sau đó được truyền trực tiếp trở lại cho người xem.
Nhờ độ trễ nhỏ khi phát sóng trực tiếp, thuật toán sẽ xử lý hình ảnh đã ghi trước khi phát trực tiếp chỉ sau vài giây.
Hiện tại, dự án này đang được thử nghiệm trong truyền hình trực tiếp các trận đấu bóng đá và dự kiến sẽ sớm áp dụng cho nhiều môn thể thao khác bao gồm bóng rổ, bóng bầu dục và khúc côn cầu trên băng.
Nhân loại sẽ đối đầu với trí tuệ nhân tạo như thế nào
Trong cuốn sách "Framers - Nhân loại đối đầu nhân tạo", các tác giả nhận định con người vẫn có lợi thế trong thời đại công nghệ.