Đội ngũ của Zhi Heng đông nhất công ty, có tới 1.200 thành viên, hầu hết là sinh viên mới ra trường. Inke, ứng dụng truyền trực tiếp lớn nhất Trung Quốc có tới 250 triệu người dùng hàng tháng, và đội ngũ của Zhi Heng chỉ có vài giây để quyết định bộ đồ bơi 2 mảnh vừa xuất hiện trên màn hình liệu có vi phạm quy định của nền tảng.
Nhóm của họ là những người đứng trên tiền tuyến mặt trận kiểm duyệt Internet của Trung Quốc. Đó là hàng ngàn nhân viên được tuyển chỉ để lọc bỏ mọi nội dung xuất hiện trên mạng, nhằm phục vụ cho thị trường lớn nhất thế giới.
Không để lọt bất cứ nội dung nào
Tính đến cuối năm 2018, có gần 400 triệu người Trung Quốc đã truyền hình ảnh trực tiếp của mình, hay còn gọi là livestream lên mạng. Hầu hết nội dung chỉ mang tính cá nhân và vô thưởng vô phạt: họ sẽ cho bạn bè, gia đình xem mình đang ở Paris, hay cảnh đẹp nhìn từ nhà hàng họ đang ăn.
Ngoài ra, cũng có những người livestream chuyên nghiệp. Họ kiếm sống từ nghề này. Cách kiếm tiền của họ có thể là bán hàng trên mạng, hoặc biểu diễn, hát hò và nhận tiền ủng hộ.
Những công ty Trung Quốc thuê tới hàng nghìn nhân viên chỉ để đảm bảo nội dung không vi phạm pháp luật. Ảnh: SCMP. |
Những video livestream, cùng với các thể loại video ngắn, ứng dụng nhắn tin, các trang diễn đàn mạng tạo ra một lượng thông tin khổng lồ. Không thể nào lọc tất cả nội dung này mà không có sự can thiệp của công nghệ.
“Bạn phải thực sự tập trung khi làm việc. Không thể để bất cứ thứ gì trái pháp luật lọt qua, hoặc là trái đạo đức hay đi ngược lại các giá trị công ty”, Zhi Heng, người đứng đầu nhóm đảm bảo an toàn nội dung tại Inke chia sẻ.
Có trụ sở tại Bắc Kinh và văn phòng tại Hồ Nam, Inke là công ty hiếm hoi chịu cởi mở về cách thức họ lọc nội dung qua nền tảng. Theo SCMP, Inke sử dụng cả những thuật toán trí tuệ nhân tạo và nhận biết nội dung, cùng sự can thiệp trực tiếp của con người để làm được điều này.
Trí tuệ nhân tạo sẽ thực hiện phần lớn công đoạn gắn nhãn dữ liệu, cho điểm và phân loại nội dung thành từng hạng mục “điểm nguy hiểm” khác nhau. Hệ thống phân loại này giúp cho công ty nhận biết được những nội dung nào cần kiểm duyệt kỹ hơn.
Hệ thống sử dụng AI để phân loại các nội dung, trước khi người kiểm duyệt đưa ra quyết định cuối cùng. Ảnh: SCMP. |
Sau đó là sự can thiệp của con người. Những nội dung có độ nguy hiểm thấp sẽ được người kiểm duyệt xem trực tiếp, ví dụ như các show về nấu nướng. Tuy nhiên những nội dung có độ nguy hiểm cao phải được kiểm duyệt kỹ lưỡng, nhiều lần.
Một câu hỏi đặt ra là, làm thế nào để hệ thống nhận biết được liệu một người mặc bikini có đang vi phạm? Đây là một câu hỏi quá khó, kể cả với các hệ thống AI, bởi chúng chưa thể bắt kịp tư duy con người ở một khía cạnh: tư duy hoàn cảnh.
Đối với một thuật toán, bikini là bikini. Tuy nhiên với mắt nhìn của con người, bikini đặt vào các bối cảnh khác nhau có ý nghĩa hoàn toàn khác nhau. Một người mặc bikini cạnh bể bơi, xung quanh là nhiều người bơi cùng và trẻ con chạy nhảy thì không sao. Nhưng một bộ bikini nhỏ, gợi cảm, mặc trong phòng ngủ và có nhạc du dương? Rất có thể có vấn đề.
Tuy nhiên theo chia sẻ của Inke, hành động bị kiểm duyệt gắt nhất trên nền tảng của họ lại là hút thuốc khi đang livestream. Chính phủ Trung Quốc cho rằng hành động này là cổ vũ lối sống thiếu lành mạnh, nên nó bị cấm. Những hình xăm quá lộ liễu, dày đặc cũng bị cấm.
Kiểm duyệt nội dung là đội ngũ đông nhất trong Inke, chiếm tới 60% số lao động. Những người lãnh đạo nhóm phải nghiên cứu rất kỹ luật và chỉ ra cụ thể thứ gì được xuất hiện, thứ gì không được. Theo Cục nghệ thuật biểu diễn Trung Quốc, những quy định này được cập nhật hàng tuần để không bỏ sót những vụ việc mới nhất. Nói cách khác, danh sách những thứ “không được làm” trên mạng ở Trung Quốc luôn được bổ sung mới.
Đối với những ca khó, đội ngũ luật sư sẽ phải tư vấn để đảm bảo không bỏ lọt nội dung vi phạm.
Theo chia sẻ của Zhi Heng, những nội dung có độ nguy hiểm cao nhất là nội dung nói về chính trị, các hành động tình dục, bạo lực, khủng bố và tự hủy hoại bản thân. Tùy vào mức độ, người kiểm duyệt có thể cảnh cáo, chặn hoặc khóa hẳn tài khoản vi phạm.
Một đặc tính giúp ích rất nhiều cho nhóm kiểm duyệt là độ trễ của những video trực tiếp. Trong khoảng thời gian video trễ 10 – 15 giây do giới hạn về đường truyền, người kiểm duyệt cần đưa ra quyết định liệu nội dung này có được phát sóng hay không.
Zhi Heng, người từng làm công việc quản lý chất lượng tại một nhà máy, có nhiều kinh nghiệm khác để đảm bảo kết quả công việc của mình.
Trong trường hợp những người dân địa phương tụ tập để phản đối kế hoạch xây một nhà máy đốt rác, Inke có thể xác định ngay địa điểm tụ tập, và sử dụng phần mềm định vị chặn tất cả các video truyền trực tiếp trong bán kính 10 km.
Bài học đắt giá cho những công ty phạm sai lầm
Các công ty bắt buộc phải làm chặt để đảm bảo quyền lợi của mình. Chỉ cần một sai lầm, họ có thể phải trả giá đắt.
Tháng 4/2014, CEO Bytedance, ông Zhang Yiming phải viết một bức thư xin lỗi công khai vì để lọt “nội dung bậy” trên ứng dụng đọc truyện cười Neihan Duanzi. Vì sai lầm này, ứng dụng đọc tin Jinri Toutiao của họ bị gỡ khỏi mọi chợ ứng dụng trong vòng 3 tuần.
Sau đó, Bytedance hứa sẽ nâng số lượng của đội kiểm duyệt nội dung từ 6.000 lên tới 10.000 người, đồng thời cấm vĩnh viễn những người tạo nội dung “vi phạm giá trị cộng đồng”.
Kiểm duyệt nội dung là một trong những yêu cầu quan trọng nhất để Trung Quốc kiểm soát Internet. Ảnh: Guardian. |
Với nhu cầu lớn như vậy, kiểm duyệt nội dung đáng ra phải là một nghề “hot”. Tuy nhiên công việc này cũng được coi là một việc nhàm chán, lương thấp. Một người làm kiểm duyệt sẽ phải ngồi hàng giờ liên để xem những nội dung tệ hại, buồn chán.
Trong số 1.200 nhân viên của Zhi Heng, chỉ có 200 người là nhân viên toàn thời gian. Mức lương của họ từ 3.000 tệ/tháng, tương đương hơn 10 triệu đồng.
Rất nhiều nhân viên mới vào làm đã vội vàng xin nghỉ, có khi chưa kịp hoàn thành khóa đào tạo định hướng dài 1 tháng của công ty. Nhiều người khác thì nghỉ sau nửa năm đầu. Dù vậy, theo Zhi Heng thì lượng nhân viên nghỉ việc chỉ khoảng 10% trong năm ngoái, tức là thấp hơn con số trung bình 20% của thị trường lao động Trung Quốc.
Khi được phỏng vấn, nhiều ứng viên tự tin mình có thể làm được bởi họ đã quen thức đêm chơi game. Tuy nhiên công việc này lại khác hoàn toàn.
“Chúng tôi giống như lao công trên mạng”, người đứng đầu nhóm kiểm duyệt tại ứng dụng livestream Inke chia sẻ. Ảnh: SCMP. |
“Chỉ có rất ít nội dung thực sự tốt, phần lớn nội dung tệ, thậm chí là rất tệ. Xem những nội dung này quá nhiều có khi khiến bạn tự hỏi ý nghĩa cuộc đời”, Zhi Heng chia sẻ.
Khi được hỏi công việc này có ý nghĩa như thế nào đối với bản thân anh, Zhi Heng phải suy nghĩ rất lâu, rồi nói thật là anh cũng từng tự đặt ra câu hỏi này rất nhiều lần.
“Chúng tôi giống như lao công vậy. Chỉ khác là chúng tôi không dọn dẹp trên phố hay trường học, mà là trên mạng”, Zhi Heng nói.