Những con số mà Facebook công bố trong Báo cáo thực thi Tiêu chuẩn cộng đồng mới nhất của họ là minh chứng cho thấy công nghệ AI đang mang lại sự tiến bộ mà thế giới của chúng ta đòi hỏi.
Theo đó, trong ba tháng cuối năm 2020, Facebook đã chủ động phát hiện được những nội dung gây căm thù cũng như nội dung bắt nạt và quấy rối. 97% bài đăng có nội dung căm thù bị gỡ xuống từ Facebook đã được hệ thống tự động phát hiện, trước khi bất kỳ người nào gắn cờ nó (tăng từ 94% trong quý trước và 80,5% vào cuối năm 2019).
Quan trọng hơn, con số này tăng từ 24% vào cuối năm 2017.đ Đây được xem là tốc độ cải tiến mà chúng ta hiếm thấy ở các công nghệ được triển khai ở quy mô như vậy. Khi bạn nhìn vào những thời điểm mà công nghệ mới đã giúp giải quyết những vấn đề khó khăn nhất mà thế giới phải đối mặt, từ chữa bệnh đến sản xuất những chiếc xe an toàn hơn, tiến bộ đã xảy ra tăng dần trong nhiều thập kỷ, khi các công nghệ được cải tiến và hoàn thiện.
Những câu chuyện tương tự về những cải tiến ổn định, khi các kỹ sư xây dựng hệ thống AI có thể ngăn ngôn từ kích động thù địch và các nội dung không mong muốn khác lan truyền trên internet trở nên phổ biến hơn. Nhưng điều đáng khích lệ là toàn bộ lĩnh vực AI đang phát triển ổn định hàng tháng, dẫn đến lợi nhuận cũng tăng đáng kể mỗi năm.
Đằng sau những con số đáng khích lệ là những câu chuyện về sự tiến bộ ổn định, được thúc đẩy bởi công nghệ AI đang mang lại kết quả tốt hơn. Ngay cả khi bản chất của những thách thức tiếp tục phát triển và mọi người cố gắng tránh bị hệ thống của Facebook phát hiện.
Một ví dụ về nhưng điều trên là cách hệ thống của Facebook phát hiện nội dung vi phạm trong nhận xét của bài đăng. Đây là một thách thức trong lịch sử đối với AI, bởi việc xác định xem một nhận xét có vi phạm chính sách hay không thường phụ thuộc vào ngữ cảnh của bài đăng mà nó thể hiện.
Chẳng hạn, “Đây là một tin tuyệt vời” có thể có nghĩa hoàn toàn khác khi xuất hiện ở bên dưới các bài đăng thông báo về sự ra đời của một đứa trẻ và cái chết của một người thân yêu.
Trong suốt năm 2020, các kỹ sư của Facebook đã làm việc để cải thiện cách hệ thống AI phân tích các nhận xét, xem xét các nhận xét và
bối cảnh. Điều này đòi hỏi bạn phải hiểu rõ hơn và sâu hơn về ngôn ngữ cũng như khả năng kết hợp các phân tích về hình ảnh, văn bản và các chi tiết khác có trong một bài đăng.
Giống như rất nhiều tiến bộ công nghệ quan trọng nhất, công việc này không mang tính cách mạng mà là sự tiến hóa. Các nhóm của Facebook đã tập hợp dữ liệu đào tạo tốt hơn, tính năng tốt hơn và mô hình AI tốt hơn để tạo ra một hệ thống phân tích nhận xét tốt hơn và liên tục học hỏi từ dữ liệu mới.
Kết quả của những nỗ lực này được thể hiện rõ ràng trong các con số được công bố trong báo cáo của Facebook. Cụ thể, trong ba tháng đầu năm 2020, hệ thống của Facebook chỉ phát hiện được 16% nội dung bắt nạt và quấy rối trước khi có bất kỳ người dùng nào báo cáo. Vào cuối năm đó, con số đó đã tăng lên gần 49 %. Có nghĩa là hàng triệu nội dung bổ sung đã được phát hiện và xóa do vi phạm chính sách. Facebook hy vọng sẽ có nhiều cải tiến hơn nữa khi lĩnh vực công nghệ AI này tiếp tục phát triển.
Một tiến bộ khác là cách hệ thống của Facebook hoạt động bằng nhiều ngôn ngữ. Phần lớn nhờ những cải tiến trong cách các công cụ AI, họ có thể phát hiện nội dung vi phạm bằng các ngôn ngữ được sử dụng rộng rãi như tiếng Tây Ban Nha và tiếng Ả Rập. Theo đó, lượng nội dung có lời nói căm thù bị gỡ xuống đạt 26,9 triệu, tăng từ 22,1 triệu trong quý trước.
Sự cải thiện trong các ngôn ngữ nước ngoài này xuất hiện bởi vì toàn bộ gói công nghệ AI đã có những bước tiến nhảy vọt trong năm qua. Facebook đã từng đề cập về Linformer, một kiến trúc mới cho phép họ đào tạo các mô hình AI trên các đoạn văn bản dài hơn và phức tạp hơn. Cũng như về RIO, một hệ thống mới cho phép các công cụ kiểm duyệt nội dung của Facebook không ngừng học hỏi và cải tiến dựa trên nội dung mới được đăng lên Facebook mỗi ngày.
Điều khiến những người phát triển Facebook đặc biệt tự hào không chỉ là những công nghệ tiên tiến này đang làm cho nền tảng của họ tốt hơn và an toàn hơn, mà họ còn công bố nghiên cứu đằng sau chúng và phát hành mã, cho phép các nhà nghiên cứu hàn lâm và kỹ sư trong toàn ngành có thể tiếp cận với những gì mà họ đã xây dựng.
Song vẫn còn rất nhiều việc phải làm, bất chấp những cải tiến đáng khích lệ này. Trọng tâm cụ thể tiếp theo là giúp AI thậm chí còn tốt hơn trong việc xem nội dung theo ngữ cảnh, qua các ngôn ngữ, nền văn hóa và địa lý. Những từ giống nhau có thể được hiểu là lành tính hoặc thù hận, tùy thuộc vào nơi chúng được xuất bản và ai đang đọc chúng, cũng như việc đào tạo máy móc để nắm bắt được sắc thái này đặc biệt khó khăn.
Nhưng giống như rất nhiều thách thức khác, Facebook đã nhận thấy những lợi nhuận liên tục và khả năng nâng cao của AI không có dấu hiệu chậm lại. Mặc dù năm 2020 là năm các hệ thống của Facebook liên tục cải thiện hiệu suất, nhưng đây cũng là năm mà các nhà nghiên cứu của họ đưa ra những bước tiến cơ bản và đột phá. Những bước tiến này được ứng dụng vào hệ thống cốt lõi của họ nhanh hơn bao giờ hết. Trong năm tới, những công nghệ hoàn toàn mới được tiết lộ sẽ hợp lực với những công nghệ đã thúc đẩy rất nhiều tiến bộ vào năm 2020.
Theo Facebook
0 Bình luận