Đảm bảo an toàn trong ứng dụng trí tuệ nhân tạo

15:00 | 18/07/2018 | GIẢI PHÁP KHÁC

Trí tuệ nhân tạo (AI) cũng có thể bị đánh lừa, dù nó được thiết kế tốt đến đâu đi nữa. Việc ứng dụng AI từ điều khiển xe cho tới quản lý chuỗi cung ứng phân tán đang được ứng dụng rộng rãi trên thế giới. Nguy cơ AI có thể bị qua mặt bằng những dữ liệu đặc chế và trở thành một hiểm hoạ to lớn.

Đảm bảo an toàn trong ứng dụng trí tuệ nhân tạo

Trong việc phát triển ứng dụng AI, các nhà khoa học dữ liệu cần phát triển những mô hình thống kê có khả năng phát hiện, chống trả những nỗ lực đánh lừa AI. Phạm vi tấn công của một mô hình AI có thể rất rộng lớn và khó hiểu. Những lỗ hổng trong mạng nơ-ron sâu nếu bị phát hiện và lợi dụng có thể khiến tổ chức gặp nguy hiểm. Khả năng tấn công các mạng nơ-ron sâu càng ngày càng tăng lên. Các nghiên cứu đã cho thấy khá nhiều trường hợp mạng nơ-ron sâu bị tấn công phá hoại. Phần lớn các công trình nghiên cứu tập trung vào khả năng sửa đổi hình ảnh không thể phát hiện, khiến các thuật toán máy tính nhận nhầm hoặc phân loại nhầm hình ảnh. Kẻ tấn công có thể thành công ngay cả khi chúng không biết mạng nơ-ron được xây dựng như thế nào. Những sửa đổi với mục đích phá hoại có thể cực kỳ nhỏ và khó phát hiện nhưng tác hại của chúng gây ra không hề nhỏ. Ứng dụng AI có thể đưa ra quyết định sai khi bị đánh lừa, chẳng hạn như khi hiểu nhầm biển báo giao thông và chuyển hướng sai dẫn đến tai nạn. Tùy phần lớn những kiểu tấn công giả lập được thực hiện trong môi trường thí nghiệm có kiểm soát chứ không phải những ứng dụng AI triển khai trên thực tế, nhưng chúng rất có khả năng bị tội phạm, khủng bố lợi dụng.

Các nhà phát triển AI cần tuân thủ những hướng dẫn sau để phòng chống khả năng bị lợi dụng:

Giả định khả năng bị tấn công phá hoại với tất cả các tài sản AI đang ứng dụng. Do AI được ứng dụng ở khắp nơi nên các nhà phát triển phải luôn nghĩ rằng ứng dụng của họ sẽ nằm trong danh sách tấn công của tội phạm để đưa ra các biện pháp phòng thủ. Những lỗ hổng của AI có thể gây hại lớn hơn nhiều so với những sai lầm của con người vì chúng được tự động hoá và nhân rộng.
Thực hiện việc đánh giá nguy cơ trước khi phát triển: các nhà phát triển cần đánh giá từ đầu và xem xét các nguy cơ trong suốt vòng đời của quy trình phát triển ứng dụng. Theo một tài liệu nghiên cứu do IEEE công bố năm 2015, các nhà phát triển cần đánh giá khả năng kẻ xấu truy cập trực tiếp tới các cấu phần chủ chốt của dự án AI, bao gồm cả kiến trúc mạng nơ-ron, dữ liệu đào tạo, các tham số, phương pháp học máy và hàm sai lệch (loss function).
Cần giả định rằng kẻ tấn công có thể sử dụng những phương thức gián tiếp để tạo ra những dữ liệu đánh lừa: chúng có thể thu thập một tập dữ liệu thay thế từ chính nguồn dữ liệu đào tạo dùng để tối ưu hoá mạng nơ-ron. Tập dữ liệu đó có thể giúp kẻ tấn công hiểu thêm về kiểu dữ liệu giả có thể đánh lừa AI.
Tạo ra những ví dụ phá hoại trong quá trình đào tạo AI: những nhà phát triển nên tìm hiểu những nghiên cứu về các cách sửa đổi dữ liệu để đánh lừa mạng nơ-ron. Các nhà khoa học dữ liệu nên tận dụng những công cụ nguồn mở trên GitHub và các hệ thống khác để sinh dữ liệu kiểm thử lỗ hổng của mạng nơ-ron và các mạng AI khác.
Kiểm tra các thuật toán bằng nhiều dạng dữ liệu đầu vào để xác định khả năng chịu lỗi: các nhà phát triển AI cần kiểm tra xem mạng nơ-ron của họ có thể xử lý những dữ liệu đầu vào đa dạng và đưa ra kết quả đáng tin cậy tới mức nào.
Cần dựa vào cả thuật toán và con người để chống lại những dữ liệu đánh lừa: Một số kiểu chỉnh sửa có thể được con người phát hiện rất dễ dàng nhưng AI lại không nhận ra. Ngược lại, một số kiểu chỉnh sửa khác lại quá chi tiết khiến con người không phát hiện nổi nhưng lại có thể được một thuật toán phân biệt trong Generative Adversarial Networks nhận ra khá đơn giản.
Xây dựng các mô hình nhóm sử dụng nhiều thuật toán AI để phát hiện những dữ liệu đánh lừa: ví dụ như các nhà nghiên cứu ở trường đại học Campinas phát hiện một trường hợp mà thuật toán nhận dạng nông có thể phát hiện hình ảnh đánh lừa tốt hơn một mạng nơ-ron CNN nhiều lớp. Họ cũng nhận thấy một số thuật toán có thể phát hiện sự chỉnh sửa trên toàn bộ hình ảnh tốt hơn trong khi những thuật toán khác lại có khả năng vượt trội trong việc phát hiện những chỉnh sửa chi tiết ở một phần nhỏ của hình ảnh.
Tái sử dụng những kiến thức về phòng chống đánh lừa để nâng cao khả năng của AI: trong một tài liệu nghiên cứu năm 2016 của IEEE, các nhà khoa học dữ liệu có thể dùng các kỹ thuật học - chuyển giao để giảm khả năng bị tấn công của CNN hay các mô hình khác. Trong khi cách làm truyền thống áp dụng tri thức thống kê từ một mô hình có sẵn sang một mô hình khác, tài liệu nghiên cứu này mô tả cách sử dụng kiến thức thu được từ việc học một tập dữ liệu hợp lệ để phát hiện những chỉnh sửa phá hoại.
Xem xét các biện pháp phòng chống tấn công trong suốt vòng đời của các mô hình AI được triển khai: Để giảm thiểu rủi ro của các lỗ hổng trong ứng dụng AI, môi trường DevOps của các nhà khoa học dữ liệu cần hỗ trợ các biện pháp kiểm soát mạnh trong toàn bộ vòng đời sản phẩm. Những biện pháp đó có thể gồm bảo vệ trong quản lý cấu hình, theo dõi thay đổi, kiểm soát phiên bản, quản lý quyền và các biện pháp kiểm tra trong tất cả các dự án và tài sản AI.

Trường hợp lý tưởng nhất là các nhà khoa học dữ liệu có được các công cụ chống đánh lừa tinh vi để giúp họ áp dụng những phương thức thực hành tốt nhất trong toàn bộ quá trình phát triển và vận hành AI. Theo hướng đó, IBM vừa công bố Adversarial Robustness Toolbox tại hội thảo RSA Conference hàng năm. Đây là bộ công cụ nguồn mở đầu tiên bao gồm các kiểu tấn công, các biện pháp phòng chống và các phép đo cho:

Phát hiện dữ liệu đầu vào bị chỉnh sửa phá hoại: bộ công cụ bao gồm các phương thức dánh dấu những dữ liệu đầu vào để lợi dụng những điểm yếu của mạng nơ-ron sâu.
Áp dụng các biện pháp phòng chống phá hoại ở mức kiến trúc của các mô hình mạng nơ-ron: thay đổi kiến trúc của mạng nơ-ron sâu để ngăn các tín hiệu phá hoại lây lan qua lớp biểu diễn, bổ sung các ví dụ phá hoại vào dữ liệu đào tạo và/hoặc thực hiện các thay đổi tiền xử lý với dữ liệu đầu vào của mạng nơ-ron sâu. Bộ công cụ hỗ trợ ba phương thức: feature squeezing, spatial smoothing và label smoothing.
Đo khả năng chống lại dữ liệu ác ý của mạng nơ-ron bằng cách ghi nhận những sai lệch của độ chính xác khi xử lý dữ liệu đánh lừa và mức thay đổi của các biểu diễn bên trong cũng như đầu ra của mạng nơ-ron sâu khi dữ liệu đầu vào thay đổi. Sử dụng bộ công cụ triển khai độ đo mới – CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) – để đánh giá bất kỳ mạng nơ-ron phân loại nào. Độ đo này cho biết mức độ kẻ xấu có thể qua mặt một mạng nơ-ron, khiến nó phân loại sai dữ liệu đầu vào. Nó ước lượng mức tấn công tối thiểu cần thiết để có thể thay đổi thành công một hình ảnh tự nhiên thành một hình ảnh đánh lừa.

Bộ công cụ này được phát triển trong các phòng thí nghiệm của IBM ở Dublin, Ireland, bằng ngôn ngữ Python, là nguồn mở và có thể làm việc với các mô hình nơ-ron sâu. Phiên bản đầu tiên hỗ trợ TensorFlow và Keras, các phiên bản sau có thể sẽ hỗ trợ PyTorch và MXNet. Các biện pháp phòng chống trong bộ công cụ có có thể được đào tạo trên Fabric for Deep Learning mà IBM mới công bố hoặc qua IBM Deep Learning as a Service trong Watson Studio. Các nhà phát triển có thể truy cập mã nguồn của bộ công cụ qua ART GitHub.

Hiện tại, các thư viện của bộ công cụ chỉ hỗ trợ phòng chống đánh lừa cho một kiểu mạng nơ-ron sâu là những loại mô hình nhận dạng và phân loại hình ảnh. Bộ công cụ bao gồm nhiều kiểu tấn công khác nhau như Deep Fool, Fast Gradient Method, Jacobian Saliency Map. Các phiên bản trong tương lai sẽ hỗ trợ các mạng nơ-ron sâu được thiết kế để xử lý giọng nói, văn bản và dữ liệu chuỗi thời gian.

Các thư viện của bộ công cụ chủ yếu phòng chống những tấn công mà dữ liệu đánh lừa được đưa vào trong quá trình vận hành mô hình. Tuy nhiên, các biện pháp phòng chống kiểu tấn công “đầu độc”, trong đó, dữ liệu đào tạo bị chỉnh sửa ngay từ giai đoạn phát triển mô hình sẽ được cung cấp trong những phiên bản tiếp theo.

Nguyễn Anh Tuấn

Lược dịch siliconangle.com

‹ › ×

Tin liên quan

Công nghiệp tin tức và trí tuệ nhân tạo

14:00 | 28/03/2018

Các chuyên gia cho rằng, trí tuệ nhân tạo (AI) mang lại nhiều cơ hội và cả những thách thức đối với ngành công nghiệp tin tức.

Ứng dụng trí tuệ nhân tạo vào phòng chống dịch Covid-19

16:00 | 26/05/2021

Ngày nay, công nghệ ngày càng phát triển, các phần mềm sử dụng trí tuệ nhân tạo có chức năng phát hiện sớm, cảnh báo, khoanh vùng, dập dịch cũng như phát hiện người vượt biên trái phép đang dần được hoàn thiện và sẽ sớm được đưa vào ứng dụng rộng rãi trong thời gian tới.

Ứng dụng trí tuệ nhân tạo trong ngành bảo hiểm

11:00 | 22/03/2021

Dù chưa mạnh mẽ tiếp nhận, triển khai, nhưng trí tuệ nhân tạo vẫn được các tổ chức/doanh nghiệp nhìn nhận là xu thế phát triển mới trong kỷ nguyên kỹ thuật số. Với ngành bảo hiểm, trí tuệ nhân tạo còn được kỳ vọng sẽ tạo ra những thay đổi căn bản trong vài năm tới.

Tân Hoa Xã ra mắt bản tin sử dụng MC trí tuệ nhân tạo

10:00 | 12/11/2018

Đầu tháng 11/2018, Hãng thông tấn Tân Hoa Xã (Trung Quốc) đã cho ra mắt bản tin thời sự được dẫn bởi "MC ảo" có giọng nói và cử chỉ khuôn mặt phát triển trên nền tảng trí tuệ nhân tạo.

“Bố già” của Al được vinh danh với giải thưởng Turing, giải Nobel về khoa học máy tính

08:00 | 04/04/2019

Giải thưởng Turing 2018 được gọi là Giải thưởng Nobel về khoa học máy tính đã được trao cho ba nhà khoa học gồm Yoshua Bengio, Geoffrey Hinton và Yann LeCun là những người đã đặt nền móng cho AI hiện đại. Họ được ví như những ông “bố già” của thế giới AI.

Xuất hiện các cuộc tấn công mạng sử dụng trí tuệ nhân tạo trong năm 2018

09:00 | 13/03/2018

Theo một báo cáo mới đây của hãng bảo mật Avast, trong năm 2018, xu hướng kết hợp các mối đe doạ mới và đe doạ truyền thống sẽ chi phối bức tranh số. Trong đó, các cuộc tấn công sử dụng trí tuệ nhân tạo sẽ xuất hiện.

Học máy tự động sẽ là xu hướng phát triển mạnh nhất của trí tuệ nhân tạo

09:00 | 02/02/2018

Tháng 10/2015, trong buổi hội thảo về chức năng lái tự động của xe ô tô điện Tesla Model S, Giám đốc điều hành (CEO) của hãng Tesla (Mỹ) – Elon Musk đã nói rằng, mỗi người lái sẽ trở thành “chuyên gia huấn luyện” cho các Model S. Mỗi xe có thể học được từ người lái, nhưng quan trọng hơn, những kiến thức tự học này sẽ được chia sẻ với những chiếc xe khác của Tesla.

Tin cùng chuyên mục

Tăng cường bảo mật OpenSSH trên Linux

14:00 | 23/02/2024

SSH (Secure Socket Shell) là giao thức mạng để đăng nhập vào một máy tính từ xa trên một kênh truyền an toàn. Trong đó, OpenSSH là một chuẩn SSH được sử dụng ở hầu hết các bản phân phối của Linux/BSD như Ubuntu, Debian, Centos, FreeBSD, mã hóa tất cả các thông tin trên đường truyền để chống lại các mối đe dọa như nghe lén, dò mật khẩu và các hình thức tấn công mạng khác. Trong bài viết này sẽ hướng dẫn độc giả cách thức tăng cường bảo mật cho OpenSSH với một số thiết lập bảo mật và cấu hình tùy chọn cần thiết nhằm đảm bảo truy cập từ xa vào máy chủ Linux được an toàn.

Meta triển khai mã hóa đầu cuối mặc định trên Facebook Messenger

10:00 | 13/12/2023

Meta đã chính thức triển khai hỗ trợ mã hóa đầu cuối - End-to-end encryption (E2EE) trong ứng dụng Messenger cho các cuộc gọi và tin nhắn cá nhân theo mặc định trong bản cập nhật mới lần này, bên cạnh một số bộ tính năng mới cho phép người dùng có thể kiểm soát và thao tác dễ dàng và hiệu quả hơn trong các cuộc trò chuyện.

Bằng chứng không tiết lộ tri thức và ứng dụng trong an toàn thông tin

09:00 | 24/11/2023

Bằng chứng không tiết lộ tri thức (Zero-Knowledge Proofs - ZKP) là một dạng kỹ thuật mật mã được công bố từ thập niên 90 của thế kỷ trước, công nghệ mật mã này cho phép xác minh tính xác thực của một phần thông tin mà không tiết lộ chính thông tin đó. Tuy nhiên, trong những năm gần đây ZKP mới được đưa vào ứng dụng nhiều trong hệ thống công nghệ thông tin. Bài viết này sẽ trình bày chi tiết về khái niệm, tính chất, cách thức phân loại và một số ứng dụng phổ biến của ZKP trong an toàn thông tin.

Sử dụng app VNeID thay thế căn cước công dân gắn chip

16:00 | 17/10/2022

Ứng dụng VNeID có thể thay căn cước công dân (CCCD) gắn chíp và các loại giấy tờ đã đăng ký tích hợp như: giấy phép lái xe, đăng ký xe, bảo hiểm y tế.

Tin được quan tâm

Bảo đảm an ninh thông tin cơ sở hạ tầng quan trọng của Hoa Kỳ

08:00 | 11/01/2024 | Chính sách - Chiến lược
Giải pháp phân loại tương tác giữa 2 người trong chuỗi ảnh rời rạc (Phần I)

09:00 | 10/01/2024 | Giải pháp khác

Giải pháp tăng cường an ninh mạng ở Italia

09:00 | 05/01/2024|Chính sách - Chiến lược
Cạnh tranh Mỹ - Trung về cáp quang biển toàn cầu (phần 1)

09:00 | 05/01/2024|An ninh – Quốc Phòng

CISA cung cấp dịch vụ an ninh mạng cho các tổ chức trọng yếu không thuộc Chính quyền

09:00 | 21/12/2023|CA Công cộng
5 lưu ý giúp tăng cường bảo mật công nghệ vận hành cho các doanh nghiệp sản xuất

14:00 | 14/08/2023|Giải pháp khác

GP Mật mã

Sự phát triển của lược đồ chữ ký số kháng lượng tử dựa trên hàm băm

Lược đồ chữ ký số dựa trên hàm băm là một trong những lược đồ chữ ký số kháng lượng tử đã được Viện Tiêu chuẩn và Công nghệ Quốc gia Mỹ (NIST) chuẩn hóa trong tiêu chuẩn đề cử FIPS 205 (Stateless Hash Based Digital Signature Standard) vào tháng 8/2023. Bài báo này sẽ trình bày tổng quan về sự phát triển của của lược đồ chữ ký số dựa trên hàm băm thông qua việc phân tích đặc trưng của các phiên bản điển hình của dòng lược đồ chữ ký số này.

09:00 | 01/04/2024
Về một phương pháp tấn công kênh kề lên mã khối Kalyna
Khuyến nghị độ dài các tham số sử dụng cho hệ thống mật mã RSA trong một số tiêu chuẩn mật mã
Một số khuyến nghị về độ an toàn của hệ mật RSA (Phần I)