PLASTER: Làm thế nào để đo hiệu năng Deep Learning

PLASTER: Giải quyết bảy thách thức lớn để kích hoạt các dịch vụ dựa trên AI

Trong thập kỷ qua, con người đã chứng kiến một kỷ nguyên phát triển nhanh như vũ bão từ Thời đại Thông tin đến Thời đại Trí tuệ Nhân tạo. Trí tuệ nhân tạo (AI) từ lâu đã bị giới hạn trong phạm vi học thuật. Sự phát triển vượt bậc trong lĩnh vực này (trong khi vẫn được thúc đẩy bởi giới hàn lâm) hiện đang được đẩy mạnh tới các phòng thí nghiệm R&D của các doanh nghiệp và các công ty khởi nghiệp năng động. Việc áp dụng chính công nghệ này trên thị trường sẽ đòi hỏi sự định hướng để AI đưa ra quyết định tốt hơn trong các doanh nghiệp, cơ quan, ban ngành…

Được tác động bởi ý tưởng như vậy để đưa AI vào hiện thực, NVIDIA đã xây dựng một framework cho Deep Learning – gọi là PLASTER. Framework này đóng vai trò là một checklist (danh sách kiểm tra) cho các công ty sẵn sàng áp dụng AI thành công. Các tiêu chí được ủy quyền bởi PLASTER đảm bảo tính bền vững của sản phẩm trong suốt vòng đời của nó. Chính vòng đời đã truyền cảm hứng cho bảy tiêu chí sau:

PLASTER là gì?

1- Programmability: Pipeline để phát triển các mô hình học tập sâu bắt đầu bằng việc mã hóa hệ thống để tự động hóa việc đào tạo. Ngay cả việc tối ưu hóa cũng phải được tự động hóa bằng cách sử dụng Grid Search hoặc Bayesian Optimization. Do đó, framework được đề xuất nên linh hoạt để thiết kế các mô hình và tự động hóa chu trình đào tạo, thử nghiệm và tối ưu hóa.
2- Latency: Hệ thống nên trả về kết quả suy luận tốt nhất trong một vài mili giây, vì thời gian đáp ứng sẽ đáp ứng mong đợi của người dùng về trải nghiệm người dùng tốt. Theo whitepaper (1) , Google đã tuyên bố rằng 7 mili giây là mục tiêu độ trễ tối ưu cho việc sử dụng dựa trên hình ảnh và video.
3- Accuracy: Đối với một số ứng dụng như chẩn đoán y tế, thậm chí không thể chấp nhận một lỗi nhỏ nào. Nhiều ứng dụng khác liên quan đến xe tự lái và máy bay không người lái trên lý thuyết nên không có lỗi (mặc dù về mặt kỹ thuật, điều này có thể không khả thi). Do đó, tùy thuộc vào ứng dụng, độ chính xác của mô hình là rất quan trọng.
4- Size của mô hình: Hầu hết các mô hình học sâu hiện đại chứa hàng ngàn tham số (layer, node, tính toán trên mỗi layer, số lượng kết nối trên mỗi layer). Kích thước mô hình học tập sâu lý tưởng tỷ lệ thuận với lượng tài nguyên mạng tính toán và vật lý cần thiết để chạy suy luận.
5- Throughput: Khi doanh nghiệp mở rộng quy mô, cơ sở người dùng tăng theo cấp số nhân. Số lượng người dùng đồng thời bắt buộc một hệ thống có thể phục vụ càng nhiều người dùng càng tốt.
6- Energy efficiency: Tiêu thụ điện năng là một yếu tố không thể bỏ qua trong thời đại mới này. Những cân nhắc kinh tế liên quan đến giá / watt tiêu thụ điện năng, và những nỗ lực nhân đạo như kiềm chế sự nóng lên toàn cầu cũng cần được xem xét.
7- Rate of learning: Hầu hết các mô hình học sâu đều được đào tạo offline. Tuy nhiên, một số ứng dụng như giao dịch thuật toán cho tài chính đòi hỏi mô hình phải học hỏi từ các luồng dữ liệu thời gian thực và phản ứng với những thay đổi trên thị trường toàn cầu.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

Khả năng mở rộng của Deep Learning

Học tập cường độ cao (extreme learning) là một thuật ngữ mới được đặt ra cho khả năng mở rộng của học sâu đối với các trường hợp tại biên như vậy. Để AI đi qua các ứng dụng trong thế giới thực, các vấn đề này cần được xử lý một cách thích hợp, nếu không, các hệ thống dựa trên AI này không bao giờ có thể có được sức ảnh hưởng trên thị trường.

Mặc dù một số mô hình học tập sâu hoạt động dựa trên việc phân loại hàng triệu danh mục như phân loại hình ảnh NLP và Thương mại điện tử, một số mô hình khác phụ thuộc vào một nhóm các mô hình để dẫn đến kết quả suy luận. Trong cả hai trường hợp, hệ thống đều yêu cầu tài nguyên lưu trữ và sức mạnh tính toán cao, được giải quyết rõ ràng bởi PLASTER.

Tóm lại

PLASTER Framework, do NVIDIA đưa ra, thể hiện bảy điểm trọng tâm cần thiết để triển khai AI thành công. Khi NVIDIA đã xuất sắc trong việc sản xuất phần cứng chuyên cho việc học sâu, Google và Microsoft gần đây cũng đã đầu tư rất nhiều vào việc phát triển chip học sâu của riêng họ. Ngay cả các công ty khởi nghiệp nhỏ cũng xuất hiện bởi hàng chục người như là cuộc đua cho sự vượt trội của AI, theo một cách nào đó đã tạo ra một sự “hồi sinh phần cứng”. PLASTER có thể trở thành chén thánh của sự phát triển học tập sâu trong vài tháng đến vài năm tới.

Bất kỳ công ty nào quan tâm đến việc cung cấp dịch vụ dựa trên AI nên xem xét mọi điểm của PLASTER vì nhiều người đã thất bại trong việc mở rộng quy mô sản phẩm của họ vì họ đã thất bại ở một hoặc nhiều số liệu được liệt kê ở trên. Điều cực kỳ quan trọng là tham khảo ý kiến các chuyên gia tên miền về vấn đề này vì một số số liệu có thể được nới lỏng cho một số ứng dụng chuyên biệt. Ví dụ, một công ty bảo mật tư nhân cao cấp có thể dung thứ cho các kết quả dương tính giả trong khi các phủ định sai sẽ là thảm họa. Nói cách khác, cho phép một cá nhân trong danh sách đen bước vào so với việc kích hoạt báo động sai trong trường hợp một cá nhân vô tội.

Các hệ thống Deep Learning có GPU NVIDIA

Các dòng máy chủ, máy trạm chuyên dùng cho Deep Learning có thể cung cấp hiệu suất tối ưu cho các mô hình học sâu hiện nay. Tất cả các giải pháp GPU được Thế Giới Máy Chủ lựa chọn cho Deep Learning đều thực hiện “chìa khóa trao tay” đầy đủ để bạn bắt đầu làm việc nhanh chóng.

Nếu bạn có bất kỳ câu hỏi về hiệu năng của các hệ thống Deep Learning của chúng tôi, hãy liên hệ với bộ phận tư vấn giải pháp tại đây.

(1) PLASTER: Một framework cho vấn đề hiệu năng học tập sâu.

____
Bài viết liên quan

Góp ý / Liên hệ tác giả