Trong video này tại Hội nghị Công nghệ GPU NVIDIA, Ryan Olson ở NVIDIA mô tả cách các container cho HPC có thể chuẩn hóa luồng công việc trên NVIDIA GPU Cloud.
"Có rất nhiều lý do tại sao bạn muốn chuyển sang container. Container làm cho cuộc sống dễ dàng hơn rất nhiều. Thật sự là như vậy. Vì vậy, một trong những điều mà mọi người gặp vấn đề khi chạy bare metal là thỉnh thoảng library của họ thay đổi, có thể họ muốn thử phiên bản mới của CUDA, phiên bản mới của cuDNN, và họ quên gắn nó lại với đường dẫn ban đầu. Nếu bạn đã đóng gói ứng dụng của mình vào một container, nó cũng giống nhau mọi lúc. Bất cứ thứ gì trong container, đều nằm trong container."
Sau đây là mẫu đối thoại với Ryan Olson từ NVIDIA:
insideHPC: Xin chào, tôi là Rich ở insideHPC. Chúng tôi đang ở Hội nghị Công nghệ GPU tại Silicon Valley và tôi ở đây cùng Ryan từ Nvidia. Ryan, hôm nay chúng ta ở đây để nói về các container. Và khi mọi người có một quy trình làm việc, họ đã quen với việc làm theo cách dễ dàng nhất của họ, chạy trên bare metal. Tại sao tôi muốn chuyển sang một container?
Ryan Olson: Có rất nhiều lý do tại sao bạn muốn chuyển sang container. Container làm cho cuộc sống dễ dàng hơn. Thật sự là như vậy. Vì vậy, một trong những điều mà mọi người gặp vấn đề khi chạy bare metal là thỉnh thoảng library của họ thay đổi, có thể họ muốn thử phiên bản mới của CUDA, phiên bản mới của cuDNN, và họ quên gắn nó lại với đường dẫn ban đầu. Nếu bạn đã đóng gói ứng dụng của mình vào một container, nó cũng giống nhau mọi lúc. Mọi thứ trong container đều nằm trong container.
insideHPC: Ok. Khi tôi nghĩ về các container trước đây, tôi nghĩ đó chỉ là vì chúng tôi đang định chuyển sang cloud, nhưng bạn làm điều này tại local như một bước đầu tiên, phải không?
Ryan Olson: Hiển nhiên, bạn bắt đầu từ local. Sử dụng ứng dụng mà bạn đang sử dụng để chạy bare metal và chỉ di chuyển nó vào một container. Nó đấy! Chuyển nó vào container, chạy lại, đảm bảo nó vẫn hoạt động. Ngay sau khi bạn đưa nó vào container, bây giờ bạn đã sẵn sàng để chuyển sang cloud, bạn đã sẵn sàng để chuyển sang một nhà phát triển khác. Không còn phải lo lắng. Bạn có thể gửi nó bất cứ nơi nào bạn muốn sau đó.
insideHPC: Ok, ok, vậy nó không chỉ là về tính di động, sau đó, đó là về khả năng tái tạo - reproduction, có vẻ như...
Ryan Olson: Khả năng tái tạo là tên của trò chơi. Khi bạn xây dựng container đó, nó giống như một chiếc hộp thời gian. Nó được đông cứng theo thời gian, và đó là khả năng tái tạo cơ bản của bạn.
insideHPC: Và chúng tôi đã nói trước đây về cơ bản bạn đã biến Red Hat thành một loại giống như Mac, bạn chỉ cần nhấp đúp vào ứng dụng. Nó giống như ma thuật, phải không?
Ryan Olson: Nó rất giống ma thuật. Như những thứ diễn ra xung quanh lớp vỏ ngoài, một khi bạn đã quen với việc thực hiện mọi thứ theo cách đó, nó trở nên khá huyền diệu.
insideHPC: Ok, Ryan. Câu hỏi cuối cùng. Chuyện gì xảy ra tiếp theo? Ý tôi là, bạn sẽ tiếp tục cải thiện hiệu suất, hoặc tập trung vào đâu?
Ryan Olson: Điều đầu tiên là bạn phải đến gặp sysadmin của bạn và chắc chắn rằng bạn có một container run-time thích hợp có sẵn trên hệ thống của bạn. Một khi đã có sẵn, thì người dùng được tự do truy cập NGC và tải xuống các HPC container mới nhất và ổn định nhất từ registry của NVIDIA GPU Cloud. Bạn lấy những container đó và sau đó làm theo các hướng dẫn, và như tôi đã nói ở trên, nó giống như ma thuật.
insideHPC: Vâng, bạn đang đi đến hết chặng đua. Cảm ơn bạn đã chia sẻ với chúng tôi.