Khi AI tạo sinh (Generative AI) và các Mô hình ngôn ngữ lớn (LLMs) tiếp tục thúc đẩy sự đổi mới, các yêu cầu điện toán cho hoạt động đào tạo (training) và suy luận (inference) đã tăng lên với tốc độ đáng kinh ngạc. Để đáp ứng nhu cầu đó, Google Cloud hôm nay…
Tác giả: Anh Huy
GPU NVIDIA kiến trúc Ampere: So sánh Multi-Instance GPU vs Virtual GPU
NVIDIA Ampere là một trong hai thế hệ GPU mới nhất của NVIDIA. NVIDIA Ampere GPU trên VMware vSphere 7 Update 2 (hoặc cao hơn) có thể được chia sẻ giữa các máy ảo (VMs) ở một trong hai mode: Virtual GPU (vGPU) mode của VMware hoặc Multi-instance GPU (MIG) mode của NVIDIA. NVIDIA vGPU đã…
Hướng dẫn triển khai NVIDIA AI Enterprise trên các máy chủ vật lý thông dụng
NVIDIA AI Enterprise là gì? NVIDIA AI Enterprise là bộ phần mềm AI toàn diện, an toàn, cloud-native, cho phép các tổ chức giải quyết những thách thức mới đồng thời tăng hiệu quả hoạt động. Nó tăng tốc quy trình khoa học dữ liệu và chuẩn hóa quá trình phát triển và triển khai các…
Phát triển và triển khai liền mạch các mô hình Generative AI có thể mở rộng với NVIDIA AI Workbench
Phát triển các mô hình và ứng dụng Generative AI (GenAI) tùy biến là một hành trình, không phải là đích đến. Nó bắt đầu bằng việc chọn một mô hình được đào tạo trước (pretrained), chẳng hạn như Mô hình ngôn ngữ lớn (Large Language Model) cho những mục đích khám phá – sau đó, các developer thường…
Tại sao Kubernetes chính là nền tảng dành cho Generative AI?
Kubernetes (K8s) không còn là một công cụ chỉ để chạy các workload như ứng dụng web hay microservices, nó chính là nền tảng lý tưởng để hỗ trợ toàn bộ vòng đời của các workload lớn về Trí tuệ nhân tạo (AI) và Học máy (ML), chẳng hạn như các Mô hình ngôn ngữ lớn (LLMs)….
NVIDIA và Hugging Face giúp kết nối hàng triệu developer với siêu máy tính Generative AI
Sự tích hợp của NVIDIA DGX Cloud trong nền tảng Hugging Face giúp tăng tốc độ đào tạo và điều chỉnh LLM, đơn giản hóa việc tùy biến các mô hình cho hầu hết mọi ngành. Tại SIGGRAPH 2023 – NVIDIA và Hugging Face đã công bố mối quan hệ hợp tác sẽ đưa siêu…
DENZA hợp tác cùng WPP để xây dựng và triển khai các bộ cấu hình ô tô tiên tiến trên NVIDIA Omniverse Cloud
DENZA, thương hiệu ô tô điện (EV) sang trọng liên doanh giữa BYD và Mercedes-Benz, đã hợp tác với gã khổng lồ tiếp thị và truyền thông WPP, để xây dựng và triển khai thế hệ cấu hình ô tô tiếp theo của mình – người sáng lập kiêm Giám đốc điều hành của NVIDIA,…
Học để biết cách xây dựng các ứng dụng Generative AI và thế giới ảo 3D
Để phát triển và thành công, các doanh nghiệp phải liên tục tập trung vào việc phát triển các kỹ năng kỹ thuật, đặc biệt là trong các lĩnh vực công nghệ đang phát triển nhanh, chẳng hạn như Generative AI (GenAI) và việc tạo ra những thế giới ảo 3D. NVIDIA Training, nơi trang bị…
Cách triển khai chatbot GPT trên K8s với giao diện Gradio
Các mô hình ngôn ngữ lớn (LLM) đang chen sâu vào cuộc sống của chúng ta. Ý tôi không phải là theo nghĩa đen (ít nhất là trong thời điểm hiện tại), mà đúng hơn là có vẻ như mỗi ngày đều có vô số mô hình và ứng dụng mới xuất hiện. Sự khởi đầu tưởng chừng…
NVIDIA RAPIDS: Khoa học dữ liệu ở hiệu suất cao
Khai thác sức mạnh của GPU để dễ dàng tăng tốc các quy trình làm việc Khoa học dữ liệu (data science), Học máy (machine learning) và AI của bạn. Thực thi toàn bộ quy trình làm việc Khoa học dữ liệu với sự hỗ trợ xử lý của GPU tốc độ cao, nạp dữ…