Sẵn sàng cho AI Surveillance với bộ giải pháp của Dell Technologies

Tạo môi trường an toàn hơn và thông minh hơn

Hiểu cách mọi người điều hướng và tương tác bên trong và xung quanh các tòa nhà hay bất kỳ địa điểm, cơ sở nào có thể giúp nâng cao hoạt động kinh doanh và tạo ra trải nghiệm an toàn và thông minh hơn. Hiện có hàng triệu đầu ghi hình trên toàn thế giới có khả năng tạo ra hơn bốn nghìn tỷ giờ video mỗi năm. Trước đây, hầu hết dữ liệu video này chỉ được truy cập lại để giải quyết các câu hỏi về các sự kiện trong quá khứ. Sự phát triển nhanh chóng của điện toán phân tán mạnh mẽ và phần mềm dựa trên AI đang tạo ra nhiều cơ hội để nâng cao hiệu quả và độ an toàn của các cơ sở.

Bộ giải pháp này sẽ xoay quanh các chủ để như:

– Camera ghi hình
– Phân tích lưu lượng truy cập và nhân khẩu học
– Phân tích và xác định lưu lượng xe
– Phân tích tầm nhiệt
– Tầm nhìn sâu AI

Bài này sẽ giúp bạn nhìn tổng quan về các giải pháp áp dụng cho các mục đích trên. Để giải thích sâu hơn về các chủ đề này, xin hẹn lại ở các bài viết khác.

Giải pháp này chứng minh cách các cơ sở hạ tầng do Dell Technologies thiết kế có thể hỗ trợ khả năng của phần mềm Deep Vision AI để tạo ra môi trường như bán lẻ, sản xuất, chăm sóc sức khỏe và dịch vụ công an toàn và thông minh hơn. Chúng tôi cũng sẽ mô tả về module phần mềm dựa trên AI của Deep Vision. Các module này nhận đầu vào từ các camera thế hệ mới được kết nối với nền tảng hỗ trợ của Dell Technologies để hỗ trợ các phân tích khác nhau tập trung vào việc cải thiện hiệu quả hoạt động kinh doanh và giữ cho môi trường thương mại và công cộng an toàn hơn. Giải pháp sẵn sàng này bao gồm một máy chủ PowerEdge duy nhất có vị trí gần camera triển khai ở biên. Nó bao gồm các thành phần phần cứng và phần mềm được thể hiện trong hình sau:

 

Hình 1: Nền tảng Deep Vision AI trên lớp phần mềm NVIDIA EGX và Máy chủ Dell PowerEdge

Giải pháp sẵn sàng này bao gồm:

  • Các thành phần NVIDIA:
    – Lớp phần mềm EGX cho khối lượng công việc AI đang chạy ở biên. Nó bao gồm Kubernetes, Helm, Tiller và NVIDIA GPU Operator để triển khai và quản lý các thành phần GPU cần thiết cho GPU hỗ trợ Kubernetes .
    – NVIDIA Metropolis, là một tập hợp các công cụ và công nghệ bao gồm DeepStream SDK. Bộ công cụ bao gồm TensorRT SDK cho khả năng suy luận học sâu hiệu suất cao. Các ứng dụng AI, như Deep Vision AI, có thể sử dụng DeepStream SDK và TensorRT để xử lý các luồng video và tối ưu hóa suy luận học sâu.
    – GPU T4 để giải mã và suy luận cho video.
    – Trình điều khiển CUDA và bộ công cụ để giao tiếp với GPU.
  • Deep Vision AI Platform — Các mô hình AI từ Deep Vision AI, được triển khai như một Docker container. Container này sử dụng NVIDIA DeepStream SDK và bộ công cụ NVIDIA CUDA.

Bạn cũng có thể cài đặt phần mềm quản lý Kubernetes container trong một máy ảo (VM). Máy chủ VMware ESXi có thể được cài đặt trên máy chủ PowerEdge và nền tảng Deep Vision AI được triển khai như một container trong máy ảo đó. Bạn có thể cài đặt các ứng dụng khác dưới dạng các máy ảo để tăng việc sử dụng tài nguyên máy chủ. Hướng dẫn triển khai cho môi trường ảo hóa Vmware nằm ngoài phạm vi của tài liệu này.

Máy chủ Dell PowerEdge

Giải pháp này sử dụng máy chủ PowerEdge để tính toán ở biêm (rìa mạng), gần các vị trí camera. Bộ xử lý Intel Xeon Scalable thế hệ thứ hai hoặc bộ xử lý AMD EPYC thế hệ thứ hai cung cấp sức mạnh cho máy chủ PowerEdge. Các máy chủ này hỗ trợ bộ điều khiển GPU NVIDIA T4 để giải mã video và nhận dạng hình ảnh trong mô hình học sâu, suy luận. Các máy chủ này được chứng nhận là (Nvidia GPU Cloud) NGC-Ready for Edge Systems. Khách hàng có thể chọn một trong các tùy chọn máy chủ rack được liệt kê trong bảng sau để có sự cân bằng tối ưu về tính toán, bộ nhớ và hiệu suất GPU:

Bảng 1. Tùy chọn máy chủ

Server model Processor Memory Maximum number of T4 cards
PowerEdge R640 Dual socket 2nd Gen Intel Xeon Scalable processors 24 DIMMs 3
PowerEdge R740 Dual socket 2nd Gen Intel Xeon Scalable processors 24 DIMMs 3 FI + 3 APOS on x8 slots
PowerEdge R740xd Dual socket 2nd Gen Intel Xeon Scalable processors 24 DIMMs 3 FI + 3 APOS on x8 slots
PowerEdge R7515 Single socket 2nd Gen AMD EPYC processor 16 DIMMS 4
PowerEdge R6525 Dual socket 2nd Gen AMD EPYC processor 32 DIMMS 3
PowerEdge R7525 Dual socket 2nd Gen AMD EPYC processor 32 DIMMS 6
PowerEdge R940xa Quad socket 2nd Gen Intel Xeon Scalable processors 48 DIMMS 4
DSS 8840 Dual socket 2nd Gen Intel Xeon Scalable processors 24 DIMMS 16
PowerEdge XE2420 Dual socket 2nd Gen Intel Xeon Scalable processors (maximum 150 W Gold) 16 DIMMs 4

Lưu ý: Để biết các đề xuất của chúng tôi cho các cửa hàng bán lẻ nhỏ, vừa và lớn, hãy xem phần Cấu hình

Các thành phần NVIDIA

Nền tảng NVIDIA EGX

Nền tảng NVIDIA EGX là một lớp phần mềm đám mây và có thể mở rộng cho các khối lượng công việc AI đang chạy ở biên, như trong Hình 1. Nền tảng này bao gồm NVIDIA GPU Operator để triển khai và quản lý GPU và các thành phần bắt buộc khác để lưu trữ Container hỗ trợ GPU. NVIDIA GPU Operator dựa trên bộ khung điều hành Kubernetes và tự động hóa việc quản lý tất cả các thành phần phần mềm NVIDIA cần thiết để cung cấp GPU trong Kubernetes. Nó tự động cài đặt và quản lý các thành phần sau:

  • Trình điều khiển GPU NVIDIA — Trình điều khiển cần thiết cho GPU NVIDIA.
  • NVIDIA Container Runtime — chứa các tiến trình GPU xử lý, tương thích với các công nghệ container phổ biến như Docker.
  • Trình plug-in thiết bị NVIDIA Kubernetes — Trình bổ sung thiết bị dành cho Kubernetes tự động phát hiện GPU trong các node Kubernetes và quản lý chúng.
  • NVIDIA Data Center GPU Manager (DCGM) —Một bộ công cụ để quản lý và giám sát GPU trong môi trường cluster. Nó bao gồm theo dõi tình trạng, chẩn đoán toàn diện, cảnh báo hệ thống và các chính sách quản trị bao gồm quản lý nguồn và xung nhịp. Bảng sau liệt kê các phiên bản thành phần lớp phần mềm EGX. Các phiên bản mới hơn có thể có sẵn khi chúng được phát hành.

Bảng 2. Chi tiết thành phần lớp phần mềm EGX

Software components Minimum version
GPU operator 1.0.0
NVIDIA driver 440.33.01
NVIDIA container runtime 1.0.5
NVIDIA Kubernetes device plug-in 1.0.0-beta4
NVIDIA DCGM 1.7.2
Helm 2.14.3
Kubernetes 1.15.3
Container runtime Docker CE 19.03.6
Operating system Ubuntu Server 18.04.3 LTS

NVIDIA Metropolis

NVIDIA Metropolis là một tập hợp các công cụ và công nghệ cho phép AI hiện diện trong cho các giải pháp như thành phố thông minh và bán lẻ:

NVIDIA DeepStream SDK — Một SDK cung cấp bộ công cụ phân tích phát trực tuyến để xử lý hình ảnh và video dựa trên AI cũng như xử lý đa cảm biến. Các nhà phát triển sử dụng nó để xây dựng các ứng dụng và dịch vụ phân tích video thông minh do AI hỗ trợ.

DeepStream là một thành phần chính của nền tảng NVIDIA Metropolis cho phép xây dựng các dịch vụ và giải pháp đầu cuối để chuyển đổi video và hình ảnh thành thông tin chi tiết hữu ích. Các tính năng liên quan cho giải pháp này bao gồm:

– Giảm dung lượng bộ nhớ dẫn đến mật độ xử lý luồng nâng cao
– Triển khai container
– Bổ sung tài nguyên cho suy luận, trình chuyển đổi lược đồ thông báo và bổ sung trình chuyển đổi thông báo
– Hỗ trợ cho máy ảnh không đồng nhất, phân đoạn mạng, hình ảnh đơn sắc và tăng tốc phần cứng giải mã video H.264 và H.265
– Hỗ trợ truyền thông dựa trên TensorRT để phát hiện, phân loại và phân đoạn

NVIDIA TensorRT — Một SDK cho phép suy luận học sâu hiệu suất cao. Nó bao gồm một trình tối ưu hóa suy luận học sâu và thời gian chạy mang lại độ trễ thấp và thông lượng cao cho các ứng dụng suy luận học sâu.
TensorRT được xây dựng trên CUDA, là một mô hình lập trình song song của NVIDIA. TensorRT cho phép suy luận được tối ưu hóa cho tất cả các khuôn khổ học tập sâu bằng cách sử dụng thư viện, công cụ phát triển và công nghệ trong CUDA-X cho AI, máy móc tự động, máy tính hiệu suất cao và đồ họa.

NVIDIA CUDA — Nền tảng tính toán song song và mô hình lập trình mà NVIDIA đã phát triển để tính toán chung trên GPU. Với CUDA, các nhà phát triển có thể tăng tốc các ứng dụng điện toán bằng cách khai thác sức mạnh của GPU. Các ứng dụng và hoạt động (chẳng hạn như phép nhân ma trận) thường được chạy nối tiếp trong CPU có thể chạy song song trên hàng nghìn lõi GPU.

GPU NVIDIA T4 — Một card tăng tốc PCIE Express Gen3 Deep Learning chuẩn một khe cắm PCI-e, cấu hình thấp, dựa trên GPU TU104 NVIDIA. GPU T4 có bộ nhớ 16GB GDDR6 và giới hạn công suất tối đa 70W. Nó có một bảng làm mát thụ động. NVIDIA Turing Tensor Core cung cấp năng lượng cho GPU T4 để tăng tốc suy luận, chuyển mã video và dùng ảo hóa máy tính để bàn -VDI. Giải pháp sẵn sàng này sử dụng card T4 để giải mã video và suy luận học sâu

Thành phần AI của Deep Vision
Nền tảng AI của Deep Vision cung cấp phân tích video thông minh bằng cách sử dụng AI thông qua nhận dạng phương tiện, số người và nhân khẩu học, nhận dạng khuôn mặt và những thứ khác. Các phần sau đây mô tả các thành phần AI của Deep Vision:

Bảng điều khiển dành cho quản trị viên
Bảng điều khiển dành cho quản trị viên Deep Vision AI cung cấp giao diện web được sử dụng để quản trị và cấu hình phần mềm, quản lý camera và quản lý người dùng. Nó cho phép người dùng thêm luồng camera và kích hoạt bất kỳ mô-đun phần mềm dựa trên AI nào mà Deep Vision AI hỗ trợ.

Những Mô-đun AI
Deep Vision AI có kiến ​​trúc mô-đun, trong đó mỗi mô-đun phần mềm cung cấp khả năng AI để thực hiện các phân tích nâng cao. Mỗi luồng video từ máy ảnh có thể được định cấu hình bằng một hoặc nhiều mô-đun sau:

Mô-đun nhận dạng khuôn mặt — Mô-đun này giám sát các khu vực được chỉ định để có danh sách theo dõi các cá nhân duy nhất. Hình ảnh của những người này được tải lên mô-đun, sau đó những người này có thể được xác định. Các khu vực được chỉ định được giám sát và cảnh báo được đưa ra khi các cá nhân xuất hiện trên luồng video. Các cửa hàng bán lẻ có thể sử dụng tính năng này để thông báo khách hàng VIP; các công ty có thể sử dụng tính năng này để theo dõi vị trí của nhân viên

Mô-đun Nhận dạng phương tiện — Mô-đun này xác định năm, hãng và kiểu xe, của các phương tiện đi vào các khu vực được chỉ định. Các cửa hàng bán lẻ có thể sử dụng thông tin này để cung cấp dịch vụ đón khách ở lề đường tốt hơn và nhanh hơn. Các cửa hàng bán lẻ có thể ánh xạ thông tin xe cho khách hàng bằng cách sử dụng thông tin lịch sử. Mô-đun cũng ghi lại thời gian đến, thời gian khởi hành và thời gian dừng để phân tích. Khi áp dụng cho các thành phố, mô-đun này cho phép cảnh báo thời gian thực dựa trên danh sách theo dõi xe cụ thể.

Mô-đun Đếm người và Nhân khẩu học — Mô-đun này ghi lại số người trong một khu vực được chỉ định, thông tin nhân khẩu học của họ (giới tính và tuổi) và thời gian sống của họ. Cửa hàng bán lẻ có thể sử dụng thông tin này, bổ sung với thông tin nhân khẩu học khác như địa lý, sở thích, sự quan tâm và thu nhập, để hiểu phân khúc khách hàng, ảnh hưởng đến việc lựa chọn sản phẩm và cung cấp vị trí sản phẩm, giao tiếp với khách hàng và quảng cáo.

Mô-đun Đối tượng Vào Khu vực Cảnh báo — Mô-đun này đếm số lượng người hoặc phương tiện theo loại đi vào một khu vực được chỉ định. Nó cung cấp cảnh báo dựa trên số lượng đối tượng và thời gian dành cho một khu vực. Mô-đun giúp bạn có thể:
– Đếm số người ra vào một khu vực và xác định số người ở
– Tạo cảnh báo khi một cá nhân được nhìn thấy trong khu vực bị cấm
– Khi được áp dụng cho giao thông và vận tải, cung cấp cảnh báo tắc đường, cảnh báo đỗ xe bất hợp pháp và cảnh báo dựa trên những bất thường của giao thông khác nhau.
Mô-đun này có thể được kết hợp với mô-đun Nhận dạng khuôn mặt để tạo ra cảnh báo nếu những người duy nhất đi vào các khu vực được chỉ định.

Luồng dữ liệu video và nhiệt độ
Giải pháp Sẵn sàng này sử dụng Giao thức phát trực tuyến thời gian thực (Real Time Streaming Protocol-RTSP) làm giao thức phát trực tuyến cho video. Luồng RTSP được nhận và giải mã bằng một hoặc nhiều GPU NVIDIA, như thể hiện trong hình sau:

 

Hình 2 :Quy trình làm việc của mô-đun Deep Vision AI cho máy quay video

Các mô-đun được định cấu hình hoạt động trên luồng video, tạo ra mọi cảnh báo tương ứng và tạo ra một luồng video với thông tin được phủ lên (chẳng hạn như nhận dạng và thông tin khác phía trên đầu mỗi đối tượng trong video). Bạn có thể xem các cảnh báo này trong Bảng điều khiển dành cho quản trị viên.
Ngoài việc hỗ trợ máy quay video, Deep Vision AI còn có một mô-đun để phân tích nhiệt, yêu cầu một máy ảnh nhiệt.
Mô-đun Phát hiện Nhiệt độ xác định nhiệt độ của con người và đo các phương sai so với đường cơ sở trên hoặc dưới ngưỡng chấp nhận được. Khi những người có nhiệt độ giảm xuống ngoài ngưỡng cài đặt, mô-đun sẽ đưa ra cảnh báo.

Một máy camera điển hình cung cấp cả luồng nhiệt và luồng video. Cả hai luồng này đều được giải mã bởi GPU NVIDIA T4. Mô-đun phát hiện khuôn mặt phân tích luồng video (RGB) và các tọa độ trên khuôn mặt được tính toán. Mô-đun đo nhiệt độ phân tích thông tin này và được ánh xạ tới dòng nhiệt kế, như thể hiện trong hình sau:

Hình 3 : Quy trình làm việc của mô-đun Deep Vision AI cho máy camera nhiệt

Quyền riêng tư và bảo vệ dữ liệu
Deep Vision AI cung cấp cơ chế tuân thủ Quy định chung về bảo vệ dữ liệu của Liên minh Châu Âu (General Data Protection Regulation-GDPR) và các luật bảo vệ dữ liệu quốc tế khác:
Ẩn danh dữ liệu cá nhân — Deep Vision AI hỗ trợ chế độ riêng tư. Bằng cách sử dụng chế độ này, hình ảnh khuôn mặt của các đối tượng không được quay sẽ bị mờ và không được hiển thị hoặc hiển thị cho người dùng cuối.
Bảo vệ quyền dữ liệu cá nhân — Deep Vision AI cung cấp các cơ chế dễ dàng và trực quan để xóa các đối tượng khỏi danh sách theo dõi. Tùy chọn này cung cấp cho người dùng và người vận hành phần mềm toàn quyền kiểm soát dữ liệu cá nhân. Họ có thể hành động nhanh chóng để giải quyết các yêu cầu xóa dữ liệu cá nhân. Sự bảo vệ này tuân thủ các quyền của các đối tượng được truy cập và chỉnh sửa dữ liệu, quyền được quên và áp dụng các hạn chế đối với xử lý dữ liệu cá nhân của họ và khả năng di chuyển dữ liệu của họ.

Giải pháp Sẵn sàng này là tương thích hầu hết với các kiểu camera. Cần có camera hỗ trợ nén video H.264 hoặc H.265 và các luồng video từ camera được giải nén / giải mã trong GPU T4 để xử lý và suy luận thêm. Dell Technologies khuyến nghị các camera này yêu cầu Cấp nguồn qua Ethernet (PoE) để dễ dàng triển khai nhất quán trên tất cả các chi nhánh bán lẻ. Thiết bị chuyển mạch dòng Dell EMC PowerSwitch N3000 hoặc S3100 có thể được sử dụng để cấp nguồn cho camera và cung cấp kết nối mạng.

Bảng 3. Đặc điểm kỹ thuật camera cần thiết

Feature Requirement
Minimum resolution 1080 x 1920p (Full HD) or higher
Connectivity RTSP (most IP cameras support RTSP protocol)
Lens Without distortion
Video compression H264 or H265
Frame rate 15 FPS (min); 30 FPS (recommended)
Bit rate Higher than 2 kbps
Bandwidth required per camera 6 Mbs (Full HD at 15 FPS)
Thermal image sensor Optional and required only for thermal module

Lưu ý: Cần có camera nhiệt để sử dụng mô-đun nhiệt. Camera nhiệt thường có cả cảm biến quang học và cảm biến nhiệt, đó là được yêu cầu cho mô-đun nhiệt.

Chúng tôi đã sử dụng camera Axis P-series và camera nhiệt ảnh Mobotix M16B trong phòng Lab AI của Dell.

Cấu hình đề xuất

Bảng sau đây đề xuất ba cấu hình và hướng dẫn định cỡ chung dựa trên số lượng mô-đun và camera được yêu cầu cho một tình huống:

Bảng 4. Các cấu hình đề xuất: Tóm tắt

Configuration size Example scenario Configuration
Small Two modules with a total of 7 camera streams:

•4 camera streams for the Facial Recognition module

•3 camera streams for the People Counting and Demographics module

R7515 server with a single socket AMD processor and a single NVIDIA T4 GPU
Medium Four modules with total of 12 camera streams

•4 camera streams for the Facial Recognition module

•4 camera streams for the People Counting and Demographics module

•2 camera streams for the Vehicle Identification module

•2 camera streams for the Temperature Detection module

R740 server with a dual socket Intel Scalable Xeon processor and two NVIDIA T4 GPUs

 

Configuration size Example scenario Configuration
Large Five modules with total of 20 camera streams

•4 camera streams for the Facial Recognition module

•4 camera streams for the People Counting and Demographics module

•4 camera streams for the Vehicle Identification module

•4 camera streams for the Temperature Detection module

•4 camera streams for the Objects Entering Alert Zones module

R7525 server with a dual socket AMD EPYC processor and four NVIDIA T4 GPUs

Lưu ý: Đối với môi trường khắc nghiệt bên ngoài trung tâm dữ liệu, hãy sử dụng máy chủ PowerEdge XE2420. Đây là một máy chủ 2 socket CPU hỗ trợ tối đa 4 GPU NVIDIA T4 và chịu được nhiệt độ cao khi hoạt động kéo dài.

Bảng sau cung cấp chi tiết bổ sung cho từng cấu hình:

Bảng 5. Các cấu hình được đề xuất: Chi tiết

Component Small configuration Medium configuration Large configuration
Server model R7515 R740 R7525
Processor AMD EPYC 7502P 2.5 GHz, 32C/64T, 128 M Cache (180 W) Intel Xeon Gold 6252 2.1 G,

24C/48T, 10.4 GT/s, 35.75 M

Cache, Turbo, HT (150 W) DDR4-2933

AMD EPYC 7702P 2.00 GHz, 64C/128T, 256 M Cache (200 W) DDR4- 3200
Memory 8 x 8 GB 8 x 16 GB 16 x 16 GB
GPUs 1 NVIDIA T4 GPU 2 NVIDIA T4 GPUs 4 NVIDIA T4 GPUs
Network adapter Broadcom 57416 Dual Port 10 GbE BaseT Network LOM Mezz Card Broadcom 57416 Dual Port 10 GbE BaseT Network LOM Mezz Card Broadcom 57416 Dual Port 10 GbE BaseT Network LOM Mezz Card
Storage 6 x 480 GB SAS SSDs in RAID 6 8 x 480 GB SAS SSDs in RAID 6 12 x 480 GB SAS SSDs in RAID 6
Operating system Ubuntu server Ubuntu server Ubuntu server
Trusted Platform Module Trusted Platform Module 2.0 Trusted Platform Module 2.0 Trusted Platform Module 2.0
Solution ID 12785033.1 12785314.1 12785814.1

Khách hàng có thể cung cấp số ID Giải pháp cho đại diện bán hàng của Dell để đặt hàng máy chủ PowerEdge. Các cấu hình được cung cấp như một điểm khởi đầu và đại diện bán hàng của Dell sẽ tùy chỉnh cấu hình máy chủ, bao gồm bộ xử lý, bộ nhớ và đĩa cứng, nếu cần.

Network layout

Hình sau cho thấy một bố cục mạng mẫu cho các cấu hình:

Hình 4 :Máy chủ PowerEdge với Deep Vision AI và NVIDIA EGX

Bộ chuyển mạch PowerSwitch N3000 hỗ trợ PoE, mà các camera thường yêu cầu.
Mỗi camera, phục vụ bất kỳ mục đích nào, đều có thể được kết nối với PowerSwitch. Máy chủ PowerEdge chạy hệ sinh thái phần mềm Deep Vision AI và NVIDIA EGX cũng được kết nối với cùng một bộ chuyển mạng.

Bảng sau cung cấp danh sách các model PowerSwitch và các khả năng chính của chúng:

Bảng 6. Khả năng của model PowerSwitch

Switch model Capability
N3048ET-ON •1 GbE port attributes:

§12 RJ45 autosensing (1Gb/100 Mb/10 Mb) PoE 60 W fixed ports

§36 RJ45 autosensing (1 Gb/100 Mb/10 Mb)

•2 integrated 10 GbE SFP+ dedicated ports

•2 integrated GbE SFP combo ports

N3024EP-ON •1 GbE port attributes:

§12 RJ45 autosensing (1 Gb/100 Mb/10 Mb) PoE 60 W fixed ports

§12 RJ45 autosensing (1 Gb/100 Mb/10 Mb) PoE+ fixed ports

•2 integrated 10 GbE SFP+ dedicated ports

•2 Integrated GbE SFP combo ports

•60 W on 12 ports; 30.8 W on remaining 12 ports (might require a second power supply module)

N3048EP-ON •1 GbE port attributes:

§12 RJ45 autosensing (1Gb/100 Mb/10 Mb) PoE 60 W fixed ports

§36 RJ45 autosensing (1 Gb/100 Mb/10 Mb) PoE+ fixed ports

•2 integrated 10 GbE SFP+ dedicated ports

•2 integrated GbE SFP combo ports

•60 W on 12 ports; 30.8 W on remaining 12 ports (might require a second power supply module)

S3148P •1 GbE Port Attributes:

§48 x RJ45 autosensing (1 Gb/100 Mb/10 Mb) PoE+ fixed ports

•Integrated 10 GbE SFP+ dedicated ports: 2

•Integrated GbE SFP combo ports: 2

•Maximum PoE Watts per port: 30.8 W on 48 ports (might require 2nd power supply module)

Chúng tôi đề xuất model PowerSwitch S3148P cho Giải pháp sẵn sàng này.

Triển khai và quản lý

Tổng quan về triển khai

Các bước sau đây cung cấp tổng quan chuyên sâu về việc triển khai Giải pháp sẵn sàng này:
1. Lắp đặt camera — Tùy thuộc vào các mô-đun đang được sử dụng, vị trí đặt camera là rất quan trọng. Đối với các mô-đun Nhận dạng khuôn mặt và Đếm người và Nhân khẩu học, hãy đặt camera ở vị trí để ghi lại một số góc nhìn chính diện của từng người đang đi về phía camera.
Để biết thêm thông tin về vị trí đặt camera, chẳng hạn như các góc và khoảng cách cần thiết từ đối tượng, hãy liên hệ với chuyên gia giải pháp của Dell.

2. Triển khai lớp phần mềm EGX trên máy chủ Dell PowerEdge — Dành cho
thông tin về cách triển khai phần mềm EGX, (hãy xem Hướng dẫn cài đặt EGX Stack v1.2 cho Ubuntu Server x86-64 trên GitHub). Các bước bao gồm cài đặt và cấu hình hệ điều hành Ubuntu, cũng như cài đặt Docker, Kubernetes, Helm và NVIDIA GPU Operator.

3. Triển khai Deep Vision AI — Deep Vision AI có sẵn để cài đặt dưới dạng biểu đồ Helm hoặc bằng cách sử dụng Docker Compose. Biểu đồ Helm được yêu cầu để cài đặt trên lớp phần mềm EGX. Nếu bạn sử dụng Docker Compose, hãy cài đặt Bộ công cụ NVIDIA trên hệ điều hành máy chủ. Trong cả hai trường hợp, bạn có thể tải xuống và triển khai Bảng điều khiển dành cho quản trị viên Deep Vision AI và các mô-đun phần mềm bắt buộc dưới dạng Docker container.

Lưu ý: Tại thời điểm xuất bản, không phải tất cả các mô-đun Deep Vision AI đều có sẵn để triển khai thông qua Helm trên EGX. Trong trường hợp này, hãy triển khai các mô-đun Deep Vision AI như một Docker container và thông qua công cụ Docker Compose. Liên hệ với đại diện bán hàng của Dell để biết thêm thông tin.

4. Định cấu hình các mô-đun phần mềm — Khi được triển khai, nền tảng Deep Vision AI được định cấu hình để phát trực tuyến các camera. Đối với mỗi camera, hãy kích hoạt một hoặc nhiều mô-đun. Bạn có thể nhận được key license thông qua đại diện bán hàng của Dell để kích hoạt mỗi mô-đun camera.

5. Định cấu hình camera và cảnh báo — Cuối cùng, thêm camera và kích hoạt các mô-đun phần mềm cần thiết trong bảng điều khiển quản trị Deep Vision AI. Cấu hình cảnh báo tùy thuộc vào trường hợp sử dụng.

Cấp phép

Mô hình cấp phép Deep Vision AI là trên mỗi mô-đun phần mềm và luồng camera. Giấy phép có sẵn trong các gói gồm 10 luồng camera cho mỗi mô-đun phần mềm. Một luồng camera có thể được định cấu hình bằng một hoặc nhiều giấy phép phần mềm. Cả giấy phép hàng năm (bao gồm nâng cấp và hỗ trợ cơ bản) và giấy phép vĩnh viễn (hỗ trợ cơ bản riêng biệt, mua hàng năm và nâng cấp phần mềm) đều có sẵn. Các SKU dịch vụ thiết lập là bắt buộc đối với cả hai loại giấy phép.

Tích hợp các cơ chế cảnh báo

Bảng điều khiển dành cho quản trị viên Deep Vision cung cấp chức năng cần thiết để định cấu hình mô-đun phần mềm và nhận thông báo cảnh báo. Deep Vision AI cũng có thể được tích hợp với phần mềm cảnh báo hiện có của khách hàng hoặc Phần mềm quản lý video (Video Management Software-VMS) thông qua Kafka. Deep Vision AI hỗ trợ Kafka và tạo ra các chủ đề trên Kafka. VMS hoặc bất kỳ phần mềm cảnh báo nào khác có thể hoạt động như một người dùng Kafka để nhận các cảnh báo từ Deep Vision AI.

Kết hợp với các giải pháp khác

Giải pháp Sẵn sàng này có thể cùng tồn tại với các giải pháp phân tích video thời gian thực khác. Nhiều giải pháp có thể được triển khai trên một node vùng biên duy nhất và tận dụng sức mạnh tính toán có sẵn trong máy chủ PowerEdge. Các giải pháp này có thể được cài đặt dưới dạng các máy ảo để cung cấp riêng lẻ hoặc như các container.

Kết quả Giải pháp

Đồng hành cùng Giải pháp sẵn sàng cho AI: Ngăn ngừa tổn thất bán lẻ
Ví dụ: giải pháp sẵn sàng này có thể cùng tồn tại với Giải pháp sẵn sàng cho AI: Ngăn ngừa tổn thất bán lẻ. Một cửa hàng bán lẻ có thể triển khai cả hai giải pháp này để ngăn ngừa tổn thất bán lẻ và phân tích video để xác định phương tiện và nhân khẩu học của khách hàng. Một máy chủ PowerEdge duy nhất có thể được sử dụng làm node biên để hỗ trợ tình huống như vậy.
Chúng tôi khuyên bạn nên dành riêng GPU NVIDIA T4 cho từng trường hợp sử dụng để cung cấp hiệu suất có thể dự đoán được. Ví dụ: máy chủ PowerEdge R7525 có thể được định cấu hình với bốn GPU, như thể hiện trong hình sau:

hình 5 :Giải pháp ngăn ngừa tổn thất bán lẻ và phân tích video

Bạn có thể dành hai GPU để ngăn ngừa tổn thất bán lẻ hỗ trợ tám đến chín thiết bị đầu cuối thanh toán tự phục vụ và hai GPU để nhận dạng phương tiện và nhân khẩu học của khách hàng hỗ trợ khoảng 15 luồng camera.

Kết quả giải pháp

Phân tích nhân viên và khách hàng tại cửa hàng

Phân tích nhân viên và khách hàng tại cửa hàng
Các cửa hàng bán lẻ có thể sử dụng Giải pháp Sẵn sàng này để phân tích lưu lượng khách đến cửa hàng. Họ có thể đếm số lượng người tại một thời điểm và khu vực cụ thể trong cửa hàng, phân khúc họ theo nhân khẩu học theo độ tuổi và giới tính, đồng thời hiểu được thời gian vào, ra và ở của khách hàng. Các camera được đặt ở lối vào và lối ra của cửa hàng cho phép phần mềm Deep Vision AI phân tích các luồng video để cung cấp phân tích khách hàng và nhân viên. Phần mềm phát hiện những người ra vào cửa hàng bán lẻ, đồng thời tính toán thời gian ở lại và số lượng người trong cửa hàng bán lẻ. Ngoài ra, lưu lượng khách đến cửa hàng có thể được phân tích tại các khu vực cụ thể như quầy thu ngân để điều chỉnh nguồn lực của cửa hàng một cách linh hoạt theo yêu cầu.

Thông tin này có sẵn trong bảng điều khiển phân tích cũng như bảng thông báo nơi cung cấp các cảnh báo thời gian thực, như thể hiện trong hình sau:

Hình 6: Bảng điều khiển phân tích Deep Vision AI

Phần mềm áp dụng các phép biến đổi toán học đối với hình ảnh chụp cắt gương mặt, tạo ra các biểu diễn số do phần mềm tạo ra các thông tin phi trực quan làm cho phần mềm hoạt động. Do đó, mô-đun AI này không lưu thông tin nhận dạng cá nhân.

Cải thiện việc đón khách ở lề đường cho các cửa hàng bán lẻ

Giải pháp Sẵn sàng này cho phép các cửa hàng bán lẻ cung cấp dịch vụ đón khách ở lề đường tốt hơn và nhanh hơn bằng cách giám sát các phương tiện đến khu vực nhận hàng.
Khi một chiếc xe đến làn đường đón (hoặc đi vào khu phức hợp vừa đỗ xe vừa bán lẻ), giải pháp sẽ xác định loại xe, kiểu dáng và màu sắc để nhận dạng khách hàng. Sau đó, một nhân viên có thể được cử đi để giao đơn đặt hàng. Giải pháp cung cấp cho các nhà quản lý cửa hàng và chủ doanh nghiệp những phân tích có giá trị như thời gian phục vụ, sử dụng bãi đậu xe, v.v. Giải pháp này cung cấp cho các nhà bán lẻ một công cụ để đo lường mức độ hài lòng của khách hàng và cải thiện hiệu quả hoạt động, biến quy trình nhận hàng ở lề đường thành một trải nghiệm trơn tru và liền mạch.

Hình dưới đây là một ví dụ trên bảng điều khiển cho thấy thời gian đến, đi và ở lại của khách hàng cũng như loại xe, kiểu xe và màu sắc:

Hình 7: Ví dụ về thời gian khởi hành và thời gian dừng lại

Hình sau cho thấy luồng thời gian thực của các làn đường lấy hàng tại cửa hàng bán lẻ:

Hình 8 :Luồng thời gian thực của các làn đón

Quản lý và Điều khiển giao thông

Giải pháp Sẵn sàng này giúp các thành phố giám sát và định lượng lưu lượng giao thông để đánh giá các mô hình thay đổi, đồng thời phát hiện và báo cáo các bất thường và sự cố trong thời gian thực. Nó cung cấp cho các thành phố những hiểu biết có giá trị để thực hiện và quản lý các nguồn lực, thực thi
phương pháp luận và khuyến nghị chính sách đảm bảo phúc lợi công cộng. Phần mềm Deep Vision AI giám sát dữ liệu phương tiện và người đi bộ thông qua các luồng camera, thu thập dữ liệu giao thông của phương tiện và báo cáo các sự cố như tắc đường, xe bị chết máy, lái xe đi sai làn đường, rẽ trái phép, v.v.
Giải pháp cho phép giảm chi phí lao động bằng cách giám sát các không gian công cộng và riêng tư trong thời gian thực mà không cần sự can thiệp của con người. Ngoài ra, các luồng doanh thu mới có thể được tạo ra thông qua kiếm tiền từ dữ liệu.

Hình sau cho thấy luồng lưu lượng giao thông theo thời gian thực:

hình 9: Giám sát và quản lý giao thông

Lưu ý: Trường hợp sử dụng này không được triển khai trong Phòng thí nghiệm AI của Dell, nhưng đã được phát triển bởi Deep Vision AI.

Phát hiện nhiệt độ cho sức khỏe và an toàn công cộng

Giải pháp Sẵn sàng này cho phép các cửa hàng bán lẻ theo dõi nhiệt độ cơ thể của nhân viên và khách hàng và thực hiện hành động thích hợp khi vượt quá ngưỡng đã định trước. Khi mọi người vào khu vực được chỉ định, nhiệt độ của họ sẽ được theo dõi. Không có cảnh báo nếu nhiệt độ của một người giảm trong ngưỡng đặt trước. Khi nhiệt độ cơ thể của một người vượt quá ngưỡng, Deep Vision AI sẽ đưa ra cảnh báo. Sau đó, cửa hàng bán lẻ có thể thực hiện hành động thích hợp.

Hình sau cho thấy luồng phát hiện thân nhiệt theo thời gian thực:

hình 10: Phát hiện nhiệt độ cơ thể

Lưu ý: Các phép đo nhiệt được thiết kế như một công cụ phân loại và không phải là phương tiện duy nhất để chẩn đoán những người có nguy cơ cao đối với bất kỳ mối đe dọa vi rút nào. Xác nhận kết quả đo nhiệt độ cao bằng công cụ đánh giá cấp độ lâm sàng thứ cấp. FDA khuyến nghị nên sàng lọc từng cá nhân một, không phải theo nhóm.

Kết luận

Những thách thức khi hoạt động ở biên độ rộng và quy mô lớn, đòi hỏi những kiến trúc sáng tạo. Giải pháp sẵn sàng này mô tả cách mang sức mạnh của công nghệ phần cứng mới nhất và AI tăng tốc cho thị giác máy tính vượt trội như được trình bày trong Phòng thí nghiệm AI của Dell.

Để đạt được sự cân bằng phù hợp giữa các thuật toán xử lý phần cứng, phần mềm và phương tiện truyền thông ở biên cần phải có kinh nghiệm và kiến thức ứng dụng chuyên sâu. Tài liệu này cho thấy cách trình bày chuyên môn về các sản phẩm và giải pháp kết hợp của Dell Technologies, Deep Vision AI và NVIDIA có thể cung cấp nền tảng mà bạn cần để triển khai ứng dụng phân tích video ở biên mà không cần thử nghiệm. Sau các chi tiết của giải pháp này, bạn có thể tiến hành với một lộ trình POC đầy đủ chức năng theo lịch trình nhanh gọn, với rủi ro và chi phí thấp hơn so với phương pháp tự làm (DIY).

 

   Liên hệ tư vấn giải pháp    
1900 558879     solution@nhattienchung.vn