NVIDIA dường như không từ bỏ tiềm năng thị trường AI khổng lồ của mình tại thị trường Trung Quốc khi công ty được cho là đang sản xuất nhiều GPU Hopper hơn để vượt qua các hạn chế của Hoa Kỳ .
NVIDIA H20, L20 & L2 là những GPU AI mới dành cho thị trường Trung Quốc
Theo báo cáo mới nhất của Dylan Patel của Semianalysis , có vẻ như NVIDIA có kế hoạch ra mắt ít nhất ba GPU AI mới cho thị trường Trung Quốc, bao gồm H20 SXM, PCIe L20 và PCIe L2. Tất cả các chip này đều dựa trên kiến trúc GPU Hopper và sẽ có hiệu suất lý thuyết tối đa là 296 TFLOP.
Thông số kỹ thuật chính xác về cấu hình GPU của những con chip này vẫn chưa được biết nhưng Hopper H20 SMX có dung lượng bộ nhớ 96 GB hoạt động với tốc độ lên tới 4,0 Tb/s, công suất tính toán 296 TFLOP và sử dụng khuôn GH100 với mật độ hiệu suất là 2,9 TFLOPs/die so với 19,4 của H100. H100 SXM nhanh hơn 6,68 lần so với H20 SXM theo bảng được liệt kê nhưng đó là FLOP lõi căng FP16 (có độ thưa thớt) chứ không phải FLOP INT8 hoặc FP8. GPU có TDP 400W và có cấu hình 8 chiều trong giải pháp HGX. Nó vẫn giữ kết nối NVLINK 900 GB/s và cũng cung cấp chức năng MIG (GPU đa phiên bản) 7 chiều.
- NVIDIA H100 SXM TF16 (Độ thưa thớt) FLOPS = 1979
- NVIDIA H20 SXM TF16 (Độ thưa thớt) FLOPS = 296
NVIDIA L20 đi kèm với bộ nhớ 48 GB và hiệu suất tính toán cao nhất là 239 TFLOP trong khi L2 được cấu hình với bộ nhớ 24 GB và hiệu suất tính toán cao nhất là 193 TFLOP. GPU có hệ số dạng PCIe khiến chúng trở thành giải pháp khả thi cho máy trạm và máy chủ tại văn phòng. Đây là những cấu hình được cắt giảm nhiều hơn so với những gì khách hàng Trung Quốc nhận được trước đây dưới dạng H800 và A800 nhưng có vẻ như bộ phần mềm NVIDIA dành cho AI và HPC quá giá trị để một số khách hàng này có thể từ bỏ và họ sẽ sẵn sàng chấp nhận các thông số kỹ thuật được giảm bớt để có quyền truy cập vào các kiến trúc Hopper hiện đại này.
- L40 TF16 (Độ thưa thớt) FLOP = 362
- L20 TF16 (Độ thưa thớt) FLOP = 239
- L4 TF16 (Độ thưa thớt) FLOP = 242
- L2 TF16 (Độ thưa thớt) FLOP = 193
Ngoài ra, mặc dù chúng bị cắt giảm theo quan điểm tính toán truyền thống, báo cáo cho biết rằng trong suy luận LLM, H20 SXM thực sự sẽ nhanh hơn H100 vì nó có những điểm tương đồng với H200 của năm tới . Điều này cho thấy rằng ít nhất một phần của GPU không bị cắt giảm so với phần còn lại của chip. Chip NVIDIA HGX H20 SXM và GPU PCIe L20 dự kiến sẽ ra mắt vào tháng 12 năm 2023 trong khi bộ tăng tốc L2 PCIe sẽ có mặt vào tháng 1 năm 2024. Quá trình lấy mẫu sản phẩm sẽ bắt đầu sớm hơn một tháng so với thời điểm phát hành.
NVIDIA vẫn chưa chính thức công bố những con chip này nhưng họ có thể sẽ giữ bí mật và âm thầm cập nhật cho các đối tác của mình về kế hoạch thay vì công bố toàn diện về sản phẩm AI. Những hạn chế gần đây do chính phủ Hoa Kỳ áp đặt đối với Trung Quốc đã thúc đẩy người Trung Quốc tìm kiếm các giải pháp thay thế AI

NVIDIA biết tiềm năng mà một số công ty cạnh tranh này nắm giữ và sẽ cố gắng hỗ trợ cơ sở khách hàng Trung Quốc của mình nhiều nhất có thể trong khi tuân thủ các quy định của Hoa Kỳ. Công ty cũng có nhu cầu lớn về AI trên toàn cầu và mặc dù gần đây đã hủy các đơn đặt hàng trị giá 5 tỷ USD, đội xanh sẽ chỉ phân bổ lại nguồn cung của mình ở nơi khác để những khách hàng trước đây phải đợi hơn một năm mới nhận được- trên GPU giờ đây có thể sớm sở hữu vàng AI của NVIDIA.