Filter by 카테고리

엔비디아가 직접 딥시크 최적화 시켜본 결과 ㅎㄷㄷㄷㄷㄷ

()

이미지 텍스트 확인

NVIDIA AI
Developer
“Iola
@NVIDIAAIDev
Introducing DeepSeek-R1 optimizations for Blackwell, delivering 25x
more revenueat2Oxlower cost pertoken, compared with NVIDIA H1OO
justfour weeks ago
Fueled by TensorRT DeepSeek optimizations for our Blackwell
architecture, including FP4 performance with state-of-the-art
production accuracyit scored 99.89 of FP8 on MMLU general
intelligence benchmark
FP4-optimized DeepSeek checkpoint now available on @huggingface:
huggingface colnvidia/DeepSee.
25X Higher DeepSeek-R1 Inference Throughput
20X Lower Cost
Output TokenslSecond
25,000
1.OOx
21,088
20.000

5,000


O,50x

1OOOO


5,899
5.000
14gg
844
OOOx
HIOO
HOO
H2oO
B200
January 2025
January 2025
February 2025
February 2025
8.49 AM
Feb 25,2025
197.8K Views

엔비디아가 B200 으로 심심해서 최적화 시켜봤더니

시간당 생성토크수 25배 증가

토큰당 비용 20배 감소함

이 게시물은 얼마나 유용했습니까?

별을 클릭하여 등급을 매깁니다!

평균 평점 / 5. 투표 수:

지금까지 투표가 없습니다! 이 게시물을 평가하는 첫 번째 사람이 되세요.

리플 남기기