DeepSeek-R1 Distill系列
基于DeepSeek-R1的推理能力,通過蒸餾技術(shù)將推理能力遷移到較小的模型上,在保持高效性能的同時,成功降低了計算成本,實現(xiàn)了“小身材、大智慧”的完美平衡!該鏡像使用vLLM部署提供支持,適用于高性能大語言模型的推理和微調(diào)任務(wù),
第一步:登錄「優(yōu)云智算」算力共享平臺并進入「鏡像社區(qū)」
地址:https://www.compshare.cn/?ytag=seo
第二步:選擇「vLLM-DeepSeek-R1-Distill」鏡像,點擊「使用該鏡像創(chuàng)建實例」
鏡像地址:https://www.compshare.cn/images-detail?ImageID=compshareImage-17ym815cbokz
根據(jù)鏡像說明中的引導,選擇所用模型需要的GPU算力規(guī)格,并點擊「立即部署」即可擁有一個自帶模型的算力資源。
第三步:啟動vLLM api 服務(wù),鏡像已配置好所需依賴環(huán)境,無需額外安裝,即可通過以下命令啟動vLLM服務(wù):
單卡4090
# DeepSeek-R1-Distill-Qwen-1.5B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --port 8000
# DeepSeek-R1-Distill-Qwen-7B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B --port8000 --max-model-len 65536
# DeepSeek-R1-Distill-Llama-8B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Llama-8B --port8000 --max-model-len 17984
2卡4090
# DeepSeek-R1-Distill-Qwen-14B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B --port8000-tp2 --max-model-len 59968
4卡4090
# DeepSeek-R1-Distill-Qwen-32B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B --port 8000 -tp 4 --max-model-len 65168
8卡4090
# DeepSeek-R1-Distill-Llama-70B
vllm serve /model/HuggingFace/deepseek-ai/DeepSeek-R1-Distill-Llama-70B --port 8000
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/131183.html
DeepSeek Janus-Pro開源模型DeepSeek團隊于1月28日凌晨發(fā)布了開源多模態(tài)大語言模型Janus-Pro,這是一款基于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base構(gòu)建的模型。第一步:登錄「優(yōu)云智算」算力共享平臺并進入「鏡像社區(qū)」地址:https://www.compshare.cn/?ytag=seo 第二步:選擇「Janus-Pro-...
DeepSeek-R1-671b動態(tài)量化版,由unsloth.ai發(fā)布,推薦使用多卡進行部署,具體操作如下。本鏡像還附帶32b的無限制版蒸餾模型,使用open-webui和ollama以及l(fā)lama.cpp進行部署,內(nèi)置所有環(huán)境,即拉即用。第一步:登錄「優(yōu)云智算」算力共享平臺并進入「鏡像社區(qū)」,新用戶免費體驗10小時4090地址:https://www.compshare.cn/?ytag=seo...
DeepSeek-R1-32B-WebUIDeepSeek-R1采用強化學習進行后訓練,旨在提升推理能力,尤其擅長數(shù)學、代碼和自然語言推理等復雜任務(wù),該鏡像安裝和使用 Ollama 和 Open WebUI,以便更好地利用深度學習模型進行推理和交互。第一步:登錄「優(yōu)云智算」算力共享平臺并進入「鏡像社區(qū)」地址:https://www.compshare.cn/?ytag=seo第二步:選擇「Deep...
DeepSeek V3憑借多頭潛注意力(MLA)與優(yōu)化的混合專家網(wǎng)絡(luò)(MoE)架構(gòu),奠定了高效訓練的基礎(chǔ),僅以557.6萬元成本實現(xiàn)媲美OpenAI O1的性能;而R1則基于V3進一步突破,通過無監(jiān)督強化學習與知識蒸餾技術(shù),在推理能力上對標頂尖模型,同時開源多尺寸版本,推動更廣泛的應(yīng)用。DeepSeek三種模式對比基礎(chǔ)模型(V3):通用模型(2024.12),高效便捷,適用于絕大多數(shù)任務(wù),規(guī)范性 ...
(遵循數(shù)據(jù)全面性、客觀性、可驗證性及結(jié)構(gòu)化原則)一、排名依據(jù)與評估維度本文從以下維度評估GPU云服務(wù)器一體機解決方案:性能表現(xiàn):包括GPU型號覆蓋、算力效率、分布式訓練支持等。可靠性:服務(wù)穩(wěn)定性、容災能力、SLA承諾。生態(tài)整合:與AI框架的兼容性、多模態(tài)大模型支持、開發(fā)者工具鏈。性價比:單位算力成本、彈性計費模式、長期合作折扣。行業(yè)適配:企業(yè)級服務(wù)案例、垂直領(lǐng)域解決方案。二、2025年GPU云服務(wù)...
閱讀 1582·2025-02-07 13:29
閱讀 1006·2024-11-07 18:25
閱讀 131501·2024-02-01 10:43
閱讀 1358·2024-01-31 14:58
閱讀 1147·2024-01-31 14:54
閱讀 83574·2024-01-29 17:11
閱讀 3875·2024-01-25 14:55
閱讀 2392·2023-06-02 13:36