所在地:浙江 · 杭州
成立時間:2023-07-17
網(wǎng)址:https://www.deepseek.com/
公司簡介:DeepSeek是一家開源MoE大模型技術研發(fā)商,專注于自然語言處理(NLP)和多模態(tài)數(shù)據(jù)的高效挖掘與分析,核心技術包括深度學習、自然語言處理、生成對抗網(wǎng)絡等前沿算法,其模型架構采用了混合專家(Mixture-of-Experts,MoE)架構和多頭潛在注意力(MLA)技術,此外還引入了無輔助損失的負載平衡策略和多標記預測訓練目標,以實現(xiàn)更高效的訓練和推理,旗下同名聊天機器人在回應用戶提問時,會將思維鏈條完全展示出來,其作為機器人認真揣摩用戶需求、試圖將用戶所有說出口或隱晦表達的情緒都安慰到位的“內(nèi)心活動”激發(fā)了大量用戶的熱情,還擁有一個智能代碼助手“DeepSeek Coder”,提供模型有指令Python快速寫出程序、修改UI(用戶界面)、測試bug(程序錯誤)以及數(shù)據(jù)分析,學寫SQL(數(shù)據(jù)庫語言)等技能,可應用于內(nèi)容創(chuàng)作、教育、客戶服務、金融分析等領域。