作家 | 程茜 裁剪 | 云鹏 智东西2月14日报谈,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在握续上升。 这是继DeepSeek应使劲压ChatGPT登顶好意思区App Store免费榜、模子在开源社区GitHub上Star数初次卓著OpenAI之后,创下的又一个历史时代,DeepSeek在国外平台再次登顶。 Hugging Face点赞榜单前十名的模子中,齐曾在不同节点引爆整个这个词大模子产业。 排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班东谈主马开荒的新责任室黑丛林责任室打造,点赞数约8710次。 排名第六的是人人1000名科学家构成BigScience打造的参数高达1760亿个的超大NLP模子BLOOM,第八的是欧洲AI独角兽Mistral AI基于MoE架构的模子Mixtral-8x7B,其余六席被Meta的Llama系列模子和StabilityAI家的模子包揽。 OpenAI的语音转录模子Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。 此外,DeepSeek-V3的排名在第19名,点赞约3810次,卓著了微软的Phi-2和谷歌Gemma-7B模子。 Hugging Face点赞数名次榜前30的还有DeepSeek另一款开源的多模态模子Janus-Pro-7B,该模子在使用文本辅导的图像生成名次榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。 ▲开源社区Hugging Face点赞榜(图源:Hugging Face) DeepSeek V3、DeepSeek R1、Janus-Pro-7B分辩于2024年12月26日和本年1月20日、1月28日发布。 DeepSeek V3为DeepSeek自研MoE模子,参数目达到671B,激活参数目37B,在14.8T token上进行了预考验,该模子在多项评测得益卓著了Qwen2.5-72B和Llama-3.1-405B等开源模子,并在性能上和闭源模子GPT-4o以及Claude-3.5-Sonnet并排。 DeepSeek R1在数学、代码、当然言语推理等任务上,性能并排OpenAI o1郑再版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模子的同期,蒸馏了6个小模子,其中32B和70B模子在多项智商上竣事了对标OpenAI o1-mini的律例。 多模态模子Janus-Pro是旧年发布的Janus的高等版块,可权贵栽种多模态剖判和视觉生成。 当下欧洲杯体育,人人仍是掀翻了从芯片企业、云揣摸巨头到各路基础要道公司适配、接入DeepSeek的兴隆,DeepSeek所展现出的超卓性能与鄙俚的利用后劲正在迟缓放大。 |