AI圈开年首炸:139位中国清北名校天才 创立一家震撼硅谷的企业
据媒体报道,DeepSeek作为开年AI领域的重大突破,以其“国产之光”的新形象震撼了海内外科技界。这家AI创业企业以其独特的团队构成和卓越的技术成就,成为了业界关注的焦点。
从公开资料来看,DeepSeek的团队规模虽小,但实力不容小觑。其创始人梁文锋领导的团队仅有139名工程师和研究人员,相比之下,OpenAI拥有1200名研究人员,Anthropic也有500多名。
然而,DeepSeek凭借一系列吸睛的标签,如“未寻求外部融资”、“创始人囤卡富翁”、“团队成员均为清北等名校毕业生”等,成功在AI创业圈中崭露头角。
2024年12月,DeepSeek发布了最新的V3开源模型,该模型在评测中表现出色,不仅超越了阿里自研的Qwen2.5-72B和Meta自研的Llama 3.1-405B等顶级开源模型,甚至能与GPT-4o、Claude 3.5-Sonnet等顶级闭源模型相媲美。
值得注意的是,DeepSeek V3大模型发布后便完全开源,且其训练成本远低于同类模型。据SemiAnalysis数据显示,OpenAI GPT-4的训练成本高达6300万美元,而DeepSeek-V3的成本仅为其十分之一不到。
此外,DeepSeek V3模型的训练是在2000块英伟达H800 GPU上完成的,这一数量远低于硅谷大厂普遍使用的几十万块更高性能的GPU。这一成就打破了算力芯片对国产大模型的限制瓶颈,为创业团队提供了新的解法:即便在算力有限的情况下,使用高质量数据和更好的算法,同样能训练出高性能大模型。
OpenAI创始团队成员Andrej Karpathy发帖赞叹:DeepSeek-V3性能高过Llama3最强模型,且耗费资源仅十分之一,“未来或许不需要超大规模的GPU集群了”。
Meta科学家田渊栋惊叹道:“FP8预训练、MoE、预算非常有限的强大性能、从CoT中提取以进行引导……哇!这是伟大的工作!”
DeepSeek的创始人梁文锋对硅谷的惊叹并不感到意外。他认为,这是因为DeepSeek作为一个中国公司,正在以创新贡献者的身份加入到全球AI技术的竞争中。他指出,中国需要逐步成为技术的贡献者,而不是一直依赖西方的创新成果。
梁文锋还强调了中国AI发展需要建立自己的技术生态,就像西方主导的技术社区一代代创造出了摩尔定律和Scaling Law一样。他认为,很多国产芯片发展不起来,正是因为缺乏配套的技术社区和前沿技术的参与。
公开资料显示,DeepSeek的母公司幻方量化是一家量化基金起家的企业,与DeepSeek的用人风格相似,均注重本土人才。DeepSeek在AI产品正式亮相前,曾长时间内部孵化该产品,并招聘文科人才提供相关知识来源。这一独特的历程使得DeepSeek在AI领域独树一帜,成为中国AI技术创新的佼佼者。
-
腾讯元宝一举超越豆包 仅次于DeepSeek!
今日,在竞争激烈的苹果应用商店免费APP下载排行榜中,腾讯元宝表现亮眼,一举超越豆包,成功攀升至中国区榜单的第二位,而DeepSeek则继续稳居榜首。此前2月13日,腾讯元宝迎来了一次意义重大的更新。
-
DeepSeek开启开源周活动 从下周开始将开源5个repos 为开源社区助力
DeepSeek 日前在社交网站上宣布将在下周开启开源周活动,从下周一到下周五每天将开源一个 repo,用完全透明的形式分享 DeepSeek 的进展。这些 repo 中还包含 DeepSeek 在线
-
同为杭州六小龙!强脑科技创始人自曝员工屏保是梁文锋
近日,2025亚布力中国企业家论坛第25届年会在黑龙江亚布力召开,主题为“培育新质生产力,赋能高质量发展”。在论坛开幕式上,强脑科技创始人兼CEO韩璧丞上台发表了演讲。其中,在谈到技术和Deepsee
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/