华为盘古否认抄袭 员工发文自曝证据
2025年6月30日,华为高调宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,宣称这是构建昇腾生态的关键举措。
然而仅隔四天,一项发布于GitHub的研究引发业界关注:用户@HonestAGI 通过“LLM指纹”技术分析指出,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),远超业内0.7以下的正常差异范围。
华为诺亚方舟实验室声明截图
华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。
盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”
然而,就在7月6日凌晨,一位自称是盘古大模型团队的员工自曝,确实存在套壳、续训、洗水印的现象。
爆料文章截图
该员工表示,由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和领导的压力也越来越大。后来小模型实验室多次套壳竞品,领导层被指默许造假行为换取短期成果。
自曝文中称:“经过内部的分析,他们实际上是使用Qwen 1.5 110B续训而来,通过加层,扩增ffn维度,添加盘古pi论文的一些机制得来,凑够了大概135B的参数。”并表示,“听同事说他们为了洗掉千问的水印,采取了不少办法,甚至包括故意训了脏数据。”“他们选择了套壳DeepSeekv3续训。他们通过冻住DeepSeek加载的参数,进行训练。”
最后他表示出于对技术伦理的坚持,决定离职并曝光内幕。
截至目前,华为并未对此自曝内容发表声明。
-
华为仓颉语言首个LTS版本1.0.0发布 本月底开源
华为仓颉编程语言官方宣布,仓颉编程语言的首个长期支持(Long-Term Support,LTS)版本正式发布。据介绍,LTS版本专为追求系统稳定性、可靠性的企业级开发、大型工程类项目打造,避免频繁变
-
华为Pura 80系列首发鸿蒙5.1:新系统看点汇总
在6月10日的华为发布会上,鸿蒙5.1系统升级的序幕正式拉开,预计于7月开始推送。根据官方消息,首批升级名单中,涵盖了从旗舰到中端的19款设备,包括Mate 70系列、Mate 60系列、Mate X
-
尊界S800成豪车百万级标杆!江汽集团高管:与华为合作 冲击很大
近日,“2025中国汽车重庆论坛”盛大举行。江汽集团股份公司党委委员、副总经理王德龙出席并演讲。王德龙谈及与华为合作时的感受时表示,华为是以结果为导向,最终是追求商业成功。而江淮过去讲以用户为中心,但
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/