华为匿名员工6000字指控华为盘古大模型系造假!华为否认大模型抄袭阿里
转载自公众号:清清君
今天我在逛知乎的时候,看到一个消息华为员工凌晨在Github上发布一篇文章《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗》。感慨良多,华为属于国内顶尖的一批科技公司了,如果是真的,那真的太痛心了。看Github上传时间大概7月6日凌晨5点,上传了这篇文章,Github链接:https://github.com/HW-whistleblower/True-Story-of-Pangu)。看着写的内容,这文笔太真实了,不像编的,是真的面儿大,作者首先列了些细节自证下了身份。
然后他对针对技术研发瓶颈、管理流程弊端及团队内部矛盾等困境进行了具体阐述。
根据他爆料内容,盘古大模型早期研发受限于硬件资源限制(如采用自研 NPU 替代英伟达 GPU 架构),叠加 tokenizer 模块处理效能不足,导致模型训练精度与迭代速度未达预期指标。尽管技术团队启动多轮算法优化方案,但部分核心模型项目因硬件兼容性问题与工程实现障碍被迫终止。其中最受关注的争议点在于:小模型实验室被指多次对外部开源模型(如阿里千问、DeepSeek 等)进行参数优化后,通过接口层重构的方式包装为自研成果,此类 "快速迭代" 模式反而获得管理层认可;而坚持全链路自主研发的团队则面临算力配额倾斜问题,135B V3 模型的研发进程曾因资源调配失衡多次陷入停滞。
作者进一步指出,华为内部存在繁琐的技术评审体系与复杂的政治生态,直接引发人才流失危机,算法专家及硬件架构师陆续加盟字节跳动、腾讯等企业。尽管团队成功产出全自研的 135B V3 模型并在中文语义理解领域取得技术突破,但整体创新环境被指存在 "流程僵化" 与 "成果分配不公" 问题。文末作者表示,虽对当前状况感到失望,但仍希望公司能够重视技术创新生态建设,完善人才保留机制。
最后引用作者写的几句话:
“曾几何时,我为我们用着小米加步枪打败洋枪洋炮而自豪。
现在,我累了,我想投降。
如果我消失了,就当是我为了真理和理想,为了华为乃至中国能够更好地发展算力和AI而牺牲了吧,我愿埋葬于那片曾经奋斗过的地方。”
原文全文:
最终结果请以官方发布的为准,此文发表仅代表个人观点,如有侵权,请联系我删除此文。
对华为的盘古大模型有用的知识多了解一下:
盘古是华为开发的人工智能模型,2020年11月立项、2021年4月正式对外发布。今年6月,华为正式发布盘古大模型5.5,实现自然语言理解、计算机视觉、预测、多模态、科学计算基础模型的全面升级。其中在自然语言大模型方面,华为推出完全由国产算力训练而成的7180亿参数深度思考模型,标志着我国已具备用国产算力训练世界一流大模型的能力。华为公司相关负责人表示,此次开源部分盘古模型,是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。华为诚邀全球开发者、企业伙伴及研究人员下载使用,反馈使用意见,共同完善。在模型架构上,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。此外,他们还提出了EP loss 负载优化方法,这一设计不仅保证了各个专家之间的能保持较好的负载均衡,也提升了专家的领域特化能力。同时,盘古Ultra MoE使用了业界先进的MLA和MTP架构,在预训练和后训练阶段都使用了Dropless训练策略,实现了超大规模MoE架构在模型效果与效率之间的最佳平衡。
当硅谷的AI精英们还在为GPT-4的表现沾沾自喜时,一场来自东方的量子级突破悄然改写了全球AI版图。这不是科幻电影。而是正在华为深圳总部上演的真实逆袭。
六天前的发布会现场,华为常务董事张平安宣布的那一刻,整个会场陷入了窒息般的寂静。盘古大模型5.5。7180亿参数的Ultra MoE深度思考模型。完全基于国产昇腾算力训练。
这三个关键词组合在一起,意味着什么?
意味着我们不仅追上了,我们已经开始领跑。更令西方科技界感到不安的是,这仅仅是开始。华为同时宣布的开源策略,彻底打破了美国在AI大模型领域的技术封锁。盘古70亿参数稠密模型和720亿参数混合专家模型全面开源。免费。向全世界开放。
华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”
今天我在逛知乎的时候,看到一个消息华为员工凌晨在Github上发布一篇文章《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗》。感慨良多,华为属于国内顶尖的一批科技公司了,如果是真的,那真的太痛心了。看Github上传时间大概7月6日凌晨5点,上传了这篇文章,Github链接:https://github.com/HW-whistleblower/True-Story-of-Pangu)。看着写的内容,这文笔太真实了,不像编的,是真的面儿大,作者首先列了些细节自证下了身份。
然后他对针对技术研发瓶颈、管理流程弊端及团队内部矛盾等困境进行了具体阐述。
根据他爆料内容,盘古大模型早期研发受限于硬件资源限制(如采用自研 NPU 替代英伟达 GPU 架构),叠加 tokenizer 模块处理效能不足,导致模型训练精度与迭代速度未达预期指标。尽管技术团队启动多轮算法优化方案,但部分核心模型项目因硬件兼容性问题与工程实现障碍被迫终止。其中最受关注的争议点在于:小模型实验室被指多次对外部开源模型(如阿里千问、DeepSeek 等)进行参数优化后,通过接口层重构的方式包装为自研成果,此类 "快速迭代" 模式反而获得管理层认可;而坚持全链路自主研发的团队则面临算力配额倾斜问题,135B V3 模型的研发进程曾因资源调配失衡多次陷入停滞。
作者进一步指出,华为内部存在繁琐的技术评审体系与复杂的政治生态,直接引发人才流失危机,算法专家及硬件架构师陆续加盟字节跳动、腾讯等企业。尽管团队成功产出全自研的 135B V3 模型并在中文语义理解领域取得技术突破,但整体创新环境被指存在 "流程僵化" 与 "成果分配不公" 问题。文末作者表示,虽对当前状况感到失望,但仍希望公司能够重视技术创新生态建设,完善人才保留机制。
最后引用作者写的几句话:
“曾几何时,我为我们用着小米加步枪打败洋枪洋炮而自豪。
现在,我累了,我想投降。
如果我消失了,就当是我为了真理和理想,为了华为乃至中国能够更好地发展算力和AI而牺牲了吧,我愿埋葬于那片曾经奋斗过的地方。”
原文全文:
最终结果请以官方发布的为准,此文发表仅代表个人观点,如有侵权,请联系我删除此文。
对华为的盘古大模型有用的知识多了解一下:
盘古是华为开发的人工智能模型,2020年11月立项、2021年4月正式对外发布。今年6月,华为正式发布盘古大模型5.5,实现自然语言理解、计算机视觉、预测、多模态、科学计算基础模型的全面升级。其中在自然语言大模型方面,华为推出完全由国产算力训练而成的7180亿参数深度思考模型,标志着我国已具备用国产算力训练世界一流大模型的能力。华为公司相关负责人表示,此次开源部分盘古模型,是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。华为诚邀全球开发者、企业伙伴及研究人员下载使用,反馈使用意见,共同完善。在模型架构上,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。此外,他们还提出了EP loss 负载优化方法,这一设计不仅保证了各个专家之间的能保持较好的负载均衡,也提升了专家的领域特化能力。同时,盘古Ultra MoE使用了业界先进的MLA和MTP架构,在预训练和后训练阶段都使用了Dropless训练策略,实现了超大规模MoE架构在模型效果与效率之间的最佳平衡。
当硅谷的AI精英们还在为GPT-4的表现沾沾自喜时,一场来自东方的量子级突破悄然改写了全球AI版图。这不是科幻电影。而是正在华为深圳总部上演的真实逆袭。
六天前的发布会现场,华为常务董事张平安宣布的那一刻,整个会场陷入了窒息般的寂静。盘古大模型5.5。7180亿参数的Ultra MoE深度思考模型。完全基于国产昇腾算力训练。
这三个关键词组合在一起,意味着什么?
意味着我们不仅追上了,我们已经开始领跑。更令西方科技界感到不安的是,这仅仅是开始。华为同时宣布的开源策略,彻底打破了美国在AI大模型领域的技术封锁。盘古70亿参数稠密模型和720亿参数混合专家模型全面开源。免费。向全世界开放。
华为诺亚方舟实验室7月5日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。”
评论
猜您喜欢

华为匿名员工6000字指控华为盘古大模型系造假!华为否认大模型抄袭阿里
2025-07-07

员工曝罗马仕已通知全面停工停产,工资只发到6月份
2025-07-04

我是何小鹏,能让小鹏涅槃重生的小“鹏”
2025-07-04

新房“6连涨” 二手房持续探底!上半年房价分化背后 市场信心再受考验
2025-07-03

小米YU7投诉量炸了!雷军优雅装死,车主:把消费者当堆数据的工具
2025-07-04

独家:新长安集团总部落户重庆 朱华荣将任正局级新央企一把手
2025-07-08

王凤英的供应链魔术太震撼 何小鹏松口“盈利无悬念”
2025-07-05

领克10 EM-P将于8月开启预售 20万级唯一标配四驱+激光雷达
2025-07-04
联系我们
添加财经导师微信,邀您加入财经讨论群,随时交流财经知识。