来源:pg模拟器网址 发布时间:2026-01-04 01:20:30
【1月1日DeepSeek发布新论文提出mHC架构,有望助力基座模型演进】1月1日,DeepSeek发布新论文,提出流形束缚超衔接新架构。该架构旨在处理超衔接网络(HC)技能因损坏恒等映射特性,导致练习不稳定和可扩展性受限等问题。mHC架构将HC残差衔接空间映射至特定流形康复恒等映射特性,结合基础设施优化保证功率。完成了明显功能改善和优胜可扩展性。DeepSeek估计,mHC作为HC的灵敏有用拓宽,将助力深化了解拓扑架构规划,为基座模型演进指明远景方向。论文由Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao一起担任榜首作者,梁文锋也在作者名单中。