20250713-无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

原文摘要

H-Net正在改写语言模型范式。

原文链接

进一步信息揣测

H-Net的核心突破：通过动态分块机制替代传统tokenization，实现了模型内部自动识别和操作数据单元的能力，这可能是首个在同等计算资源下超越基于tokenizer的语言模型的端到端方案。
性能优势：单层字节级分层的H-Net已优于BPE token的Transformer模型，多级分层迭代后性能可媲美两倍规模的token-based模型，暗示其潜在的数据规模效应优势。
行业趋势信号：X平台知名博主Rohan Paul的评论“Tokenizer正在退场”可能反映内部圈子对无tokenizer技术的乐观预期，此类观点通常源于未公开的早期实验或行业交流。
技术痛点解决：传统tokenization在中文、代码、DNA序列等复杂语言处理中性能下降的问题被针对性突破，H-Net的字符级鲁棒性提升可能成为其商业化落地的关键卖点。
未明说的计算效率：动态分块机制能与模型其他部分联合学习，暗示其训练成本可能低于“tokenizer+LM”的分离式流程，但论文未直接对比训练资源消耗，需警惕隐藏的计算开销。
潜在应用场景：定性学习“有意义的单元”（原文截断部分）可能指向医疗、金融等专业领域，这些领域通常需要付费定制tokenizer，H-Net的端到端特性或威胁现有商业化tokenization服务。
竞争壁垒：研究团队包含Mamba作者Albert Gu和Cartesia AI（语音AI初创公司），结合动态分块与状态空间模型的技术路线可能已形成专利护城河，需关注后续知识产权动态。
风险提示：尽管宣称“端到端”，但多级分层迭代可能引入新的超参数调优复杂度，行业内部人士可能仍在评估其工程化难度。