MiniMax发长文回应“模型无法说出马嘉祺”

2026-07-15 17:38:17 休闲

5月9日，长文MiniMax官微发长文回应M2系列模型无法说出马嘉祺一事，模型马嘉提供了对“嘉祺识别”问题的无法完整排查过程和技术思考。

MiniMax表示，说出其从分词器版本对齐、长文embedding统计分布、模型马嘉语义近邻检索、无法预训练与后训练模型的说出few-shot对比实验、后训练数据频次统计以及对全词表lm_head变化幅度的长文排序扫描等多个维度进行了排查。最终定位到的模型马嘉原因是：“嘉祺”在分词器中被合并为一个独立token，但该token在后训练数据中出现频次极低，无法导致模型在后训练中逐渐遗忘了对该token的说出生成能力。

修复方案方面，长文MiniMax构造了一份覆盖全词表的模型马嘉合成数据，核心思想是无法：通过一个简单的复读任务，为全词表建立一个生成频率的“下限保障”，防止任何token因为完全缺失而退化。此外，MiniMax表示，将token覆盖度作为后训练数据质量的一项常规监控指标，可以在早期发现潜在的稀疏token退化风险，避免类似问题在线上复现。

MiniMax发长文回应“模型无法说出马嘉祺”

最近关注

青岛连云港路小学配套工程，正式开工建设！

第13万列中欧班列今天将从郑州发车

你用小拇指当手机支架吗？赶紧改正→

“房屋养老钱”成了“唐僧肉”

龙江人·暖心事 28年，236个“兵儿子”3个“兵女儿”

友情链接

敦化：林蛙产业助力乡村振兴蓬勃发展

央视曝光网红“减肥针”乱象：女子自行注射降糖药物半年暴瘦35公斤，引发酮症酸中毒；网红“减肥针”最初实为治疗糖尿病的降糖药物

"互联网优质内容创作活动月" 全上海最会做“播客”的人都来这里了

飞碟世界杯阿拉木图站中国队1银1铜收官

（体育）乒乓球——世乒赛女团决赛：中国队对阵日本队(3)

三星堆首次发现陨铁器

银川市2026年全国城市节约用水宣传周活动启动

韦布望远镜在早期宇宙中发现罕见无自转巨型星系

伊朗已回应美国提出的结束战争方案

中国广告协会批个别品牌母亲节低俗营销，应恪守行业营销正向导向