据报道,
核心焦点:贵到“说不起话”的 Mythos
天价资费: 输入与输出价格分别为25美元和125美元。作为对比,
门槛极高: 由于能力过强且成本极高,该模型目前尚未对普通用户开放。甚至有 Reddit 网友吐槽,即便是在普通的 Skill 加持下,发送一句“你好”都可能耗掉月度 Token 额度的13%。
极客自救:走红的“山顶洞人”节省法
面对堪比金价的 Token,开发者们开始研究极致的“省钱技巧”。其中,名为
核心逻辑: 强制要求 AI 停止一切客套话(如“很高兴为您服务”)、去除冠词、避免模棱两可的废话,只保留核心技术术语。
惊人效果: 测试显示,这种“山顶洞人语”模式能节省约 65% 的 Token,且输出内容的准确性丝毫不受影响。
科学依据: 研究发现,强制模型简短回复不仅能省钱,反而能消除“过度思考”带来的负面干扰,使某些基准测试的准确率提高26%。
实操干货:10个 Token 节省小妙招
除了技术手段,普通用户也可以通过改变交互习惯来规避“Token 刺客”:
原位修改: 不符合预期时,点击“编辑”按钮修改原提示词,避免长对话产生的历史记录重复计费。
及时“断舍离”: 每15-20条消息开启一个新对话,防止上下文堆叠成为 Token 黑洞。
问题合并: 将多个指令集中在一条消息中发送,减少系统加载次数。
巧用项目空间: 将长文档上传至
按需降级: 语法检查等基础任务交给低成本的 Haiku 模型,把贵如金的额度留给
错峰使用: 避开太平洋时间早5点到11点的高峰期,利用平台的错峰福利。
结语:从“大手大脚”回归“字斟句酌”
从2000年按字算钱的短信息,到如今按 Token 计费的大模型,人类对沟通效率的追求兜兜转转回到了原点。在
