EverOS 在 LoCoMo 上达到 SOTA 性能

EverOS 是一款智能记忆操作系统，旨在赋予 AI 不仅能够记住，还能够理解、推理和进化的能力。在 LoCoMo 基准测试中，我们基于 EverOS 构建的方法取得了 92.3% 的推理准确率（由 LLM-Judge 评估），在我们的内部评估中优于可比方法。

EverMind研究人员

2025年9月30日

大约需要 3 分钟阅读

SOTA、LoCoMo、长期记忆

大多数现有 AI 系统都存在上下文遗忘的问题——它们可以完美处理一段对话，却无法将其与之前的内容联系起来。随着 AI 从短期助手转变为长期协作者，这种失忆限制了它形成真正理解和连续性的能力。我们创建 EverOS 的动机简单而又雄心勃勃：将 AI 记忆从被动的数据存储转变为主动的认知层——它能够捕捉意义、维持连贯性，并建立对用户和任务的长期理解。我们相信，真正的智能需要有目的地记忆，并以洞察力采取行动。

从核心上看，EverOS 融合了分层记忆提取、结构化知识组织和自适应检索机制，使 AI 能够从零散的交互中构建叙事，并基于累积的理解做出推理决策。这些设计原则汇聚为我们所称的“独特优势”——这是让 EverOS 不仅仅是一个记忆系统，而是一个前瞻系统的基础。我们的独特优势体现在三个关键维度上，它们重新定义了 AI 如何通过记忆来感知、连接并成长。

连贯叙事
超越碎片，连接故事。EverOS 自动关联对话片段，形成清晰的主题上下文，使 AI 能真正理解。它能够自然地区分诸如“项目 A 进展讨论”和“团队 B 战略规划”之类的线索，并在每个主题内保持连贯的逻辑。从零散的语句到完整的叙事，AI 不再只是“理解一句话”——而是“理解整个故事”。
基于证据的感知
超越检索，走向智能感知。EverOS 主动捕捉记忆与任务之间的深层关系，让 AI 在关键时刻能够“深思熟虑”。例如，当用户请求饮食建议时，系统会回忆起“你两天前做过牙科手术”，并据此调整建议。这就是上下文感知——建立在理解之上的智能，而不是孤立响应。
动态成长的用户画像
超越记录，走向动态成长。EverOS 持续实时更新用户画像，从每一次交互中学习，以更真实地了解用户。随着时间推移，偏好、语气和关注点会自然演变。系统不仅仅是“记住你说过什么”，它还在主动“学习你是谁”。

基于 EverOS 框架和 GPT-4.1-mini 模型，我们在 LoCoMo 数据集上评估了长上下文记忆推理性能。根据 LLM-Judge 的评估，我们的方法达到了 92.3% 的推理准确率，优于可比方法。详细的实验结果见下表。

连贯叙事
超越碎片，连接故事。EverOS 自动关联对话片段，形成清晰的主题上下文，使 AI 能真正理解。它能够自然地区分诸如“项目 A 进展讨论”和“团队 B 战略规划”之类的线索，并在每个主题内保持连贯的逻辑。从零散的语句到完整的叙事，AI 不再只是“理解一句话”——而是“理解整个故事”。
基于证据的感知
超越检索，走向智能感知。EverOS 主动捕捉记忆与任务之间的深层关系，让 AI 在关键时刻能够“深思熟虑”。例如，当用户请求饮食建议时，系统会回忆起“你两天前做过牙科手术”，并据此调整建议。这就是上下文感知——建立在理解之上的智能，而不是孤立响应。
动态成长的用户画像
超越记录，走向动态成长。EverOS 持续实时更新用户画像，从每一次交互中学习，以更真实地了解用户。随着时间推移，偏好、语气和关注点会自然演变。系统不仅仅是“记住你说过什么”，它还在主动“学习你是谁”。