EverOS 在 LoCoMo 上达到 SOTA 性能
EverOS 在 LoCoMo 上达到 SOTA 性能
EverOS 是一款智能记忆操作系统,旨在赋予 AI 不仅能够记住,还能够理解、推理和进化的能力。在 LoCoMo 基准测试中,我们基于 EverOS 构建的方法取得了 92.3% 的推理准确率(由 LLM-Judge 评估),在我们的内部评估中优于可比方法。
EverMind研究人员
大约需要 3 分钟阅读

大多数现有 AI 系统都存在上下文遗忘的问题——它们可以完美处理一段对话,却无法将其与之前的内容联系起来。随着 AI 从短期助手转变为长期协作者,这种失忆限制了它形成真正理解和连续性的能力。我们创建 EverOS 的动机简单而又雄心勃勃:将 AI 记忆从被动的数据存储转变为主动的认知层——它能够捕捉意义、维持连贯性,并建立对用户和任务的长期理解。我们相信,真正的智能需要有目的地记忆,并以洞察力采取行动。
从核心上看,EverOS 融合了分层记忆提取、结构化知识组织和自适应检索机制,使 AI 能够从零散的交互中构建叙事,并基于累积的理解做出推理决策。这些设计原则汇聚为我们所称的“独特优势”——这是让 EverOS 不仅仅是一个记忆系统,而是一个前瞻系统的基础。我们的独特优势体现在三个关键维度上,它们重新定义了 AI 如何通过记忆来感知、连接并成长。
连贯叙事
超越碎片,连接故事。EverOS 自动关联对话片段,形成清晰的主题上下文,使 AI 能真正理解。它能够自然地区分诸如“项目 A 进展讨论”和“团队 B 战略规划”之类的线索,并在每个主题内保持连贯的逻辑。从零散的语句到完整的叙事,AI 不再只是“理解一句话”——而是“理解整个故事”。
基于证据的感知
超越检索,走向智能感知。EverOS 主动捕捉记忆与任务之间的深层关系,让 AI 在关键时刻能够“深思熟虑”。例如,当用户请求饮食建议时,系统会回忆起“你两天前做过牙科手术”,并据此调整建议。这就是上下文感知——建立在理解之上的智能,而不是孤立响应。
动态成长的用户画像
超越记录,走向动态成长。EverOS 持续实时更新用户画像,从每一次交互中学习,以更真实地了解用户。随着时间推移,偏好、语气和关注点会自然演变。系统不仅仅是“记住你说过什么”,它还在主动“学习你是谁”。
基于 EverOS 框架和 GPT-4.1-mini 模型,我们在 LoCoMo 数据集上评估了长上下文记忆推理性能。根据 LLM-Judge 的评估,我们的方法达到了 92.3% 的推理准确率,优于可比方法。详细的实验结果见下表。

大多数现有 AI 系统都存在上下文遗忘的问题——它们可以完美处理一段对话,却无法将其与之前的内容联系起来。随着 AI 从短期助手转变为长期协作者,这种失忆限制了它形成真正理解和连续性的能力。我们创建 EverOS 的动机简单而又雄心勃勃:将 AI 记忆从被动的数据存储转变为主动的认知层——它能够捕捉意义、维持连贯性,并建立对用户和任务的长期理解。我们相信,真正的智能需要有目的地记忆,并以洞察力采取行动。
从核心上看,EverOS 融合了分层记忆提取、结构化知识组织和自适应检索机制,使 AI 能够从零散的交互中构建叙事,并基于累积的理解做出推理决策。这些设计原则汇聚为我们所称的“独特优势”——这是让 EverOS 不仅仅是一个记忆系统,而是一个前瞻系统的基础。我们的独特优势体现在三个关键维度上,它们重新定义了 AI 如何通过记忆来感知、连接并成长。
连贯叙事
超越碎片,连接故事。EverOS 自动关联对话片段,形成清晰的主题上下文,使 AI 能真正理解。它能够自然地区分诸如“项目 A 进展讨论”和“团队 B 战略规划”之类的线索,并在每个主题内保持连贯的逻辑。从零散的语句到完整的叙事,AI 不再只是“理解一句话”——而是“理解整个故事”。
基于证据的感知
超越检索,走向智能感知。EverOS 主动捕捉记忆与任务之间的深层关系,让 AI 在关键时刻能够“深思熟虑”。例如,当用户请求饮食建议时,系统会回忆起“你两天前做过牙科手术”,并据此调整建议。这就是上下文感知——建立在理解之上的智能,而不是孤立响应。
动态成长的用户画像
超越记录,走向动态成长。EverOS 持续实时更新用户画像,从每一次交互中学习,以更真实地了解用户。随着时间推移,偏好、语气和关注点会自然演变。系统不仅仅是“记住你说过什么”,它还在主动“学习你是谁”。
基于 EverOS 框架和 GPT-4.1-mini 模型,我们在 LoCoMo 数据集上评估了长上下文记忆推理性能。根据 LLM-Judge 的评估,我们的方法达到了 92.3% 的推理准确率,优于可比方法。详细的实验结果见下表。

您可能还喜欢这些
相关

介绍 mRAG:EverOS 如何检索真正重要的信息
mRAG,多模态,多模态检索,RAG

介绍自我进化的智能体记忆:EverOS 如何帮助您的 AI 智能体从经验中学习
自我进化的智能体记忆、智能体记忆、自我进化、智能体技能、智能体案例

突破 1 亿 Token 限制:MSA 架构为 LLM 实现高效端到端长期记忆
长期记忆、RAG、上下文、AI 智能体、OpenClaw、稀疏注意力、Transformer、LLM、KV 缓存

EverOS:四项内存基准测试中的 SOTA 结果及其对 LLM 智能体的意义
EverOS、长期记忆、RAG、上下文、LoCoMo、LongMemEval、PersonaMem
EverOS 在 LoCoMo 上达到 SOTA 性能
EverOS 是一款智能记忆操作系统,旨在赋予 AI 不仅能够记住,还能够理解、推理和进化的能力。在 LoCoMo 基准测试中,我们基于 EverOS 构建的方法取得了 92.3% 的推理准确率(由 LLM-Judge 评估),在我们的内部评估中优于可比方法。
EverMind研究人员
大约需要 3 分钟阅读
