ICLR 2026 | LightMem£º°Ñ´óÄ£×Ó¡¸ºã¾ÃÓ°Ï󡹵ı¾Ç®´òÏÂÀ´
2026-03-01 01:25:08

´óÄ£×ÓÒѾ­ºÜÇ¿£¬ £¬£¬£¬£¬£¬£¬µ«Ò»µ©½øÈë ¡°³¤¶Ô»°¡¢¿ç¶àÂÖ¡¢¶àʹÃü¡± µÄÕæÊµÖÇÄÜÌå½»»¥³¡¾°£¬ £¬£¬£¬£¬£¬£¬Ä£×Ӻܿì¾Í»áÓöµ½Á½ÀàÀÏÎÊÌ⣺

Ò»ÊÇÉÏÏÂÎÄ´°¿ÚÓÐÏÞ£¬ £¬£¬£¬£¬£¬£¬Ô½ÁÄÔ½³¤Ê±²»¿É×èÖ¹µØ ¡°Èû²»Ï¡±£»£»£»£»£» £» £»¶þÊǾ­µäµÄ lost in the middle£¬ £¬£¬£¬£¬£¬£¬×ÝÈ»ÈûµÃÏÂҲδ±ØÓõúᣠ¡£¡£ ¡£¡£¡£

ÓÚÊÇ£¬ £¬£¬£¬£¬£¬£¬¸ø´óÄ£×ÓÅä ¡°ÍⲿӰÏóϵͳ¡± ÓÈΪÖ÷Òª£º°Ñ¶Ô»°Ð´½øºã¾ÃÓ°Ïó¡¢ÐèҪʱÔÙ¼ìË÷³öÀ´¡£ ¡£¡£ ¡£¡£¡£µ«ÏÖʵºÜ¿ì¸ø³öÁ˼ÛÇ® ¡ª¡ª Ó°ÏóϵͳÍùÍùºÜÊÇ¹ó£ºÆµÈÔŲÓôóÄ£×Ó×ö×ܽá / ³éÈ¡¡¢ÊµÊ±×ö³åÍ»Ïû½âÓë¸üС¢³¤Á´Â·µÄά»¤¿ªÏú£¬ £¬£¬£¬£¬£¬£¬×îÖÕÈà ¡°ÓÐÓ°ÏóµÄÖÇÄÜÌ塱 ÔÚ¹¤³ÌÉÏÄÑÒÔÔâÊÜ¡£ ¡£¡£ ¡£¡£¡£

ÕâÆªÊÂÇéÌá³ö LightMem£ºÒ»¸öÔÚ ¡°Ð§¹û¡± ºÍ ¡°Ð§ÂÊ¡± Ö®¼ä¸üƽºâµÄÓ°Ïóϵͳ¡£ ¡£¡£ ¡£¡£¡£½¹µãÄ¿µÄºÜÖ±½Ó£º

ÔÚ²»ÎþÉü׼ȷÂʵÄÌõ¼þÏ£¬ £¬£¬£¬£¬£¬£¬°Ñ token¡¢API ŲÓôÎÊýºÍÔËÐÐʱÑÓ½µÏÂÀ´¡£ ¡£¡£ ¡£¡£¡£

ÂÛÎÄÎÊÌ⣺LightMem: Lightweight and Efficient Memory-Augmented GenerationÂÛÎÄÁ´½Ó£ºhttps://arxiv.org/abs/2510.18866´úÂëÁ´½Ó£ºhttps://github.com/zjunlp/LightMem

ΪʲôÏÖÓÐÓ°Ïóϵͳ ¡°ÄÜÓõ«Ì«¹ó¡±£¿£¿£¿£¿£¿

´ÓÖ÷Á÷·¶Ê½À´¿´£¬ £¬£¬£¬£¬£¬£¬LLM Ó°Ïóϵͳ´ó¶àÊÇÕâÑùÊÂÇéµÄ£º°Ñԭʼ¶Ô»°°´ turn/session Çз֣»£»£»£»£» £» £»Ã¿Ò»¶Î¶¼Èà LLM ×ö×ܽá / ³éÈ¡£ ¡£¡£ ¡£¡£¡£¬ £¬£¬£¬£¬£¬£¬Ð´ÈëÏòÁ¿¿â / ֪ʶͼÆ×£»£»£»£»£» £» £»ÐÂÐÅÏ¢µ½À´Ê±£¬ £¬£¬£¬£¬£¬£¬ÔÙÈà LLM ÔÚÏß×ö¸üР(add/delete/merge/ignore)£»£»£»£»£» £» £»ÍÆÀíʱ¼ìË÷Ïà¹ØÓ°ÏóÆ´µ½ prompt Àï»Ø¸²¡£ ¡£¡£ ¡£¡£¡£

ÎÊÌâÔÚÓÚ£¬ £¬£¬£¬£¬£¬£¬²»¹ÜÊÇ user ²àÕÕ¾É assistant ²à£¬ £¬£¬£¬£¬£¬£¬ÕæÊµ¶Ô»°³¡¾°Öк¬ÓкÜÊǶàµÄÈßÓàÐÅÏ¢£ºÍâ½»¡¢Öظ´È·ÈÏ¡¢ÈßÓàÚ¹Ê͵ȵȡ£ ¡£¡£ ¡£¡£¡£ÏÖÓÐϵͳÍùÍù ÕÕµ¥È«ÊÕ£¬ £¬£¬£¬£¬£¬£¬µ¼Ö£º

1) ÈßÓàÐÅÏ¢Ö±½Ó½øÈë¹ÜÏߣºtoken ÏûºÄì­Éý£¬ £¬£¬£¬£¬£¬£¬²¢ÇÒ¿ÉÄÜ·´¶ø×ÌÈÅ in-context learning£»£»£»£»£» £» £»

2) ÇзÖÁ£¶È½©Ó²£º°´ turn ̫ϸ»áµ¼ÖÂ×ܽáŲÓñ¬Õ¨£¬ £¬£¬£¬£¬£¬£¬°´ session Ì«´ÖÓÖÈÝÒ×Ö÷Ìâ»ìÔÓ£¬ £¬£¬£¬£¬£¬£¬×îºó×ܽá½û¾ø£»£»£»£»£» £» £»

3) ÔÚÏ߸üÐÂÌ«ÖØ£º¸üÐÂÓëÒÅÍüÔÚ test time Ç¿°ó¶¨£¬ £¬£¬£¬£¬£¬£¬³¤Ê¹ÃüÑӳٸߣ¬ £¬£¬£¬£¬£¬£¬²¢ÇÒ LLM »¹¿ÉÄÜÔÚ¸üÐÂʱ ¡°Îóɾ¡± ÐÅÏ¢¡£ ¡£¡£ ¡£¡£¡£

LightMem µÄÆðµãÊÇ£ºÈËÀàÓ°Ïó²¢²»ÊÇ ¡°ËùÓÐÐÅÏ¢¶¼½øºã¾ÃÓ°Ïó¡±£¬ £¬£¬£¬£¬£¬£¬¶øÊÇÓÐÒ»Ì׸ßЧµÄ·Ö²ã»úÖÆ£º

¸Ð¹ÙÓ°ÏóÏȹýÂË ¡ú ¶ÌʱӰÏó×éÖ¯ÕûºÏ ¡ú ³¤Ê±Ó°ÏóÔÚ˯ÃßʱÀëÏßÀο¿¡£ ¡£¡£ ¡£¡£¡£

LightMem µÄ½¹µã˼Ð÷£ºÈý¶Îʽ ¡°ÀàÈËÓ°Ïó¡± ¹ÜÏß

LightMem °ÑÓ°Ïóϵͳ²ð³ÉÈý¸öÇáÁ¿Ä£¿£¿£¿£¿£¿é (¶ÔÓ¦ÈçÏ嵀 Light1/Light2/Light3)£º

Light1£º¸Ð¹ÙÓ°Ïó (Sensory Memory)

Ä¿µÄ£º¿ìËÙ¹ýÂËÎÞÓÃÐÅÏ¢¡¢°ÑÊäÈëѹËõµ½ ¡°ÖµµÃ¼Ç¡± µÄ²¿·Ö£¬ £¬£¬£¬£¬£¬£¬²¢¾ÙÐÐÖ÷ÌâÇз֡£ ¡£¡£ ¡£¡£¡£

Light2£º¶ÌʱӰÏó (Short-Term Memory, STM)

Ä¿µÄ£º°´Ö÷Ìâ°Ñ¶Ô»°×éÖ¯³É½á¹¹»¯µ¥Î»£¬ £¬£¬£¬£¬£¬£¬½µµÍ×ܽáŲÓôÎÊý£¬ £¬£¬£¬£¬£¬£¬Í¬Ê±ïÔÌ­Ö÷Ìâ»ìÔÓ¡£ ¡£¡£ ¡£¡£¡£

Light3£º³¤Ê±Ó°Ïó (Long-Term Memory, LTM)+ ˯Ã߸üР(Sleep-time Update)

Ä¿µÄ£º°ÑÌÚ¹óµÄÓ°Ïó¸üдÓÔÚÏßÍÆÀíÖÐ ¡°ÄóöÀ´¡±£¬ £¬£¬£¬£¬£¬£¬ÔÚÀëÏß²¢ÐеØ×öÈ¥ÖØ¡¢ºÏ²¢¡¢ÐÞ¸´ÓëÀο¿¡£ ¡£¡£ ¡£¡£¡£

Light1£º¸Ð¹ÙÓ°Ïó ¡ª¡ª ÏÈѹËõ£¬ £¬£¬£¬£¬£¬£¬ÔÙÇÐÖ÷Ìâ

ÇáÁ¿Ñ¹Ëõ£º°ÑÈßÓà token ÔÚϵͳÊäÈë¶Ë¹ýÂ˵ô

LightMem ʹÓÃÒ»¸öÇáÁ¿Ñ¹ËõÄ£×Ó (ÂÛÎÄĬÈϽÓÄÉ LLMLingua-2) ¶ÔԭʼÊäÈë×öԤѹËõ£º

±£´æÐÅÏ¢Á¿¸ü¸ß¡¢ÓïÒå¸üÒªº¦µÄ token£¬ £¬£¬£¬£¬£¬£¬°Ñ´ó×ÚÈßÓà token Ìáǰ¹ýÂ˵ô²¢µ²ÔÚ pipeline Ö®Íâ¡£ ¡£¡£ ¡£¡£¡£

ÂÛÎÄʵÑéÒ²ÑéÖ¤£ºÔÚºÏÀíѹËõÂÊÏ (50% µ½ 80%)£¬ £¬£¬£¬£¬£¬£¬LLM ÒÀÈ»ÄÜÃ÷ȷѹËõºóµÄÉÏÏÂÎÄ£¬ £¬£¬£¬£¬£¬£¬×¼È·ÂÊ»ù±¾²»ÊÜÓ°Ïì¡£ ¡£¡£ ¡£¡£¡£

»ìÏýÖ÷ÌâÇз֣º×èÖ¹ ¡°°´´°¿ÚÇС± µÄ´Ö±©×ö·¨

½ö¿¿Àο¿´°¿Ú (turn/session) ºÜÄÑÊÊÅ俪·Å¶Ô»°¡£ ¡£¡£ ¡£¡£¡£LightMem ×öÁËÒ»¸ö»ìÏýÇзÖÕ½ÂÔ£º

ÓÃ×¢ÖØÁ¦ÐźÅÕÒµ½ºòÑ¡ topic ½çÏß (¾Ö²¿·åÖµ)£»£»£»£»£» £» £»ÔÙÓÃÏàÁÚÆ¬¶ÏµÄÓïÒåÏàËÆ¶È×ö¶þ´ÎÈ·ÈÏ£»£»£»£»£» £» £»È¡¶þÕß½»¼¯×÷Ϊ×îÖÕÇзֵ㣬 £¬£¬£¬£¬£¬£¬½µµÍ attention sink¡¢×¢ÖØÁ¦Ï¡Ê͵ÈÔëÉùÓ°Ïì¡£ ¡£¡£ ¡£¡£¡£

Light2£ºÖ÷Ìâ¸ÐÖª STM¡ª¡ª Óà ¡°ÄÚÈݽçÏß¡± Ìæ»» ¡°´°¿Ú½çÏß¡±

ÔÚÄõ½ topic segments ºó£¬ £¬£¬£¬£¬£¬£¬LightMem °ÑËüÃÇÒÔ {topic, turns} µÄ½á¹¹ËÍÈë STM buffer¡£ ¡£¡£ ¡£¡£¡£

µ± buffer µÖ´ï token ãÐֵʱ£¬ £¬£¬£¬£¬£¬£¬²Å´¥·¢Ò»´Î LLM ×ܽᣬ £¬£¬£¬£¬£¬£¬¶Ôÿ¸ö topic ÌìÉú¸ü½á¹¹»¯µÄ summary£¬ £¬£¬£¬£¬£¬£¬²¢Ð´Èë LTM¡£ ¡£¡£ ¡£¡£¡£

Ïà±È ¡°Ã¿Ò»ÂÖ¶¼×ܽáÒ»´Î¡±£¬ £¬£¬£¬£¬£¬£¬ÕâÖÖ×ö·¨Ö±½Ó´øÀ´Á½µãÊÕÒæ£º

ŲÓôÎÊý½µµÍ£º×ܽ᲻ÔÙÊÇ N ´Î£¬ £¬£¬£¬£¬£¬£¬¶øÊǰ´ buffer ´¥·¢µÄ¸üÉÙ´ÎÊý£»£»£»£»£» £» £»×ܽá¸ü׼ȷ£ºÊäÈë±» topic Ô¼Êø£¬ £¬£¬£¬£¬£¬£¬½ûÖ¹Ò× ¡°°Ñ A Ö÷ÌâµÄϸ½Ú×Ü½á½ø B Ö÷ÌâÀ¡£ ¡£¡£ ¡£¡£¡£

ÂÛÎĵÄÏûÈÚʵÑéÒ²ÏÔʾ£ºÈ¥µô topic segmentation »á´øÀ´ÏÔ×Å׼ȷÂÊϽµ (GPT/Qwen ¶¼Ò»ÖÂ)¡£ ¡£¡£ ¡£¡£¡£

Light3£ºË¯Ã߸üР¡ª¡ª °Ñ¿ªÏú×î¸ßµÄ²¿·Ö´ÓÔÚÏßÍÆÀíÖаþÀë

Ó°Ïóϵͳ×î¹ó¡¢Ò²×îÈÝÒ×ÍÉ»¯µÄÒ»²½£¬ £¬£¬£¬£¬£¬£¬ÍùÍùÊÇ ¡°¸üР/ ÒÅÍü¡±¡£ ¡£¡£ ¡£¡£¡£

ÏÖÓÐϵͳ¾­³£ÔÚ test time ×ö hard update£ººÏ²¢¡¢É¾¸Ä¡¢³åÍ»Ïû½â¶¼ÔÚÏßÖ´ÐУ¬ £¬£¬£¬£¬£¬£¬ÑÓ³Ù¸ßÇÒΣº¦´ó¡£ ¡£¡£ ¡£¡£¡£

LightMem µÄÕ½ÂÔÊÇ ¡°Á½¶Îʽ¸üС±£º

ÔÚÏßÖ»×ö Soft Update£ºÏÈдÈ룬 £¬£¬£¬£¬£¬£¬²»¾À½á

²âÊÔʱÐÂÓ°ÏóÌõÄ¿µ½À´£¬ £¬£¬£¬£¬£¬£¬LightMem Ö±½Ó²åÈë LTM (´øÊ±¼ä´Á)£¬ £¬£¬£¬£¬£¬£¬²»×öÖØ´ó¸üС£ ¡£¡£ ¡£¡£¡£

Õ⼫´ó½µµÍÁËÔÚÏßÑÓ³Ù£¬ £¬£¬£¬£¬£¬£¬²¢×èÖ¹ LLM ÔÚʵʱ¸üÐÂÖÐÎóÅгåÍ»µ¼ÖÂÐÅϢɥʧ¡£ ¡£¡£ ¡£¡£¡£

ÀëÏß×ö Parallel Update£ºÃ¿ÌõÓ°Ïóά»¤ ¡°¿É¸üÐÂÐÐÁС±

ÀëÏß½×¶Î (sleep time) ´¥·¢¸üУº

¶Ôÿ¸öÌõÄ¿¹¹½¨Ò»¸ö update queue (Ö»ÔÊÐí ¡°Ðµĸüоɵġ±£¬ £¬£¬£¬£¬£¬£¬¼´Ê±¼ä´ÁÔ¼Êø tj ¡Ý ti)£¬ £¬£¬£¬£¬£¬£¬È»ºó°ÑÕâЩ¸üвÙ×÷²¢ÐÐÖ´ÐС£ ¡£¡£ ¡£¡£¡£

²¢Ðл¯µÄÒªº¦ÀûÒæÊÇ£º

¹Å°åÔÚÏ߸üб£´æË³ÐòÒÀÀµ (¶ÁÐ´Ô¼Êø) µ¼Ö´®ÐÐÀÛ¼ÆÑÓ³Ù£»£»£»£»£» £» £»¶ø LightMem °Ñ¸üвð³É¶à¸ö×ÔÁ¦ÐÐÁУ¬ £¬£¬£¬£¬£¬£¬¿ÉÒÔÀëÏß²¢ÐУ¬ £¬£¬£¬£¬£¬£¬ÕûÌå¸ü¿ì¡£ ¡£¡£ ¡£¡£¡£

Ч¹û£º²»µ«¸ü×¼£¬ £¬£¬£¬£¬£¬£¬²¢ÇÒ×ÔÖÆÐí¶à

ÂÛÎÄÔÚÁ½¸ö³¤Ó°Ïó»ù×¼ÉÏÑéÖ¤ÁË LightMem µÄЧ¹ûÓëЧÂÊ£º

LongMemEval (LongMemEval-S)LoCoMo

²¢ÔÚ²î±ð backbone ÉϲâÊÔ£ºGPT-4o-mini ¡¢ Qwen3-30B-A3B¡¢GLM4.6¡£ ¡£¡£ ¡£¡£¡£

ÕûÌå½áÂÛºÜÊÇÇåÎú£ºLightMem ÔÚ׼ȷÂÊÉÏÁè¼Ý»ùÏߣ¬ £¬£¬£¬£¬£¬£¬Í¬Ê±°Ñ±¾Ç®´òÏÂÀ´¡£ ¡£¡£ ¡£¡£¡£

ÂÛÎı¨¸æµÄ´ú±íÐÔЧ¹û°üÀ¨£º

ÔÚ LongMemEval ÉÏ£¬ £¬£¬£¬£¬£¬£¬LightMem Ïà±ÈÇ¿»ùÏß׼ȷÂÊ×î¸ßÌáÉýÔ¼ 7.7% / 29.3% (²î±ðÉèÖÃÓë backbone)£»£»£»£»£» £» £»×Ü token ÏûºÄ½µµÍ×î¸ß¿É´ï 38¡Á / 20.9¡Á£¬ £¬£¬£¬£¬£¬£¬API ŲÓôÎÊý½µµÍ×î¸ß¿É´ï 30¡Á / 55.5¡Á£»£»£»£»£» £» £»ÈôÊÇÖ»¿´ÔÚÏß test-time ±¾Ç®£¬ £¬£¬£¬£¬£¬£¬½ÚÔ¼·ù¶È¸ü¿äÕÅ£ºtoken ×î¸ß 106¡Á / 117¡Á£¬ £¬£¬£¬£¬£¬£¬API ŲÓÃ×î¸ß 159¡Á / 310¡Á¡£ ¡£¡£ ¡£¡£¡£

LightMem ÊÇÒ»Ì×ÃæÏòÕæÊµ³¤½»»¥³¡¾°µÄ ¡°ÇáÁ¿Ó°Ïóϵͳ¡± ÃÕµ×£º

Ëü²»×·ÇóÈÃÓ°Ïó»úÖÆÔ½À´Ô½ÖØ´ó£¬ £¬£¬£¬£¬£¬£¬¶øÊÇÓøü¿¿½üÈËÀàÓ°Ïó·Ö¹¤µÄ·½·¨£¬ £¬£¬£¬£¬£¬£¬°ÑÈßÓ൲ÔÚÈë¿Ú£¬ £¬£¬£¬£¬£¬£¬°Ñά»¤·Åµ½ÀëÏߣ¬ £¬£¬£¬£¬£¬£¬°Ñ¼ÛÇ®¿ØÖÆÔڿɰ²ÅŵĹæÄ£ÄÚ¡£ ¡£¡£ ¡£¡£¡£

ÈôÊÇÄãÕýÔÚ×ö³¤¶Ô»°ÖúÊÖ¡¢ºã¾ÃÔÚÏß agent¡¢»òÕßÈκÎÐèÒª ¡°Ó°Ïóµ«ÓÖÅÂ¹ó¡± µÄϵͳ£¬ £¬£¬£¬£¬£¬£¬ÕâÆªÊÂÇéÖµµÃϸ¶Á¡£ ¡£¡£ ¡£¡£¡£

ÎÒÃǽ« LightMem µÄÒªÁìÂÛÓ빤³ÌÂÄÀú³Áµíµ½ OpenMem ÉçÇø £¬ £¬£¬£¬£¬£¬£¬Íƶ¯Ó°Ïó»úÖÆµÄ¿ª·Å¹²½¨ÓëÑݽø¡£ ¡£¡£ ¡£¡£¡£

OpenMem Ö¼ÔÚ¹²½¨Ò»¸ö AI Ó°Ïó¿ÆÑ§Ì½Ë÷Ó빤ҵʵ¼ùµÄÈ«ÇòЭ×÷ÉçÇø£¬ £¬£¬£¬£¬£¬£¬ÈÃÓ°Ïó³ÉΪ AI µÄРcomputer layer£¬ £¬£¬£¬£¬£¬£¬Ôö½ø Memory Engineering ¿ªÔ´¿ª·Å£¬ £¬£¬£¬£¬£¬£¬³ÉΪ ¡°Ó°ÏóÑо¿Õߵļҡ± Óë ¡°Ó°ÏóÊÖÒյıê×¼»¯»ùµØ¡±£¬ £¬£¬£¬£¬£¬£¬Ö§³ÖÆóÒµ¼¶Ñ§Êõ¼¶¿ª·¢Õß¼¶µÄÓ°ÏóÓ¦ÓÃÉú̬¡£ ¡£¡£ ¡£¡£¡£

×÷Õß¼ò½é

·½¼ÌÕ¹£¬ £¬£¬£¬£¬£¬£¬Õã½­´óѧÈ˹¤ÖÇÄÜ˶ʿºþÄÏÏæ½­¶¼»á½¨ÉèÓÐÏÞ¹«Ë¾ÔÚ¶Á£¬ £¬£¬£¬£¬£¬£¬Ê¦´ÓÕÅÄþÔ¥¸±½ÌÊÚ¡£ ¡£¡£ ¡£¡£¡£Ñо¿Æ«ÏòΪ Continual Learning¡¢LLM/Agent Memory Óë´óÄ£×Ó֪ʶ±à¼­£¬ £¬£¬£¬£¬£¬£¬¾Û½¹Ó°Ïóϵͳ¡¢×Ô½ø»¯ Agent ÓëÄ£×ӿɿظüС£ ¡£¡£ ¡£¡£¡£ÒÔµÚÒ»/¹²Ò»×÷ÕßÉí·ÝÔÚ ICLR¡¢ACL¡¢ACM MMµÈ¹ú¼Ê¶¥¼¶¾Û»á½ÒÏþ/ÎüÊÕ¶àÆªÂÛÎÄ¡£ ¡£¡£ ¡£¡£¡£Ìá³ö²¢¿ªÔ´ÃæÏò Agent µÄÇáÁ¿»¯ºã¾ÃÓ°Ïó¿ò¼Ü LightMem£¬ £¬£¬£¬£¬£¬£¬»ñµÃ½Ï¸ßÉçÇø¹Ø×¢£¨GitHub 600+ Star£©£¬ £¬£¬£¬£¬£¬£¬Êܵ½MIT technology reviewÔ¼Çëר·Ã£¬ £¬£¬£¬£¬£¬£¬²¢ÊÕµ½º£ÄÚ¶à¼ÒͶ×Ê»ú¹¹/´óÄ£×Ó³§É̵Ĵ´Òµ½»Á÷Ô¼Çë¡£ ¡£¡£ ¡£¡£¡£