AdaResonerʵÏÖAgentic VisionµÄ×Ô¶¯¡¸ÊÓ¾õ¹¤¾ß˼Ë÷¡¹
2026-02-26 16:48:50

Äã¼û¹ý 7B Ä£×ÓÔÚÆ´Í¼ÍÆÀíÉϸɷ­ GPT-5 Â𣿠£¿£¿£¿£¿ £¿£¿

²»ÊÇ¿¿¶Ñ²ÎÊý£¬£¬£¬£¬£¬£¬£¬ £¬²»ÊÇ¿¿¸ü´óµÄÊý¾Ý£¬£¬£¬£¬£¬£¬£¬ £¬¶øÊÇ¿¿Ò»¼þÊ£ºÑ§»á¡¸Ê²Ã´Ê±¼ä¸ÃÓù¤¾ß¡¹ ¡£¡£¡£¡£¡£¡£¡£

´ó´ó¶¼¡¸¹¤¾ßÔöÇ¿¡¹Ä£×ÓÊÇÕâÑùµÄ£ºÓöµ½Ê¹Ãü X ¡ú ŲÓÃÀο¿¹¤¾ß Y ¡ú Æíµ»Ð§¹û׼ȷ ¡£¡£¡£¡£¡£¡£¡£Ò»µ©³¡¾°ÉÔ΢ת±ä£¬£¬£¬£¬£¬£¬£¬ £¬Ä£×Ó¾Í×îÏȳé·ç¡ª¡ª²»ÖªµÀʲô¹¤¾ß¸ÃÓá¢Ê²Ã´¹¤¾ß²»Ó¦Óà ¡£¡£¡£¡£¡£¡£¡£

AdaReasoner ½â¾öµÄÊǸüʵÖʵÄÎÊÌ⣺°Ñ what / when / how£¨ÓÃʲô¡¢ºÎʱÓá¢ÔõôÓ㩵±³ÉÍÆÀíÄÜÁ¦À´Ñ§ ¡£¡£¡£¡£¡£¡£¡£

ÂÛÎÄÎÊÌ⣺AdaReasoner: Dynamic Tool Orchestration for Iterative Visual ReasoningÂÛÎÄ£¨arXiv£©:https://arxiv.org/abs/2601.18631ÏîÄ¿Ö÷Ò³:https://adareasoner.github.io´úÂë:https://github.com/ssmisya/AdaReasonerÄ£×ÓÓëÊý¾Ý:https://huggingface.co/collections/hitsmy/adareasonerÊÓÆµ£¨YouTube£©:https://www.youtube.com/watch?v=_SOyD-lomOM

ÏÈ¿´ 10 ÃëЧ¹û£º

https://mp.weixin.qq.com/s/WH8kXeIsh97T7WjO0m2xRA?search_cli

AdaReasoner ÊÂÇéÁ÷³ÌʾÒâ

Google ½üÆÚÐû²¼£¬£¬£¬£¬£¬£¬£¬ £¬ÎªÆäÇáÁ¿¼¶Ä£×Ó Gemini 3 Flash ÒýÈëÒ»ÏîÃûΪ¡¸Agentic Vision¡¹£¨ÊðÀíÊÓ¾õ£©µÄÐÂÄÜÁ¦ ¡£¡£¡£¡£¡£¡£¡£

ÕâÏî¸üбê¼Ç×Ŷàģ̬ AI ´¦Öóͷ£Í¼ÏñµÄ·½·¨±¬·¢Á˸ùÌìÐÔת±ä£º´Ó¹Å°åµÄ¾²Ì¬Ê¶±ð£¬£¬£¬£¬£¬£¬£¬ £¬Éý¼¶Îª¾ß±¸¡¸Ë¼Ë÷¡¢Ðж¯¡¢ÊӲ졹ѭ»·µÄ×Ô¶¯ÊÓ²ìģʽ ¡£¡£¡£¡£¡£¡£¡£

ÔÚ´Ë֮ǰ£¬£¬£¬£¬£¬£¬£¬ £¬°üÀ¨ GPT ÔÚÄڵĴó´ó¶¼Ç°Ñضàģ̬ģ×Ó´¦Öóͷ£Í¼ÏñµÄ·½·¨ÀàËÆÓÚÈËÀàµÄ¡¸¼±åáһƳ¡¹£ºÄ£×ÓÎüÊÕͼÏñ£¬£¬£¬£¬£¬£¬£¬ £¬¾ÙÐÐÒ»´ÎÐÔ´¦Öóͷ£²¢Êä³öЧ¹û ¡£¡£¡£¡£¡£¡£¡£ÕâÖÖ·½·¨ÔÚÃæÁÙÐèÒªÏ꾡ÊÓ²ìµÄʹÃüʱ£¬£¬£¬£¬£¬£¬£¬ £¬ÍùÍù»áÓÉÓÚϸ½Úɥʧ¶ø±¬·¢»Ã¾õ»òÍÆ²â ¡£¡£¡£¡£¡£¡£¡£

Agentic Vision µÄÊÂÇé»úÖÆ£ºGemini 3 Flash ÏÖÔÚÄܹ»ÏñÈËÀàÊÓ²ìÔ±Ò»Ñùͨ¹ýÒÔÏÂÑ­»·¾ÙÐÐÍÆÀí£º

˼Ë÷£¨Think£©¡ª¡ªÆÊÎöÓû§Ö¸ÁîºÍͼÏñÆðÔ´ÄÚÈÝ£¬£¬£¬£¬£¬£¬£¬ £¬Öƶ©ÊÓ²ìÍýÏë ¡£¡£¡£¡£¡£¡£¡£Ðж¯£¨Act£©¡ª¡ª×Ô¶¯ÌìÉú²¢Ö´ÐÐ Python ´úÂëÀ´²Ù×÷ͼÏñ ¡£¡£¡£¡£¡£¡£¡£ÀýÈ磬£¬£¬£¬£¬£¬£¬ £¬¶ÔͼÏñ¾ÙÐÐËõ·Å¡¢²Ã¼ôÌØ¶¨ÇøÓò¡¢ÐýתÊӽǻò»æÖƸ¨ÖúÏß ¡£¡£¡£¡£¡£¡£¡£ÊӲ죨Observe£©¡ª¡ª¼ì²é´úÂëÖ´ÐкóµÄÐÂÊÓͼ»òÊý¾Ý£¬£¬£¬£¬£¬£¬£¬ £¬»ñÈ¡¸ü׼ȷµÄÊÓ¾õÖ¤¾Ý ¡£¡£¡£¡£¡£¡£¡£

ÉÏÊöÀú³Ì¿ÉÒÔ¶à´Îµü´ú£¬£¬£¬£¬£¬£¬£¬ £¬Ö±µ½Ä£×ÓÍøÂçµ½×ã¹»¼òÖ±ÔäÖ¤¾ÝÍù·µ¸²ÎÊÌâ ¡£¡£¡£¡£¡£¡£¡£

ÓÐÒâ˼µÄÊÇ£ºAdaReasoner Óë Agentic Vision Êâ;ͬ¹é ¡£¡£¡£¡£¡£¡£¡£AdaReasoner ͬÑùʵÏÖ²¢ÑéÖ¤ÁËÏÕЩÏàͬµÄ·¶Ê½£º

¹¤Òµ½çÓëѧÊõ½çͬʱѺע¡¸×Ô¶¯¹¤¾ßʹÓá¹£¬£¬£¬£¬£¬£¬£¬ £¬ËµÃ÷Õâ¸öÆ«ÏòÕýÔÚ³ÉΪ¶àÄ£Ì¬ÍÆÀíµÄÖ÷Á÷·¶Ê½ ¡£¡£¡£¡£¡£¡£¡£

AdaReasoner µÄÆæÒì¼ÛÖµÔÚÓÚ£ºÎÒÃDz»µ«ÊÇÑéÖ¤ÁËÕâÌ×·¶Ê½ÓÐÓ㬣¬£¬£¬£¬£¬£¬ £¬¸üÌá³öÁËÒ»Ì×ÉÁ¿ªÔ´Ð¡Ä£×ÓÒ²ÄÜϰµÃÕâÖÖÄÜÁ¦µÄѵÁ·ÒªÁ졪¡ªÕâÕýÊǽÓÏÂÀ´ÒªÏêϸÏÈÈݵÄÄÚÈÝ ¡£¡£¡£¡£¡£¡£¡£

01 Í´µã£º¶àÄ£Ì¬ÍÆÀíΪʲô

×ÜÊÇ¡¸¿´ÆðÀ´ºÜ»á£¬£¬£¬£¬£¬£¬£¬ £¬Ï¸½Ú¾Í×îÏȲ¡¹£¿ £¿£¿£¿£¿ £¿£¿

ÔÚ¶àÄ£Ì¬ÍÆÀíÀ£¬£¬£¬£¬£¬£¬ £¬¡¸¿´Çåϸ½Ú¡¹ºÍ¡¸¶à²½ÍÆÀí¡¹¾­³£» £»£»£»£Ï໥¿¨²±×Ó£º

¸ÐÖª²»·ó׼ȷ ¡ú Ö¤¾Ýȱ·¦ ¡ú ÍÆÀíÔÙÆ¯ÁÁÒ²ÈÝÒ×Äð³É¡¸guided guessing¡¹£» £»£»£»£»

·´¹ýÀ´£¬£¬£¬£¬£¬£¬£¬ £¬ÈôÊÇÄܰÑÒªº¦Ö¤¾ÝÓù¤¾ß²é³öÀ´¡¢»­³öÀ´¡¢ÑéÖ¤³öÀ´£¬£¬£¬£¬£¬£¬£¬ £¬Ä£×Ó¾ÍÄܰÑËãÁ¦ÓÃÔÚÅжÏÓëÍýÏëÉÏ ¡£¡£¡£¡£¡£¡£¡£

»»¾ä»°Ëµ£º¹¤¾ß²»ÊÇÍâ¹Ò£¬£¬£¬£¬£¬£¬£¬ £¬¶øÊǰÑÍÆÀí´Ó¡¸²Â¡¹À­»Ø¡¸²é¡¹µÄÒªº¦Â·¾¶ ¡£¡£¡£¡£¡£¡£¡£

02 Ò»¾ä»°ÏÈÈÝ AdaReasoner£º

°Ñ¹¤¾ßʹÓõ±³É¡¸Í¨ÓÃÍÆÀíÊÖÒÕ¡¹

AdaReasoner ÊÇÒ»¸öѵÁ··¶Ê½£ºÈÃÄ£×Ó²»µ«»á¡¸Å²Óù¤¾ß¡¹£¬£¬£¬£¬£¬£¬£¬ £¬¸ü»á×öÈýÀà¾öÒ飺

Ñ¡Ôñ£º¸ÃÓÃÄĸö¹¤¾ß£¿ £¿£¿£¿£¿ £¿£¿Òª²»Òª×éºÏ¶à¸ö¹¤¾ß£¿ £¿£¿£¿£¿ £¿£¿Ê±»ú£ºÊ²Ã´Ê±¼ä¸ÃÓã¿ £¿£¿£¿£¿ £¿£¿Ê²Ã´Ê±¼ä²»Ó¦Óã¿ £¿£¿£¿£¿ £¿£¿Â³°ôÐÔ£º¹¤¾ßʧ°Ü/ÎÞÓÃÔõô°ì£¿ £¿£¿£¿£¿ £¿£¿ÊÇ·ñ»ØÍË¡¢ÊÇ·ñ»»Õ½ÂÔ£¿ £¿£¿£¿£¿ £¿£¿

AdaReasoner °Ñ¡¸¹¤¾ßʹÓá¹µ±³ÉÍÆÀíÊÖÒÕÀ´Ñ§Ï°£º»á½ÓÄÉÓÐÓù¤¾ß¡¢ÑïÆúÎ޹ع¤¾ß£¬£¬£¬£¬£¬£¬£¬ £¬²¢°´Ê¹Ãüµ÷ÀíŲÓÃÆµÂÊ ¡£¡£¡£¡£¡£¡£¡£

03 Èý¸öÒªº¦Éè¼Æ£º

ÈḻáÓù¤¾ß¡¹´Ó¿ÚºÅÄð³ÉÄÜÁ¦

3.1 Tool Cold Start (TC)£º°Ñ¡¸³ö´í-ÐÞÕý¡¹Ð´½øÊý¾ÝÀï

ÎÒÃDz»ÊÇÖ»¸øÄ£×Ó¿´¡¸ÍêÉÆÂ·¾¶¡¹£¬£¬£¬£¬£¬£¬£¬ £¬¶øÊÇ¿ÌÒâ¼ÓÈëÁ½ÀàÕæÊµÌìÏ»ᱬ·¢µÄ³¡¾°£º

·´Ë¼Óë»ØËÝ£ºÊÔһϠ¡ú ¼ì²é ¡ú ²î³Ø¾Í³·»Ø/»»¼Æ»® ¡£¡£¡£¡£¡£¡£¡£¹¤¾ßʧ°Ü´¦Öóͷ££º¹¤¾ß·µ»Ø¹ýʧ/ÎÞЧ ¡ú ʵʱֹËð ¡ú »ØÍ˵½Ä£×Ó×ÔÉíÄÜÁ¦ ¡£¡£¡£¡£¡£¡£¡£

¶¨ÐÔ°¸Àý£º¶àÂÖ¹¤¾ßÍýÏë + ·´Ë¼¾À´í + ×éºÏ¹¤¾ßÍê³ÉÖØ´óÊÓ¾õÍÆÀí

3.2 Tool-GRPO (TG)£ºÓÅ»¯¡¸¶àÂÖ¹¤¾ß±àÅÅ¡¹£¬£¬£¬£¬£¬£¬£¬ £¬¶ø²»Êǵ¥´ÎŲÓÃ

¶àģ̬¹¤¾ßÍÆÀíÍùÍù²»ÊÇ¡¸Ò»´ÎŲÓÿ¢Ê¡¹£¬£¬£¬£¬£¬£¬£¬ £¬¶øÊÇ¶à»ØºÏ£º

ÊÓ²ì ¡ú ŲÓà ¡ú ÔÙÊÓ²ì ¡ú ÔÙŲÓà ¡ú ×îÖջظ² ¡£¡£¡£¡£¡£¡£¡£

Tool-GRPO Õë¶Ô multi-turn ³¡¾°×öÁËרÃŵÄÇ¿»¯Ñ§Ï°ÓÅ»¯£¬£¬£¬£¬£¬£¬£¬ £¬²¢ÓÃ×Ô˳Ӧ½±Àø°Ñ¹¤¾ßʹÓÃÄð³É¡¸²»È·×¼Ê±µÄ¿É¿¿ºó±¸¡¹£¬£¬£¬£¬£¬£¬£¬ £¬¶ø²»ÊÇÇ¿ÖÆÁ÷³Ì ¡£¡£¡£¡£¡£¡£¡£

3.3 Adaptive Learning (ADL)£º±ÆÄ£×Óѧ¡¸ÓïÒ塹£¬£¬£¬£¬£¬£¬£¬ £¬±ð±³¡¸Ãû×Ö¡¹

ΪÁË×èֹģ×ÓËÀ¼ÇÓ²±³Ä³¸ö¹¤Ç©×Ö£¨ºÃ±È¿´µ½"Point" ¾ÍÌõ¼þ·´É䣩£¬£¬£¬£¬£¬£¬£¬ £¬ÎÒÃÇ×öÁËÁ½¼þÊ£º

¹¤Ç©×Ö/²ÎÊýÃûËæ»ú»¯£¨È¥µô×ÖÃæÌáÐÑ£© ¡£¡£¡£¡£¡£¡£¡£¹¤¾ßÐÎò¸Äд£¨Í³Ò»ÓïÒå¡¢¶àÖÖ±í´ï£© ¡£¡£¡£¡£¡£¡£¡£

Ëæ»ú»¯ÑµÁ·µÄÖ±¹ÛʾÒâ

AdaReasoner ¿ò¼Ü×ÜÀÀ£ºTool Cold Start ¡ú Tool-GRPO ¡ú Adaptive Learning

04 ×îÓ²µÄÖ¤¾Ý£º

Сģ×ÓΪʲôÄÜ¡¸¿ç¼¶´ò¹Ö¡¹£¿ £¿£¿£¿£¿ £¿£¿

Ïȸø½áÂÛ£ºAdaReasoner-7B Ïà¶Ô base Ä£×ÓÔÚ¶à¸ö»ù×¼ÉÏʵÏÖÏÔÖøÌáÉý£¨ÔÚѡȡµÄ 8 ¸ö benchmark ÉÏÆ½¾ù +24.9%£©£¬£¬£¬£¬£¬£¬£¬ £¬²¢Ôڽṹ»¯ÍÆÀíʹÃüÉÏ¿¿½üÂú·Ö ¡£¡£¡£¡£¡£¡£¡£

Ö÷ʵÑéЧ¹û£ºÔÚ VSP¡¢Jigsaw¡¢GUIQA µÈʹÃüÉÏÏÔÖøÌáÉý ¡£¡£¡£¡£¡£¡£¡£

¸üÖ÷ÒªµÄÊÇ£º²»ÊÇ¡¸¹¤¾ßÔ½¶àÔ½ºÃ¡¹£¬£¬£¬£¬£¬£¬£¬ £¬¶øÊÇѵÁ·Åä·½¾öÒ鹤¾ßÊÇ·ñÕæµÄ°ïµÃÉÏæ ¡£¡£¡£¡£¡£¡£¡£

ÀýÈçÔÚµ¥Ê¹ÃüÉèÖÃÏ£º

VSP: Base 28.09 ¡ú TC 64.91 ¡ú TG 73.18 ¡ú TC+TG 97.64Jigsaw: Base 45.70 ¡ú TC 84.20 ¡ú TC+TG 96.60£¨Áè¼Ý GPT-5 µÄ 80.10£©

Æ¿¾±Ç¨áãʾÒ⣺µ±¹¤¾ßÍýÏë×ã¹»ºÃ£¬£¬£¬£¬£¬£¬£¬ £¬ÐÔÄÜÆ¿¾±´Ó¡¸Ä£×Ó¹æÄ£¡¹²¿·ÖǨáãµ½¡¸¹¤¾ßЧÓÃÓ빤¾ßÍýÏëÄÜÁ¦¡¹

05 ×îÓÐÒâ˼µÄ²¿·Ö£ºÄ£×ÓÕæµÄ

ѧ³öÁË¡¸ÈýÖÖ×Ô˳Ӧ¹¤¾ßÐÐΪ¡¹

Õⲿ·ÖÊÇ AdaReasoner ×îÏñ¡¸ÖÇÄÜÌ塹µÄµØ·½£ºÎÒÃÇûÓÐд¹æÔòÈÃËüÕâô×ö£¬£¬£¬£¬£¬£¬£¬ £¬µ«ËüÔÚ RL Àú³ÌÖÐѧ»áÁË ¡£¡£¡£¡£¡£¡£¡£

ÐÐΪ 1£º»á¡¸½ÓÄÉ¡¹ÓÐÓõÄй¤¾ß£¨Adopt£©

°Ñ A* ÍýÏ빤¾ß·Å½øÇ¿»¯Ñ§Ï°½×¶Î£¨Cold Start û¼û¹ý£©£¬£¬£¬£¬£¬£¬£¬ £¬Ä£×Ó»áÖð²½Ìá¸ßŲÓÃÆµÂʲ¢ÎȹÌÕÆÎÕ£º

VSP Navigation ´Ó 44.83 ¡ú 96.33

Navigation ʹÃüʾÒâ

A* ¹¤¾ßŲÓÃÆµÂÊËæ RL ѵÁ·ÑÝ»¯

ÐÐΪ 2£º»á¡¸ÑïÆú¡¹Î޹ع¤¾ß£¨Discard£©

¸üÒªº¦µÄÊÇ£ºA* ¶Ô Verify ʹÃüûÓ㬣¬£¬£¬£¬£¬£¬ £¬ÉõÖÁÊÇ×ÌÈÅÏî ¡£¡£¡£¡£¡£¡£¡£

ÔÚ¡¸Ö»ÔÚÍÆÀíʱÌṩ A*¡¹µÄÉèÖÃÀ£¬£¬£¬£¬£¬£¬ £¬Verify »á·ºÆð 94.20 ¡ú 80.00 µÄϽµ ¡£¡£¡£¡£¡£¡£¡£

¶øÔÚ RL ѵÁ·ºó£¬£¬£¬£¬£¬£¬£¬ £¬Ä£×Ó»áÖð²½Ñ¹ÖÆÎÞ¹ØÅ²Ó㬣¬£¬£¬£¬£¬£¬ £¬Èà Verify ά³ÖÔÚ¿¿½üÂú·Ö£¨99.20£© ¡£¡£¡£¡£¡£¡£¡£

Ò»¾ä»°£ºËü²»µ«»áÓù¤¾ß£¬£¬£¬£¬£¬£¬£¬ £¬»¹»áѧ»á¡¸±ðÂÒÓá¹ ¡£¡£¡£¡£¡£¡£¡£

ÐÐΪ 3£º»á¡¸µ÷Àí¡¹Å²ÓÃÆµÂÊ£¨Modulate£©

¹¤¾ßÒ²²»ÊÇ¿ª/¹Ø¶þѡһ ¡£¡£¡£¡£¡£¡£¡£Ä£×Ó»áÆ¾Ö¤×ÓʹÃü¡¸µ÷Ƶ¡¹£º

Point ¹¤¾ßÔÚµ¼º½¸üÒªº¦£¨~3.2 calls/sample£©£¬£¬£¬£¬£¬£¬£¬ £¬ÔÚÑéÖ¤¸üեȡ£¨~1.0 call/sample£©

Point ¹¤¾ßŲÓÃÆµÂÊ¡¸µ÷Ƶ¡¹£ºNavigation ÖиüÒªº¦£¬£¬£¬£¬£¬£¬£¬ £¬Verification Öиüեȡ

06 »»¹¤¾ß˵Ã÷Êé

Ò²ÄÜÓ㺷º»¯ÓëÎȽ¡ÐÔ

ÏÖʵÀï×î³£¼ûµÄÍ߽ⷽ·¨ÊÇ£º¹¤¾ß½ç˵¡¢²ÎÊýÃû¡¢ÐÎòÎݸһ±ä£¬£¬£¬£¬£¬£¬£¬ £¬Ä£×Ӿ͡¸²»»áÓÃÁË¡¹ ¡£¡£¡£¡£¡£¡£¡£

AdaReasoner Óà ADL£¨Ëæ»ú»¯ + ¸Äд£©°Ñ¡¸¹¤¾ßÍýÏ롹´ÓÎı¾ÍâòÐÎʽÀï½âñî³öÀ´ ¡£¡£¡£¡£¡£¡£¡£

Ò»¸öºÜÖ±¹ÛµÄÖ¤¾ÝÀ´×Ô¹¤¾ßʹÓÃͳ¼Æ£º

ÔÚ Jigsaw Éϵִï 3.54 CPS ÇÒ¹¤¾ßÖ´ÐÐÀÖ³ÉÂÊ 98.50%£¬£¬£¬£¬£¬£¬£¬ £¬×îÖÕ׼ȷÂÊ 88.60 ¡£¡£¡£¡£¡£¡£¡£ÔÚ VStar ÕâÖÖ¸ü¿ª·ÅµÄ VQA ÉÏÈÔÄÜ×Ô¶¯Å²Óù¤¾ß£¨1.47 CPS£©²¢È¡µÃ 70.68 ¡£¡£¡£¡£¡£¡£¡£

¹¤¾ßʹÓÃͳ¼Æ£¨CPS¡¢ÀÖ³ÉÂÊ£©ÓëÐÔÄÜ

±ðµÄ£¬£¬£¬£¬£¬£¬£¬ £¬Ê¹Óà ADL£¬£¬£¬£¬£¬£¬£¬ £¬Ä£×ÓÄܹ»¸üÈÝÒ×ÔÚеÄʹÃüÉÏÈ¡µÃ¸üºÃµÄÌåÏÖ ¡£¡£¡£¡£¡£¡£¡£ÎÒÃǽöʹÓà Jigsaw ÕâÒ»¸öʹÃüµÄ SFT Êý¾Ý£¬£¬£¬£¬£¬£¬£¬ £¬ÔÚÈý¸öʹÃüÉÏ RL£¬£¬£¬£¬£¬£¬£¬ £¬¿ÉÒÔ¿´µ½£¬£¬£¬£¬£¬£¬£¬ £¬Ê¹Óà ADL µÄ°æ±¾Äܹ»ÔÚÁíÍâÁ½¸öʹÃüÉϸøÄ£×Ó´øÀ´Ð§¹ûÉϵÄÌáÉý ¡£¡£¡£¡£¡£¡£¡£

ADL Äܽ«µ¥¸öʹÃüÉÏѧÀ´µÄ agent planning ÄÜÁ¦Ç¨áãµ½ SFT û¼û¹ýµÄʹÃüÉÏ ¡£¡£¡£¡£¡£¡£¡£

07 ÎÒÃÇÏëÇ¿µ÷µÄ

ѧÊõ½áÂÛ£¨Takeaways£©

¶àÄ£Ì¬ÍÆÀí²»µ«ÊÇ ¡¸think harder¡¹ ¡£¡£¡£¡£¡£¡£¡£¸üÒªº¦µÄÊÇ£º

actively seeing, verifying, and planning with tools.

µ±¹¤¾ß±àÅÅѧµÃ×ã¹»ºÃ£¬£¬£¬£¬£¬£¬£¬ £¬Æ¿¾±»á±¬·¢Ç¨á㣺

model scale ¡ú tool utility + tool planning

Õâ¶ÔСģ×ÓÓÈÆäÖ÷Òª£º²ÎÊýÓÐÏÞʱ£¬£¬£¬£¬£¬£¬£¬ £¬¡¸»áÓù¤¾ß¡¹¾ÍÊÇ×îÖ±½ÓµÄÄÜÁ¦·Å´óÆ÷ ¡£¡£¡£¡£¡£¡£¡£

´Ó Agentic Vision ¿´Ç÷ÊÆ£ºGoogle Óà Agentic Vision °Ñ Think-Act-Observe ÄÚÖõ½ Gemini£¬£¬£¬£¬£¬£¬£¬ £¬Ñ§Êõ½çÓà AdaReasoner ÑéÖ¤ÕâÌ×·¶Ê½ÔÚ¿ªÔ´Ä£×ÓÉϵĿÉÐÐÐÔ¡ª¡ªÁ½Ìõõ辶ͬʱÑéÖ¤ÁË¡¸×Ô¶¯¹¤¾ßʹÓṵļÛÖµ ¡£¡£¡£¡£¡£¡£¡£¹ØÓÚÏ£ÍûÔÚ×Ô¼ºÊý¾Ý/³¡¾°Éϸ´ÏÖÕâÖÖÄÜÁ¦µÄÑо¿ÕߺͿª·¢Õߣ¬£¬£¬£¬£¬£¬£¬ £¬AdaReasoner ÌṩÁËÒ»Ì×ÍêÕûµÄ¿ªÔ´¼Æ»® ¡£¡£¡£¡£¡£¡£¡£

Adaptive Learn½õ³ÌÉÌÒµÔËÓªÖÎÀíÓÐÏÞ¹«Ë¾ing ¶ÔÌáÉýÄ£×ӵķº»¯ÐÔÒ²Óкܴó×ÊÖú£¬£¬£¬£¬£¬£¬£¬ £¬¿ÉÒÔ×ÊÖú½« agent planning ÄÜÁ¦Ç¨áãµ½ÒÔǰû¼û¹ýµÄ agent ºÍеÄʹÃüÉÏÈ¥ ¡£¡£¡£¡£¡£¡£¡£