美团LongCat团队发布VitaBench
36氪
2025-10-21 07:30
发布于北京
36氪官方账号
36氪获悉,美团LongCat团队正式发布当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench(Versatile Interactive Tasks Benchmark),并已全面开源。