AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
论文地址:https://arxiv.org/abs/2411.10640
算法改进:
硬件感知的系统设计
基础算法:
系统设计:
模型量化:
解耦图像编码与指令处理:
第一阶段:
第二阶段:
部署效率:
测评集性能:
OpenCompass 测评集:
文本数据集 / OCR 能力:
图像并行编码:
流水线并行处理:
分块计算输入 token:
和 MiniCPM-V 对比: