就在刚刚,腾讯发布了自家的深度思考模型混元T1正式版。
能力对齐 R1 ,使用创新架构,推理速度飞快。
模型特点:
- 性能强悍,混元 T1 在多项评测指标中都达到 DeepSeek R1 和 OpenAI o1 同样的水平
- 使用了 Hybrid-Mamba-Transformer 融合模式创新架构
- 速度飞快,提问秒回,吐字飞快,出色的超长文本推理能力
Hybrid-Mamba-Transformer 技术特点:
- 有效降低传统 Transformer 结构的计算复杂度,减少 KV Cache 内存占用,显著降低训练和推理成本
- 大幅提升模型对超长文本任务的处理能力
- 这是工业界首次将混合Mamba架构无损应用于超大型推理模型
模型价格:
混元 T1 API 已经在腾讯云官网上线
- 输入价格:1元/百万token
- 输出价格:4元/百万token
非常便宜,可以试试。