Ring-1T:蚂蚁开源的万亿参数思考大模型,数学推理达IMO银牌水平
Ring-1T是蚂蚁集团开源的万亿参数思考大模型,基于Ling 2.0 MoE架构,在AIME 2025数学测试中得分92.6,IMO国际奥数竞赛达银牌水平,代码生成能力超越GPT-5,支持128K上...
nanochat:Karpathy开源的100美元训练ChatGPT框架,8000行代码实现完整LLM
Andrej Karpathy发布nanochat,仅需8000行代码即可实现ChatGPT完整功能。在8×H100上训练4小时成本约100美元,包含从分词器到Web界面的全栈实现。12小时训练可超越...
Youtu-Embedding:腾讯开源的企业级通用文本表示模型,加速RAG落地
腾讯优图实验室开源Youtu-Embedding,业界领先的通用文本表示模型。支持文本检索、意图理解等六大任务,在CMTEB评测中以77.58分登顶。采用三阶段训练架构,解决负迁移难题,可集成到Lan...
MAI-Image-1:微软首款自研图像生成AI模型,主打逼真与高效
微软推出首款自研图像生成模型MAI-Image-1,在LMArena跻身前十。本文详细介绍该模型的核心能力、使用方式、技术优势,并与DALL-E、Midjourney等主流AI图像工具进行对比,助您了...