【财华社讯】2月27日,云天励飞(688343.SH)在互动平台表示,公司的推理芯片和加速卡目前已经支持适配云天书、通义千问、百川智能、智谱清言、Meta等30+开源大模型,涵盖1.5B参数到70B参数量,预期能使大模型推理成本大幅度下降。
8月9日,据《科创板日报》讯,阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开源大语言模型Qwen2研发,旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等,以84%的准确率处理了代数、几何、计数与概率、数论等多种数学问题。
6月19日,据《科创板日报》讯,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有75分。
随着ChatGPT风靡全球,国内开启AI大模型“狂飙模式”,相关项目开始“井喷”,行业呈现出“百模大战”的竞争格局。去年以来,传统互联网巨头如百度、阿里巴巴、腾讯等纷纷涉足大模型领域,推出了如“文心一言”、“通义千问”、“混元”等先进的大模型产品。
10月31日,据《科创板日报》讯,阿里云千亿参数规模大模型通义千问2.0今日发布,参数量全面提升至千亿级别,同时通义千问APP开放体验。阿里云还展示了通义星尘、通义灵码、通义晓蜜、通义点金、通义智文、通义法睿、通义仁心等应用模型。
9月25日,据《科创板日报》讯 阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat。据阿里云CTO周靖人介绍,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。
自ChatGPT问世以来,人工智能掀起了新一轮狂潮,一些没条件的企业千方百计“创造条件”也要蹭到这波热点,而那些有相关技术积累的公司更是不肯错过风口,纷纷推出了自己的大模型,其中百度(BIDU.US)有“文心一言”,阿里巴巴(BABA.US)刚出了“通义千问”,华为也有“盘古”。
4月7日,据《科创板日报》讯,阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请(tongyi.aliyun.com),符合条件的用户可参与体验。据悉,阿里云摩院在NLP自然语言处理等前沿科研领域早已布局多年,并于2019年启动大模型研发。
1998-2025深圳市财华智库信息技术有限公司 版权所有
经营许可证编号:粤B2-20190408
粤ICP备12006556号