8月9日,据《科创板日报》讯,阿里通义团队开源新一代数学模型Qwen2-Math,包含1.5B、7B、72B三个参数的基础模型和指令微调模型。Qwen2-Math基于通义千问开源大语言模型Qwen2研发,旗舰模型 Qwen2-Math-72B-Instruct在权威测评集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等,以84%的准确率处理了代数、几何、计数与概率、数论等多种数学问题。
6月19日,据《科创板日报》讯,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有75分。
5月21日,据财联社讯,阿里云宣布通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400。
4月28日,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。通义千问1100亿参数模型延续了Qwen1.5系列的Transformer解码器架构,采用了分组查询注意力方法(GQA),使得模型在推理时更加高效。110B模型支持32K上下文长度,具备优秀的多语言能力,支持中、英、法、德、西、俄、日、韩、越、阿拉伯等多种语言。(财联社)
随着ChatGPT风靡全球,国内开启AI大模型“狂飙模式”,相关项目开始“井喷”,行业呈现出“百模大战”的竞争格局。去年以来,传统互联网巨头如百度、阿里巴巴、腾讯等纷纷涉足大模型领域,推出了如“文心一言”、“通义千问”、“混元”等先进的大模型产品。
10月31日,据《科创板日报》讯,阿里云千亿参数规模大模型通义千问2.0今日发布,参数量全面提升至千亿级别,同时通义千问APP开放体验。阿里云还展示了通义星尘、通义灵码、通义晓蜜、通义点金、通义智文、通义法睿、通义仁心等应用模型。
9月25日,据《科创板日报》讯 阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat。据阿里云CTO周靖人介绍,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。
8月25日,据《科创板日报》讯,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识別、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
7月7日,据《科创板日报》讯,阿里云通义大模型新成员通义万相正式上线,据了解,这是一个AI绘画创作模型。阿里云智能集团首席技术官周靖人透露,通义千问已有累计超30的申请用户,超过100家深度共创企业,而通义听悟发布首月已有36万用户。会上,阿里云还发布了ModelScopeGPT大小模型协同智能助手。
6月26日,据《科创板日报》讯,“世界互联网大会数字文明尼山对话”在山东曲阜召开。在26日的主论坛上,阿里云智能集团董事长兼CEO张勇表示,人工智能技术应该“可用、可靠、可信”,科技企业在追求技术先进性的同时,必须坚守社会责任感。张勇介绍,今年4月,阿里云“通义千问”大模型开放对外测试,目前已有超过20万企业用户申请接入,几乎覆盖所有新兴和传统行业。同时,阿里云启动的“千问伙伴计划”,已经覆盖油气、电力、交通、金融、酒旅、企服、通信等行业。(财联社)
1998-2024深圳市财华智库信息技术有限公司 版权所有
经营许可证编号:粤B2-20190408
粤ICP备12006556号