讯飞星火4.0 Turbo发布:大模型规模化应用的新突破
在人工智能领域,大模型的发展正迈向一个新的阶段。10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞带来了一系列重磅成果,讯飞星火大模型迎来新的里程碑。
一、讯飞星火4.0 Turbo发布及技术应用亮点
讯飞星火4.0 Turbo正式发布,这一版本首发多模AIUI交互标准等11项技术和产品应用。根据真实数据背靠背的测试,在由艾伦人工智能研究所、OpenAI等国内外权威单位发布的涵盖不同任务类型的14项主流测试集中,讯飞星火4.0 - Turbo在其中9项测试集实现对美国三大主流模型(GPT - 4o、Claude 3.5 Sonnet、Gemini 1.5pro)的超越,效率相对提升50%。
在代码能力和数学能力方面表现突出。根据实用数学任务构建测试集CAppliedMath - 1.0,在计算、财务、金融、度量等多个维度的任务中均超过GPT - 4o水平,且已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类“o1”的高难度数学能力显著提升。在代码生成HumanEval测试集上,与GPT - 4o差距微弱,在C ++能力上超过GPT - 4o,在真实应用场景基于iFLYCode - Eval - 2.0代码实用场景测试集,在代码生成、代码检错、单元测试等任务上都超过了GPT - 4o,还推出星火代码7B版本,满足极速响应型任务,效果业界最优。
二、多模AIUI交互标准与超拟人数字人
科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。现场演示中,无论是角色扮演还是场景对话,数字人都能应对自如。多模态视觉能力加持下的人机交互充满惊喜,数字人能看图说话,在旅游购物场景中还能识别外文产品信息。而且,讯飞星火支持用户创建自己的个性化数字人,目前已支持1300 +种人设打造,内嵌了星火多模AIUI能力的讯飞AI学习机阅读伙伴即将上线,提供更加智能的交互体验。
四、大模型在各行业的赋能
1.教育领域首次发布基于“问题链”的高中数学智能教师系统。这是中国教科院牵头,多地区数学教研员、优秀教师与讯飞星火大模型人机共创的成果,实现“人机共育”,可以智能生成教学问题链,辅助教学与学生学习。搭载高中数学智能教师系统的星火智慧黑板2.0将于10月25日在第84届教育装备展上正式发布,推动黑板从板书工具向教学AI助手的跃迁。讯飞AI学习机中首发AI作业过滤器,根据学生情况对练习题分级,实现“练得更少、学得更好”。
2.医疗领域发布讯飞星火医疗大模型2.0,六大医疗核心场景能力重大升级并持续领先。基于讯飞星火医学影像大模型打造的智能医学影像助手正式发布,在智能质控、智能诊断、智能读片等环节发挥重要作用。讯飞医疗联合相关方共同发布全谱系全模态医学影像大模型开放合作计划,推动医学影像大模型发展。
3.司法领域星火法律大模型赋能庭审笔录制作、裁判文书编写、法条类案检索等司法场景,和星火通用大模型相比,效率提升从61.7%提升到87.9%,大大提高了司法工作的效率和准确性。
4.政务服务场景政务大模型持续迭代,全面覆盖4500多种标准化事项和60多种材料。老百姓与政务大模型“聊天”就能确认办事意图,审核时间缩短80%,登记效率提升5倍。首发搭载政务大模型的“星火智办一体机”,方便群众从“问着办”到“领着办”,为民众提供了更加便捷高效的政务服务体验。
五、讯飞星火在企业中的地位与作用
“讯飞星火已成为央国企大模型的第一选择。”科大讯飞在多个方面取得第一的成绩,如央国企中标第一、教育医疗市场第一、智能汽车市场第一、大模型开发者生态第一、智能硬件市场第一、赋能科研应用第一、赋能工业应用第一。截至2024年10月,已与各头部企业共建20多个行业大模型,覆盖300 +应用场景,数量均为第一。
为了助力各行各业更好地应用大模型,科大讯飞构建了涵盖从“建算力、理数据、训模型,到落场景、保安全、精运营”的全套解决方案。越来越多的企业依托讯飞智能体平台,孵化员工自己的AI助手,例如国能集团通过举办大赛,创新孵化了多个场景智能体。科大讯飞也正式邀请全国开发者们参与共创。
六、讯飞星火赋能科研行业
AI for Science正在成为科技发展的新引擎。今年多个诺贝尔奖颁发给了AI领域的科学家,足以证明其重要性。讯飞星火持续为高校提供基础科研提效服务,星火科研助手自去年底发布以来,已在中科院下属116个院所使用。北京邮电大学EZCoding雏雁/大创团队基于讯飞星火大模型打造的编程教学应用平台“码上”,已在全国332所院校开通使用,使学生主动提问率增加1倍,教师辅导工作减少80%。
科大讯飞在人工智能赋能科研工作探索了三个台阶:依托科研文献助手和代码助手提升基础工作效率,基于深度神经网络对科学任务进行精准建模,以及借助认知大模型学习领域知识并辅助设计科研实验方案。科大讯飞在大模型+科研领域开展了诸多合作,如联合高校和科研院所设计全新蛋白质、研究基因表达课题、等离子体控制等,还联合高校研发“化学大模型”,联合科研所研发“化工大模型”。
七、首个国产万卡算力集群“飞星二号”平台上线
2024科大讯飞AI开发者大赛吸引了来自14个国家、348座城市的35268支团队参赛,其中9372支是大模型团队。科大讯飞联合多方共创赛题,最终评选出十佳团队。
科大讯飞在语音语义市占率第一、大模型开发者规模第一,达78.1万。发布会上,科大讯飞将开放全场景资源,从技术能力到应用落地,共享线上线下渠道和资源,加速开发者迈向市场成功。同时,科大讯飞将牵头成立AI基金,投入5亿创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为AI创业团队提供产业落地支撑。
科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。去年“飞星一号”平台上线后,星火大模型在攻克基础软硬件问题和模型适配问题上取得了很多成果。“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁,持续探索无人区,引领国产大模型底座的发展,为世界提供第二选择。
科大讯飞正在引领大模型规模化应用时代,面向未来,正如刘庆峰所说,人工智能产业发展的关键在于“顶天立地、自主可控、通专结合、端云联动、软硬一体”这五个关键词。坚持这些关键点,人工智能将拥有广阔的未来,能够解放生产力、释放想象力,改变产业和竞争格局,带来科研范式的变革,满足老百姓对美好生活的期望。