讯飞星火大模型 – 科大讯飞推出的新一代认知智能大模型
一、什么是讯飞星火大模型?
讯飞星火大模型,是由科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力。
二、讯飞星火大模型技术架构
- 模型结构:
- 讯飞星火大模型基于深度学习技术构建,采用了神经网络架构,特别是 Transformer 模型,这种架构在处理长距离依赖和并行计算方面表现出色。
- 模型参数规模巨大,能够处理和理解复杂的语言结构。
- 数据处理:
- 模型在训练过程中使用了大量的文本、图像和语音数据,这些数据经过清洗、标注和预处理,以确保模型能够学习到丰富的语言特征和知识。
- 采用的数据增强技术能够提高模型对不同语境和场景的适应能力。
- 训练资源:
- 讯飞星火大模型V4.0是基于全国首个国产万卡算力集群「飞星一号」训练而成,这标志着中国在自主可控的大模型训练方面取得了重要进展。
三、讯飞星火大模型功能特点
- 多模态交互:
- 除了文本输入,讯飞星火大模型还能处理图像和语音输入,实现了多模态融合交互,为用户提供更加丰富和直观的交互体验。
- 智能问答与推理:
- 模型能够理解复杂的问题,并进行逻辑推理,提供准确的答案。它在处理多跳推理(需要多个推理步骤的问题)方面表现出色。
- 文本生成与摘要:
- 模型能够根据输入的提示生成连贯、有逻辑的文本,适用于撰写文章、报告、生成摘要等多种场景。
- 数学能力:
- 讯飞星火大模型具备解决数学问题的能力,能够进行复杂的数学计算和问题求解。
- 代码能力:
- 模型能够理解和生成代码,为开发者提供编程辅助,提高开发效率。
四、讯飞星火大模型功能扩展
- 情感分析:
- 讯飞星火大模型能够分析文本中的情感倾向,这对于市场调研、客户服务等领域非常有用。
- 命名实体识别:
- 模型能够识别文本中的特定实体,如人名、地名、组织名等,这对于信息提取和知识图谱构建至关重要。
五、讯飞星火大模型应用场景
- 教育:
- 在教育领域,讯飞星火大模型可以用于智能教学、个性化学习、作业批改等,辅助提高教学质量。
- 医疗:
- 在医疗领域,模型可以用于辅助诊断、患者咨询、医学研究等,提供专业的医疗信息支持。
- 商业:
- 在商业领域,讯飞星火大模型可以用于市场分析、客户服务、报告生成等,帮助企业提高工作效率。
- 智慧城市:
- 在智慧城市建设中,模型可以用于城市数据分析、公共安全监控、交通管理等,提升城市管理智能化水平。
六、讯飞星火大模型最新动态
1月15日,科大讯飞举行了2025年第一场讯飞星火大模型升级发布会,正式带来了星火深度推理模型X1、星火语音同传大模型以及星火4.0 Turbo底座升级,国内大模型的能力又来到了一个新高度。
其中,讯飞星火4.0 Turbo于2024年10月24日首发,时隔不到3个月的时间,迎来全新迭代。究竟啃下了哪些“硬骨头”,对于场景化落地又有什么样的意义?
Know-how,更懂行业
人工智能开发的最终目的是应用和落地,当前一些头部生成式人工智能在通用状态下表现良好,而如何以更强的“专业素养”走入特定行业落地应用,则是难点,也是讯飞星火4.0Turbo迭代升级的意义所在——成为“更懂行业”乃至“最懂行业”的大模型。
据了解,讯飞星火4.0 Turbo底座能力在本轮优化中实现了全面升级,七大核心能力全面提升,全面对标OpenAI 最新版的GPT-4o。此次升级的最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上全面提升。其中,知识问答能力4.7%,语言理解能力4.5%,数学能力10.5%。本次讯飞星火4.0 Turbo底座能力提升有“干货”。
在图文识别的能力上,讯飞星火4.0Turbo极大优化升级,强化了复杂场景的图文识别能力,通用文档版面分析、文字识别的准确率提升40%,复杂表格结构、潦草手写文字等方面的准确率提升60%。
图片识别能力为何重要?训练“懂行业”的人工智能大模型,需要特定行业特定工作数据的输入和利用,而图文识别能力直接关乎着企业能否高效地采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况,讯飞星火4.0 Turbo图文识别能力升级可以解决上述难题、大幅提升高价值数据的获取能力。
从能力提升到真正辅助行业,讯飞星火4.0 Turbo本次升级在金融、油气、能源、电力、钢铁、航司等领域综合能力的绝对提升全部超过10%,让大模型向场景化、应用化、专业化、垂直化方向发展,让技术变得更有价值。
“人工智能国家队”的马太效应
想让人工智能深入各行业成为“专家”,需要明需求、“喂”数据,如此才能“训练”出适合行业、解决社会刚需的人工智能。
迭代后的讯飞星火4.0 Turbo为什么能做到“懂行”,这就不得不提科大讯飞的“标王”经历。
近日,智能超参数发布了《中国大模型中标项目监测报告(2024)》,盘点了2024年全年大模型中标项目的整体情况及各厂商的表现。
其中科大讯飞凭借91个中标项目和84780.8万元的中标金额,成为2024年度大模型中标项目的“标王”,其中标金额更是超过了第二名到第六名金额总和,可谓断层领先。91个中标项目涵盖了通信、金融、能源、教科、政务、医疗等多个行业,主要以央国企客户为主。
2024年,科大讯飞为各行业央国企提供大模型底座,并推动300余个智能体应用,比如,中国海油与科大讯飞共建的“海能”人工智能模型,可以针对海上油田的稳产增产、安全钻井等场景,构建起数据驱动、业务协同的新模式;中国绿发与科大讯飞共同发布泰山大模型,成为绿色产业内的首个行业大模型。科大讯飞可以说是名副其实的“人工智能国家队”。
在与龙头企业合作的丰富“实战经验”中,讯飞星火大模型的升级有了更明确的方向。行业内专业数据、文献的“精准投送”,进一步丰富了大模型的行业“知识库”,提升了其行业理解能力和行业推理能力。
支持更长的文本、理解更复杂的图文、减少幻觉、提升行业理解能力……基于企业切实诉求和2亿多用户的真实反馈进行“靶向”优化升级,讯飞星火4.0 Turbo“长”在了大家的需求点上。
比如针对大模型幻觉问题,讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能。这一新框架优化了超长注意力机制,同时利用大规模网页和书籍数据进行知识关联式合成,使得知识回复的错误率降低了40%,句子级溯源效果更是超越了GPT-4o,显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。
得益于行业、图文、长文本等能力的提升,科大讯飞还行业首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大幅提升信息搜索效率。
讯飞星火的强势生长期
讯飞星火已成为央国企大模型的第一选择。
早在2024年10月讯飞星火4.0 Turbo发布之时,刘庆峰就晒出了大模型应用成绩单:央国企中标第一,教育医疗市场第一,智能汽车市场第一,大模型开发者生态第一,智能硬件市场第一,赋能科研应用第一,赋能工业应用第一。
随着智改数转的深入推进和新质生产力的加速孕育,人工智能大模型正处于强势生长期,而成长为“人工智能国家队”的科大讯飞,已经有了相当扎实的基本盘。
此前,国资委多次对外表态,强调中央企业要加快布局和发展人工智能产业。去年2月,国资委在中央企业人工智能专题推进会中专门强调,加快推动人工智能发展,是国资央企发挥功能使命,抢抓战略机遇,培育新质生产力,推进高质量发展的必然要求。会上,10家中央企业签订倡议书,表示将主动向社会开放人工智能应用。
作为首个基于全国产算力底座打造的大模型产品,讯飞星火大模型实现了人工智能领域真正的自主可控。安全、可靠,也是科大讯飞成为“标王”的深层原因。
抓住机遇,做好我们自己的AI“国货”,我们期待着科大讯飞给出更多惊喜。