做行业先行者,达观数据研发国产版GPT模型“曹植”系统

AI应用信息9个月前发布 XIAOT
214 0
今年年初,ChatGPT爆火出圈,成为时下AI圈新晋“顶流”。国内搜索巨头百度宣布推出中国版ChatGPT文心一言”;阿里达摩院正研发类ChatGPT对话机器人,已开放员工内测······众多创新企业争相入局。近日,园区企业达而观信息科技(上海)有限公司(以下简称“达观数据”)加入“先行者”行列,研发国产版GPT模型“曹植”系统。

做行业先行者,达观数据研发国产版GPT模型“曹植”系统
探索大语言模型实践,研发国产版GPT系统

众所周知,大模型的算力惊人。在通用领域,以ChatGPT为代表的生成式大规模语言模型,展现出卓越的知识学习与文字创作能力,受到国内外广泛关注。垂直领域的GPT大模型同样拥有广阔应用前景。达观数据研发团队基于多年文本智能技术积累和垂直领域场景业务经验,正积极探索大语言模型(LLM)实践。作为垂直、专用、自主可控的国产版ChatGPT模型,“曹植”系统不仅能实现专业领域的AIGC智能化应用,还可内置在客户各类业务系统中提供专用服务。

做行业先行者,达观数据研发国产版GPT模型“曹植”系统
图片来源:达观数据微信公众号

达观数据自主研发的“曹植”系统将进一步夯实其产业应用智能化基座,全面增强AI全产品矩阵能力。作为国内大规模语言模型中首批可落地的产业应用级模型,“曹植”系统已在金融领域AIGC多场景投入应用,未来将持续赋能金融、政务、制造等多个垂直领域和通用场景人工智能的落地与发展。

多层面应用,打造垂直领域专用语言大模型

达观数据于2016年入驻浦软孵化器,是全球领先的文本智能处理专家。深耕深度学习语义智能领域十余年,达观数据与北京大学、复旦大学等多个高校算法实验室与科研团队建立了深度交流合作机制。在算法方面,达观数据不断探索GPT-3模型的原理验证和垂直行业知识的强化训练,不断提高模型准确性和实用性。目前,“曹植”系统已获得重要技术突破,以大量通用数据和领域数据自监督训练的LLM为基座模型,通过大量通用任务数据和领域任务数据进行prompt Learning微调,在垂直领域内的理解和生成任务中均取得良好效果。

做行业先行者,达观数据研发国产版GPT模型“曹植”系统
图片来源:达观数据微信公众号

在产品应用方面,以“曹植”系统作为支撑,为达观数据全栈AIGC(AI Generated Content,指利用人工智能技术生成内容)智能产品带来革命性效果提升。例如,达观数据企业申报材料自动生成,基于达观数据AIGC智能写作能力,可适配各类材料申报业务场景,基于已有各结构化类数据,快速撰写各类制式和非制式文档,应用于公文、招投标、投行申报文档、法律文书等专业写作场景。

首度亮相,持续提供专业高效解决方案

近日,在由中国人工智能学会主办,达观数据携手中国人工智能学会自然语言理解专委会、真格基金共同承办的“ChatGPT及大模型专题研讨会”上,围绕ChatGPT与大规模语言模型发展应用的头脑风暴精彩上演。会上,达观数据董事长兼CEO、复旦大学计算机博士陈运文以探索大语言模型的垂直化训练技术和应用为题,展开介绍达观数据“曹植”系统的研发进展与工程化探索,成为“曹植”系统面向公众的首度亮相。

达观数据是国家级专精特新“小巨人”企业、AI届最高奖“吴文俊”人工智能奖获得企业,始终致力于用AI技术替代大量繁琐的重复性工作,提升金融、政务、制造等行业的运营管理效率,进一步释放劳动力价值。陈运文表示:“深化大模型在垂直领域的应用,真正把大模型融入到企业的实际业务中,对于商业化和大语言模型研究都具有重要意义。”未来,达观数据将建立多个垂直领域的专用语言大模型,为各行业的智能化需求提供更加专业和高效的解决方案。

    © 版权声明

    相关文章