阿里云诠释“通义听悟”:AI大模型化身工作生活好帮手

AI应用信息10个月前发布 XIAOT
85 0
阿里云诠释“通义听悟”:AI大模型化身工作生活好帮手

如果你是一名职场人,通义听悟可以帮你记录和回顾你的每一场会议;如果你是一位学生,通义听悟可以让你不遗漏老师讲授的每一个重点;如果你是一名金融分析师或媒体从业人员,通义听悟可以存档你每一次的调研访谈;如果你想以最快的时间看完你最喜爱的视频博主的直播分享,通义听悟可以使你以成倍的速度抓住最精彩的内容……

作为国内首个开放公测的大模型应用产品,聚焦音视频领域的工作学习AI助手阿里云通义听悟一经问世,就受到了广大用户的追捧。自上线以来,累计服务用户超100万,每日处理音视频数量超5万个,每日处理时长在3万小时以上。
通义听悟以阿里云通义千问大模型为基座,融合了音视频AI技术的功能和优势,拥有领悟理解和融会贯通的能力,全面提升知识从音视频向图文形态转化的效率,包括实时语音识别、音视频语音识别、发言人角色区分、内容规整、章节速览、一键笔记、全文总结、提取PPT等能力,可广泛应用于会议交流、教学培训、调研访谈、音视频理解与问答等领域。
顾名思义,“通义听悟”除了“听力好”,“悟性”也非常高。其不仅融合了十多项AI功能,可以全面提升知识从音视频向图文形态转化的效率,还能高准确度区分不同发言人、生成会议记录,仅需一秒钟即可为音视频划分章节并形成摘要、总结全文及每个发言人的观点、整理关注重点和待办事项。通义听悟的“提取PPT”功能引入视觉AI算法,自动将PPT讲解视频分割为演示文稿,并对每页PPT进行要点总结,形成一份图文并茂的大纲,解决培训、网课学习等场景“求PPT难”的问题。
针对一些细分场景,通义听悟还设置了不少“宝藏功能”:打开Chrome浏览器插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地观看无字幕视频。日程冲突时,通义听悟还可成为职场人士的“开会替身”,在静音情况下入会,AI可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;其梳理的问答回顾可以让记者、分析师、律师、HR等群体整理访谈更高效。
大受欢迎的通义听悟,背后依托的是阿里云强大的智能计算能力。创立于2009年的阿里云,是全球先进的云计算人工智能科技公司,为200多个国家和地区的企业、开发者和政府机构提供服务。阿里云致力于让计算成为公共服务,通过提供安全、可靠的计算和数据处理能力,让云计算人工智能成为普惠科技。
作为杭州亚运会官方信息技术集成和云服务合作伙伴,阿里云助力杭州亚运会赛事核心系统100%上云,并首次实现云上转播,成功打造了史上首届云上亚运。由阿里云支撑的赛事成绩发布类系统群,采用云计算替代传统数据中心,成为亚运会算力基础设施,从底层支持赛事系统群,向上支撑云上转播、亚运钉等智能应用,实现核心系统和应用服务的云上打通,为亚运各类智能应用提供强有力的云底座支持。
目前,阿里云已经成为亚太第一、全球前三的云服务商,其自主创新的基因始终未曾改变。多年来,阿里云坚持自主创新,自研的飞天云计算操作系统,打破国外在云计算底层技术上的垄断,获中国电子学会15年来唯一颁发的科学技术特等奖。2013年阿里云自研大数据计算服务ODPS,是业界少有的完全自主研发、支持10万级服务器并行计算、百万级CPU可扩展大数据智能计算平台。2014年,Platform for AI诞生,奠定人工智能技术基础,作为面向开发者和企业的机器学习深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140多种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。2022年,阿里云在业界率先提出“Model as a Service,模型即服务”理念,发布通义大模型和魔搭社区ModelScope,向全球开发者开源开放,降低AI门槛。2023年,阿里云发布超大规模语言模型通义千问,音视频领域的工作学习AI助手通义听悟和绘画创作大模型通义万相,开源通义千问18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,阿里云成为国内最早开源自研大模型的科技企业。
面向AI时代,阿里云以云计算为基础,以模型为中心,以从底层算力到AI平台再到模型服务全栈技术创新,让云计算加速AI浪潮下的产业智能升级。
    © 版权声明

    相关文章