MOKI – 美图推出的AI视频短片创作工具
一、MOKI的定义与概述
MOKI是美图公司旗下的AI短片创作工具,于2024年9月26日面向全部用户开放。与市面上流行的文生视频产品、图生视频产品不同,MOKI专注于AI短片创作场景,覆盖动画短片、网文短剧、故事绘本、MV等多个类型的视频内容生产。
这一工具为用户提供了从前期设定到AI内容生成,再到后期制作的完整工作流。用户无需复杂的后期制作技术和专业的设备,仅需简单操作就能将图片、视频素材和音乐快速融合,创作出个性化的短片作品。其AI智能技术能够自动识别素材内容,自动进行剪辑、配乐、特效处理等操作,确保最终成品的专业性和高质量,旨在为用户提供便捷、高效的短片创作体验。
二、MOKI的功能特点
(一)一站式创作工作流
- 前期设定阶段
- 用户可以选择输入故事梗概或者导入已有的脚本内容,MOKI能够随即生成分镜脚本并且提供丰富多样的设定选项。这种输入方式十分灵活,无论是创作者有一个初步的创意想法,以故事梗概形式输入,还是已经完成脚本创作,直接导入就能继续后续创作工作。例如,如果想要创作一个动画短片,只需简单描述故事的大致情节,如“一个小动物在森林里冒险寻找宝藏的过程”,MOKI就能快速进入下一步创作阶段,并且在生成分镜脚本时基于这个故事梗概提供关于场景、画面风格等相关设定选项,像可以设定冒险过程中的森林场景是神秘的古老森林还是奇幻的魔法森林等风格。
- 内容生成阶段
- MOKI自动生成分镜画面,同时允许用户根据自己的设想对分镜画面的细节进行修改。以制作网文短剧为例,在MOKI生成最初的分镜画面后,如果用户觉得某个角色的表情或动作不符合预期,就能方便地进行调整。这里体现了AI创作与用户个性化创意的结合,在AI生成的基础上,让用户能够融入自身独特的创意元素。
- 后期制作阶段
- MOKI一键生成带有配乐的视频内容,并且用户还能够进一步对视频的生成效果持续进行优化。比如在创作MV类型的短片时,MOKI会根据前面的设定和分镜画面匹配上适合的音乐旋律,并且用户还可以对音乐的音量、节奏与视频画面的匹配度等进行调整提升作品的整体质感。这种一站式的工作流程大大降低了创作的门槛,即使是零基础没有专业背景的普通用户,也能够在MOKI的帮助下创作出一段完整的AI创意短片。
(二)理解中文语意且擅长东方视觉风格
- 对中文语意的准确理解
- 在语言表意理解方面,经过前期内测反馈,MOKI对中文语意的理解十分准确。例如在创作有关中国传统文化故事的短片时,对于富有中式文化内涵的语句,如古诗词或者具有传统寓意的成语等内容的理解到位,并能转化成合适的画面场景。就像当输入包含“世外桃源”这个成语的故事梗概时,MOKI能够准确把握其描绘的是一个与世隔绝、美好的地方的意境,从而在生成分镜脚本和画面时呈现出青山绿水、宁静和谐的世外桃源场景。
- 擅长东方视觉风格的创作
- MOKI在东方视觉风格的创作上表现出色,具体依据表现在中国动画、儿童期刊、国风漫画等风格的生成上有特殊优势。如果想要制作具有传统中国风绘画风格的故事绘本短片,MOKI能生成具有水墨笔触效果的画面,在角色设计上也符合东方文化中的古典形象,如长发飘逸、服饰带有传统元素的古代人物形象,同时画面的色彩搭配也能体现出东方文化中典雅、和谐的特点,像采用古韵的青、红色系等搭配。
(三)功能背后的技术支持
- 由美图奇想大模型(MiracleVision)提供支持
- 美图奇想大模型已经升级到V5版本,采用了美图自研的DiT技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型。这为MOKI提供了强大的AI模型能力,是MOKI实现上述功能的底层技术依托。该模型的先进性保障了MOKI在框架结构、智能算法等各方面有着稳固的后盾,能够处理像复杂的故事脚本理解、多类型的分镜画面生成以及音乐与画面的智能匹配等任务。
- 生成能力与效率的优化
- 多模态功能的融合
三、MOKI与美图其他产品的对比
(一)与AI图像类产品的对比
- 美图秀秀、美颜相机等
- 功能定位不同:美图秀秀、美颜相机主要侧重于对照片拍摄后的美化、修饰、添加滤镜等静态图像处理功能。例如美颜相机主旨在于提升自拍人物的肤质、面部特征等美观度;而MOKI专注于动态的视频短片创作,从创作故事短片内容、生成画面到最后的配乐等是一个完整的视频创作程序。
- 用户操作深度不同:在使用美图秀秀和美颜相机时,用户操作相对简单直接,如在美颜相机中滑动屏幕即可调整美颜强度等操作,但是主要是在已有的图像素材上进行优化。而MOKI虽然操作也较为方便,但需要用户参与到视频的创作构思过程,如编写故事梗概、调整分镜画面等更深入的创作操作层面。
(二)与其他AI视频类产品的对比
- 对比开拍V2
- 功能侧重点差异:开拍V2是AI口播视频制作工具,重点在于帮助创作者制作口播视频,更多地聚焦在口播内容的脚本优化、数字人的使用、视频翻译以及一键包装能力等针对口播类视频的特有功能上。例如对于一款电商产品的口播视频,开拍V2可以提供口播文案的快速创作和数字人主播形象等对口播视频创作有帮助的功能;而MOKI重点在动画短片、网文短剧、故事绘本、MV等多种类型短片的创作,两者的视频产出类型和面向的创作子领域有所不同。
- 创作流程区别:开拍V2的创作流程围绕着口播视频的制作逻辑,比如首先要考虑口播文案,然后是人物形象(数字人)等相关因素。MOKI则是按照前期设定(故事梗概或者脚本导入)、分镜生成、画面修改、配乐添加及整体优化的视频创作流程,创作流程更偏向于传统的影视短片制作但借助了AI的智能化。
- 与美图云修V2对比
- 目标用户群体差异:美图云修V2主要是针对商业摄影客户的AI批量修图软件,使用者更多是从事商业摄影后期修饰工作的人员或者商业摄影机构。他们主要关心如何通过AI迅速对大量照片进行批量精修和调色等操作以提高工作效率。MOKI的目标用户群体更加广泛,包括网络文学创作者、动画设计师、普通短视频爱好者等各种想要进行短片创作的人群,只要有创意构思并且希望通过AI方式转化成短片内容的用户都可以使用MOKI。
- 核心功能区别:美图云修V2的核心功能在于通过AI实现照片的快速批量处理,保障照片色彩、质感等方面的高质量输出。MOKI的核心功能是利用AI完成从短片创意构思开始到最后的视频完成并优化的全过程创作。
四、用户对MOKI的评价
(一)正面评价
- 操作便捷性的认可
- 一些用户认可MOKI的一站式成片能力,得益于其AI驱动的脚本、分镜、视频生成、配音、配乐能力,可以让没有专业背景的普通用户轻松上手。这意味着对于广大普通大众来说,他们想要创作个人特色的短片不再是遥不可及的事情,不需要掌握复杂的视频剪辑技能和花费大量时间邀请专业人员或者购置专业设备。比如一些日常生活中的活动纪念短片或者小众兴趣爱好类的动画短片创作需求都可以通过MOKI简单快速地实现。
- 效果风格上的认可
- 经过内测的短片创作者反馈,MOKI对中文语意的理解准确,并擅长东方视觉风格,在中国动画、儿童期刊、国风漫画等风格的生成上表现出色。对于有东方文化内涵或者中国风格创作需求的用户,MOKI的这个优点能使他们的创作思路得到很好的表达。例如一些传统文化爱好者想要制作古风故事绘本短片或者中式动画短片,MOKI能够在风格上给予很好的画面生成支持,唤起用户群体的情感共鸣。
(二)负面评价与期望改进
- AI视频生成能力有待提升
- 有评价指出相较于一些市面上其他的AI视频生成工具如可灵、即梦、Runway、Luma等,MOKI的AI视频生成能力较弱。在生成视频片段时,可能在画面的细腻度、视频内容的丰富度等方面与这些竞品存在差距。例如在生成一个风景MV短片时,与其他工具相比,MOKI生成的画面可能在细节纹理上不够逼真,或者画面过渡不够自然等问题。
- 剪辑能力需加强
- 有用户认为MOKI的剪辑能力较弱,在提供给用户的剪辑操作方面仅仅提供了基本的剪辑操作。如果要对生成后的视频进行精细化调整,用户还需要导出素材后再到其他剪辑软件(如剪映)中继续操作。比如当完成了一个网文短剧的创作,但是想要在某个情节衔接处加入转场效果或者微调某个画面的时长,MOKI现有的剪辑功能可能无法满足需求,需要额外借助外部剪辑工具来完成。