2025第一季度,文生图行业进步神速。
直观层面,图形的拟真度飞速提升。由此,其在广告、宣传、影视制作、游戏开发等领域的价值得到了空前开发。
而AI的发展不会到此为止。为了降低制作成本和时间,提高工作效率和视觉效果,国内企业开始了新的进击。
其中,图像制作与工作流的结合成为趋势。
海马云CTO温健对数科星球指出:当下,每个行业的每个工种都可凭借制作工作流生成图片,工作流的潜力还远未被挖掘,而巨大的需求和巨大的供给迟早相互融合。
01
SD强大,但需要工作流补充
如今,人人皆知ChatGPT。
和OpenAI一样,在图片行业,人人皆知StableDiffusion。其第一代于2022年8月22日正式向公众发布,在发布至今,历经两年,Stable Diffusion 已迭代至3.5版本。
据了解,StableDiffusion3.5Large新增了blur、canny和depth三种controlnet功能。
其中blur功能可实现高保真度的图像放大,支持8k和16k分辨率,适合将低分辨率图像平铺成大型、详细的视觉效果;
canny功能利用边缘映射构建生成图像,对于插图、建筑等场景生成具有清晰边缘和结构的图像很有用,且能适应所有风格;
depth功能则使用深度图指导图像生成,适合建筑渲染、3d资产纹理制作等需要精确控制图像合成的用例,便于生成3d效果的图像。
底座模型虽然强大,但对于广大图片和视频制作者而言,还是不够方便。
比如,如对原始视频素材进行细致分析,拆解其内容结构,为后续制作提供基础,困难重重。制作者也无法依据从现有图像中反推关键元素。
对于视频制作者而言,还需要通过AI辅助构建合理的分镜脚本,规划视频情节和镜头等等需求。
对于图片制作者而言,也需要自由选择和组合各种节点,实现不同的图像风格,如卡通风格、写实风格、抽象艺术风格等。
此外,以图生图功能还较为欠缺。在数科星球的多方了解中发现,大部分设计上希望对已生成图像进行二次编辑和修改,如调整色彩、对比度、亮度等参数,以及进行裁剪、拼接等操作,方便创作者对作品进行完善和优化。
所以,为了满足种种需求,以ComfyUI为代表的工作流开源平台开始崛起。
ComfyUI采用节点式工作流架构,用户可以通过拖放和连接不同的节点来构建个性化的图像生成工作流。每个节点代表一个特定的功能或操作,如文本提示、图像输入、风格转换、滤镜应用等,这使得用户能够更直观地理解和控制图像生成的每个步骤,轻松创建从简单到复杂的各种图像生成任务。
这极大降低了图片制作的门槛。数科星球认为,ComfyUI的出现可比作图形显示系统之于DOS系统。它让小白用户也可具备专业的设计师能力,真正实现了设计平权。

(官网工作流展示)
02
ComfyUI的优势与劣势
ComfyUI的出现好处多多,比他它可实现设计协同、用户可自定义图片生成流程、生成速度也大幅提升。
目前,由于节点多、开发者多,ComfyUI正在和WebUI等同质平台拉开差距,大有一统江湖的趋势。
什么是节点,为什么节点需要开发?
为理解方便,我们制作了节点和功能说明图。

(部分ComfyUI节点与功能说明)
由于是开源平台,为了满足更多的图片/视频制作需求,便需要搭建可开发更多的节点。但如此一来,平台的复杂度便再一次提升了。
这主要有三点难以回避:
它的界面相对复杂,对于新手用户来说不够友好,存在一定的学习曲线;
虽然它支持多种 Stable Diffusion 模型及相关扩展,但在文生视频等更广泛的功能上可能需要用户自行配置和扩展;
它本身并不直接支持多人实时协作编辑,这在一定程度上限制了团队合作的效率。
所以,对于开源平台本身,需要一个集大成者、用户门槛足够低的产品弥补市场空白。由此,海马云旗下的RunningHub便出现了。

(官网案例:圣诞节商品图摄影OminiControl)
03
RunningHub的优势
RunningHub的定位是基于开源生态系的图形音视频AIGC应用共创平台。
“从整体角度而言,我们依据平台集成Comfyui和众多开源模型工具,打造算力平台和开发者工具,鼓励开发者共创各类ai应用打通整条产业链”,温健这样说。
RunningHub出现的意义是,它将图片/视频生成成本从以往锚定设计师的人力成本转换成为了算力成本。而这种算力不是基于英伟达的私有部署卡,而是基于廉价的公有云算力。
无需繁琐的本地环境安装,用户打开网页即可轻松投入到创作当中,降低了使用门槛,节省了时间和精力。
类似用户只需通过Claude3.5,无需掌握代码知识就可编程。借由低代码和拖拉拽,在RunningHub上,无设计基础的用户就可以生成高水平作品。
在海马云的设计思路中,用户除可根据节点编辑自己的智能体外,还能通过享用平台中的既有智能体直接生成作品。

(官网最新节点展示)
“可以这样理解,我们把开发者开发的AI工作流应用商店化了,用户可以直接分发自己的AI应用,可以直接将应用分发至Web、小程序、抖音小程序和小红书等渠道中,更可以直接让私域用户体验,”温健补充。
该平台有着独特的现实意义。
对于智能体制作者而言,RunningHub为普通人提供了一条新的赚钱渠道。在数科星球看来,直接的应用付费模式类似“卖课”和知识付费,在未来将创造出极其可观的收益。
温健评价,RunningHub是行业内最完整的ComfyUI开源节点平台。
在该平台中,创作者可以更直观地构建和管理图像生成工作流,以快速实现复杂的创作想法。另外,其节点还包括图像处理、生成算法等功能,用户可在此选择更丰富的创作工具和效果选项。
此平台一经搭建,获得颇多好评。
一些开发者认为,使用现有的开源节点可以避免重复造轮子;通过节点分享,开发者还有机会获得收益;对于新手而言,直观的图形界面和丰富的文档方便了快速上手。
而未来,随着节点的增多,不同行业和领域对ai作图的多样化需求也可得到满足。

(多种AI应用可供选择)
04
开源的想象力巨大
发布数个月,纯靠开发者口碑传播,目前RunningHub已经有全球144个国家的用户成为了Runninghub的用户,其中付费会员用户广泛分布于中国、日本、阿联酋、美国、英国、法国、克罗地亚、立陶宛、西班牙、波兰、越南、巴西等各大洲国家。
是什么原因让该产品获得快速增长?数科星球认为,这归功于开源和该行业的巨大潜力。
据相关报道,GitHub上2023年新增6.5万个生成式AI项目,同比增长248%。而2024年被认为是AI视频生成领域迎来寒武纪大爆发的一年,大量模型和应用涌现,促使更多开发者加入图形音视频领域的AI开发。
在功能上,该平台除了能做海报、名片、PPT、邀请函、logo、微信设计图等内容,还可兼容绘本、数字人等基于AI的内容呈现。
对于设计本身而言,它不需要用户掌握Sketch、PS、AI等多种软件能力,让小白也能掌握设计能力。
现在,该平台已积累7000+节点插件,每日更新,节点的数量和稳定性远超其他平台。另外,该平台还拥有1000个项目能力。按照一个项目覆盖一个场景计算,该平台能覆盖众多AIGC领域,其覆盖率可达99%。
“我们希望用户能用“搭乐高积木”的方式使用我们,”温健补充。
搭积木的软件生成方式有什么意义?答,可让“妙鸭相机”这类软件更多被制造出来。
在此之前,妙鸭相机依靠9.9元的付费便能时候能出个性化AI写真功能一炮而红。在其中用户只需上传自己的照片,就能生成多种风格的ai照片。旋即,这类功能被各大互联网大厂模仿,成为了全民喜闻乐见的形式。
如果平民开发者也能掌握这样的技能,那么其效果无异于再造移动互联网大潮。
从商业模式角度来看,因开源社区汇聚了大量不同背景和专业领域的开发者,使得他们能够基于开源框架快速开发出各种新颖的AI应用,这种集体智慧和协作开发模式极大地加速了创新的速度和多样性。
此外,随着开源平台的逐渐强大,企业还可以通过提供增值服务,如专业的数据分析、定制化的解决方案、高级功能解锁等,向用户收取费用;还可以与产业链上下游的企业进行合作,通过数据共享、联合营销、分成等模式实现互利共赢。
结尾:从短期来看,AI结合电商和教育的场景已被挖掘。从长期看,随着底层模型的智能上限继续被提升,其产生的增量空间将会更大。
从数科星球目前所看到的,一些电商卖家已不再需要“手模”(手部模特)、“腿模”了,其利用AI的背景替代功能就可取代这部分花销。
更进一步地,打光、剪辑、导演和道具也都不需要了。
而在温健看来,RunningHub这样基于开源平台的图形音视频AIGC应用生态还有很大想象空间。“因为我们切切实实看到了,需求端非常庞大,而在未来只要供给能力加强,那么新的时代就会到来”,他对数科星球这样说。