如何站上生成式人工智能潮头？

2024-04-03 03:00 每日看点快看

2022年，扩散模型技术的革命性潜力初现端倪，扩散模型所代表的文本-图像生成范式，用在视觉生成任务上，如图像超分辨率、去模糊等，为设计创意行业带来一次范式级的变革。恒图科技捕捉到了这一战略机遇，并迅速行动起来，在Fotor平台上率先上线了基于扩散模型的AI图像生成功能。短短一年时间，Fotor的月活跃用户数实现大幅增长，从百万量级一跃至千万量级。

如果说图片领域的突破是恒图科技在AIGC领域的初次试水，那么视频领域的探索无疑是公司的又一大布局。

今年年初爆火的Sora再一次在AIGC领域掀起了一场技术竞赛，国内外已有多家科创公司和互联网科技“大厂”下场布局。“图像和视频技术具有通用性，同时基于视频用户的需求持续增长，公司决定布局AI视频。”成都恒图创始人，西南财经大学教授、博士生导师段江表示。今年1月，恒图科技在全球上线了一站式AI长视频制作平台——Clipfly。该平台集合了文生图、图生视频、视频编辑等功能，使用户能在一个平台上完成从产生创意到完整视频的所有工作。

从最初简单生成3秒左右的视频，到实现5秒的突破，再到现如今45秒的长视频，包含细腻复杂的场景、生动的角色表情以及多个运动镜头，画面可以以假乱真。短短几个月，Clipfly已在海外拥有10万名用户。

段江介绍，即使是复杂场景的视频，制作成本约在40美元左右，相较于此前需要专业级影棚、专业图形处理软件数以百万计的成本，实现了降本增效。

“数字分身”

让医患互动等更智能

如何站上生成式人工智能潮头？

今日热点

小编精选

视角