如何站上生成式人工智能潮头?
2022年,扩散模型技术的革命性潜力初现端倪,扩散模型所代表的文本-图像生成范式,用在视觉生成任务上,如图像超分辨率、去模糊等,为设计创意行业带来一次范式级的变革。恒图科技捕捉到了这一战略机遇,并迅速行动起来,在Fotor平台上率先上线了基于扩散模型的AI图像生成功能。短短一年时间,Fotor的月活跃用户数实现大幅增长,从百万量级一跃至千万量级。
如果说图片领域的突破是恒图科技在AIGC领域的初次试水,那么视频领域的探索无疑是公司的又一大布局。
今年年初爆火的Sora再一次在AIGC领域掀起了一场技术竞赛,国内外已有多家科创公司和互联网科技“大厂”下场布局。“图像和视频技术具有通用性,同时基于视频用户的需求持续增长,公司决定布局AI视频。”成都恒图创始人,西南财经大学教授、博士生导师段江表示。今年1月,恒图科技在全球上线了一站式AI长视频制作平台——Clipfly。该平台集合了文生图、图生视频、视频编辑等功能,使用户能在一个平台上完成从产生创意到完整视频的所有工作。
从最初简单生成3秒左右的视频,到实现5秒的突破,再到现如今45秒的长视频,包含细腻复杂的场景、生动的角色表情以及多个运动镜头,画面可以以假乱真。短短几个月,Clipfly已在海外拥有10万名用户。
段江介绍,即使是复杂场景的视频,制作成本约在40美元左右,相较于此前需要专业级影棚、专业图形处理软件数以百万计的成本,实现了降本增效。
“数字分身”
让医患互动等更智能
