原标题:美图大模型再更新,创始人吴欣鸿:全员拥抱AI,今年研发投入将超6亿元
10月9日,美图在15周年的生日会上,发布了自研AI视觉大模型Miracle Vision(奇想智能)的3.0版本。搭上了大模型的早班车,打开新的增长机会,但对美图而言只是开始。
今年上半年,美图净利润同比增长320.4%,达1.51亿元。美图公司月活跃用户数达2.47亿,同比增长2.5%。在Miracle Vision 3.0版本发布后,也进一步提振美图股价,今日收盘美图股价报3.93港元,创近两年新高。
面世100天后,美图AI视觉大模型Miracle Vision 3.0进一步强调了在应用场景的实际落地,目前已应用于电商、广告、游戏、动漫、影视五大行业。
在美图创始人吴欣鸿看来,AI视觉大模型带来的不仅仅是视觉呈现的提升,还有对工作流的提效,但目前大模型与工作流的结合仍在探索阶段,抓住应用场景的核心需求更为重要。
吴欣鸿认为,AI视觉大模型的本质,是无穷无尽的视觉创意库,而应用层相当于内容提取器,“按照每个用户的需求,从这个巨大的创意库中提取所需要的内容,让用户在特定场景中使用。”这也是美图视觉大模型3.0版本的迭代方向。
在会后的媒体群访环节,美图公司技术副总裁、美图影像研究院负责人刘洛麒介绍,1.0的目标在于搭建大模型架构与基础,2.0是构建高质量数据集提升美学能力,3.0则更强调模型的可控性,也可以在一定程度上完成细节控制、局部编辑。
问及3.0迭代升级的核心,吴欣鸿指出大模型的可控性也是进入到生产力或工作流的关键能力,“三个月来我们更多是在可控性以及如何结合刚才提到这个五个行业的工作流去进行尝试。”
也因此,他认为难点在于针对垂直领域的效果的精细度,如何让生成的内容真正应用于实际在做的工作中,是美图大模型在落地阶段的重点。“像电商细分之下,品类涵盖电器、服装等,垂直领域效果的调试,模型针对于每个领域的训练方式也不太一样的。”
此外,美图公司集团高级副总裁、影像与设计产品事业群总裁陈剑毅告诉搜狐科技等媒体,在选择行业的过程中,更关注与互联网的相关性。另外,也会注重行业内的长尾效应,他认为,长尾性强的会有更多中小玩家,这类客户对生成效果相对不敏感,更利于快速跑通售卖链路,产生商业价值。
美图认为,当下的阶段距离视觉大模型最近的人反而不是设计师,而是传播者。吴欣鸿表示,设计师习惯了传统的设计工作流,“我们实际接触的很多人里面,他们都觉得现在大模型还不可用。”
陈剑毅也指出,“我们也有参考 Adobe 对于用户的分层,最头部的是专业设计人员,他们使用专业的设计工具,就业也需要经过专业培训。”
更大的群体在于传播者,以新媒体运营、电商运营、网红等为代表的人,没有专业技能加持,人群基数足够大并且商业经济价值高于专业设计师。“传播者人群会是未来大模型的兵家必争之地,”陈剑毅表示,“大模型距离普通人是非常近的,C 端用户是AI原生工作流的早期种子用户,因为他们没专业技能的包袱。”
吴欣鸿表示,目前AI视觉大模型在生产端的三个待解决的问题是:垂直领域的极致效果、工作流整合、变现能力。随着AI视觉大模型和生产端的磨合,这三个问题也将会逐步解决。
2023年上半年,美图研发投入占总营收比重为23.31%,低于2022年同期的27.34%,毛利率则由去年同期的51.8%增至59.8%。
在对话中谈及研发费用,吴欣鸿也表示,今年上半年研发投入接近3亿元,全年应该会有超6亿元的研发投入,目前美图公司与大模型相关的主要工程师有六百人左右,而设计师、产品经理也都投入其中。“可以说我们现在是全员拥抱AI,因为发展太快了,所以我们应该内部有极强的紧迫感。”
值得一提的是,美图视觉大模型的负责人是设计师,研发模式是以设计师为主导,美学领域的创作者的参与程度较高。在迭代中,美图建立了自己的美学体系并以此为评估标准,“其实大模型的主动评估是很难的事情。有很多榜单、从不同维度来评估,而我们觉得美学和用户的连接,是我们评估AI大模型更好的方式。”吴欣鸿表示。
问及商业化,吴欣鸿谈及“美豆”(一种针对高频AIGC用户的单购付费体系)已于今年9月初上线。吴欣鸿表示,美豆为订阅提供了良好的付费转化,用户通过美豆以极低的成本尝试生成效果,也可以依据需求进一步订阅。
“短期内的商业模式也会围绕订阅和单购上发力,单购可以做反复的策略验证,未来也不排除根据行业、针对专业需求提供分级的会员订阅。”
对美图而言,如何快速打通大模型落地变现的链条成为迭代的关键。此前吴欣鸿在接受36氪采访时表示,付费用户数据的重要性高于月活数据,“我们很需要有造血能力。”
在群访环节他也更具体地展开,训练部分主要是采用A100与A800的卡,推理部分使用了V100、T10等多种型号,“比如做AI动漫这样视频类的,大模型推理能够用到约8000 张卡一天。”
但他也表示算力目前对美图而言不是很大的成本压力,也不会限制未来的业务,“目前更多还是要在场景快速地展开和迭代。”返回搜狐,查看更加多