近期Moonvalley推出了一款强大的从文本到视频的生成模型:仅靠文本提示即可生成高清、16:9 电影质量的视频,还能选择不同视频风格(比如超现实主义、动漫、幻想)。一句提示词就能生成一个高清、16:9电影画质视频:团队声称打造“史上最强”视频生成AI”,“知道《星际迷航》中的全息甲板吗?我们的使命就是复刻它。知道Stable Diffusion、DALL-E或Midjourney吗?我们就是它们的视频翻版!”有“耀眼的光笼罩着一个人,现场一片混乱,充满电弧和漩涡能量”:也有“一个粉蓝色头发戴墨镜,正在跳舞的25岁女子”:https://discord.gg/moonvalley;视频默认为16:9,默认高清画质,没有其他画幅比例。示范提示语:A spaceship landing on a mysterious moon crater. You'll be prompted
to also choose a style and the duration of the generated video clip you'd like
shared back.输入完提示语需要选择视频风格,目前提供了五种视频风格;随后需要选择视频时长,目前提供短|中|长三档。最长一档的单个视频长5秒。档次越低速度生成越快,但帧率也更低,而较长视频的帧速率则更加平滑,但生成时间会更长。2、在聊天框中输入“/create”,系统就会自动给你格式,提示你填写提示词、风格和视频质量。3、生成视频的质量不同,等待时间也不同;需要通过Prompt ID,来查询生成的视频。选择中等质量,可以生成 3 秒视频;可以选择奇幻效果,生成的视频质量更好。运动引导生成,可以使用镜头方向来精细控制场景的特定部分。
模型在真实人像方面的渲染质量相当惊人,比其他Gen2、Pika、Morph、Genmo、FullJourney等等所有视频模型的效果都要更清晰。模型也直接支持视频中生成文字功能,只需简单的在提示语中描述即可。moonvalley在模型层面直接实现了相机控制功能,可以直接在文本提示语中控制相机的运动。也就是说,你可以使用各种镜头描述语言控制相机的运动。
目前,普遍存在视频生成的应用都速度慢,Moonvalley 也不例外。和其他生成AI的产品相比,Moonvalley 没有更多类似guidance scale、 negative prompt 的输入调节。模型需要专门针对手和脚的微小细节进行训练。比如, 10 个手指、10 个脚趾,这些常识性错误还是会出现在作品中,对付这一问题的办法就是使用否定提示( negtive prompt )。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报。