谷歌 Gemini 2.0 开放文生图功能
3 月 13 日,谷歌推出 Gemini 2.0 文生图功能,支持动态对话式修改,用户可通过自然语言指令来调整图像细节(如修改材质、更改配色、元素增减),这是和其他文生图 AI 工具的最大区别。
单张文生图的速度大约 10 秒/张,并且还可以输出图文混合内容,比如:图文菜谱教程、游戏人物设计等。
实操1:汪汪和喵喵
开启魔法,然后打开 Google AI Studio,入口在这里:https://aistudio.google.com/
用谷歌账号登录即可(没有账号就先注册一个)

进入后:
- 模型要选择:Gemini 2.0 Flash Experimental 【谷歌优化了模型名字:Gemini 2.0 Flash (Image Generation) Experimental ,不仅加了两个字,而且位置还往上挪了,这是怕人不知道哈~)
- 输出格式请选:Images and text
输入框写指令,比如:生成一只柯基
Gemini 分了三步,第一步文字响应,第二步做图,第三步文字总结。每一步的左下角都有计时。

10.1 秒就给我生成了一只坐在地上的柯基。

我们可以继续发指令(比如:让它站起来),Gemini 可以继续改图,如下:

(柯基出生就有尾巴,是可以不断尾的。图中尾巴末尾看着有点怪?其实是末尾那段是白毛,加上背景是白色,所以…… 嘿嘿)
我们【换一个在背景,晴天、户外草地】,尾巴就正常了。(狗狗的影子也是合理的)

狗狗太孤独了,给它加一个狸花猫作伴

当然了,并不是每次发指令都返回正确结果。比如:我想给柯基和狸花猫戴墨镜的时候,翻车两次。
① 第一次左下角多了一只猫猫:

② 让它删掉左下角的猫,结果又把柯基的墨镜摘掉了。
实操2:做菜的图文教程
上点难度,让 Gemini 给我整一个红烧肉的图文教程。

十个步骤,截图太麻烦,Max 录了一段视频,想看完整视频的小伙伴可以移步下面的公众号👇🏻:

看着是不是还不错?
如果要求不那么精致,也是可以换赛道做个美食博主了,哈哈哈。
实操3:游戏武器
概念图设计,我感觉完全不在话下。
比如设计一把和平精英 556 的突击步枪。

Max 不懂设计,也不会 PS,这功能对我这种零基础小白来说,简直就是福音。
昨天下午起断断续续玩了四五个小时,根本停不下来!
Gemini 文生图目前限免开放中,有兴趣可以来试试。
最后
对了,这篇文章封图是让 Gemini 根据一句唐诗解析后再生成的。

你知道是哪一句么?请在留言区写下来。
© 版权声明
文章版权归作者所有,未经允许请勿转载。