谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

行业动态11个月前更新 Max

谷歌 Gemini 2.0 开放文生图功能

3 月 13 日，谷歌推出 Gemini 2.0 文生图功能，支持动态对话式修改，用户可通过自然语言指令来调整图像细节（如修改材质、更改配色、元素增减），这是和其他文生图 AI 工具的最大区别。

单张文生图的速度大约 10 秒/张，并且还可以输出图文混合内容，比如：图文菜谱教程、游戏人物设计等。

实操1：汪汪和喵喵

开启魔法，然后打开 Google AI Studio，入口在这里：https://aistudio.google.com/

用谷歌账号登录即可（没有账号就先注册一个）

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

进入后：

模型要选择：Gemini 2.0 Flash Experimental 【谷歌优化了模型名字：Gemini 2.0 Flash (Image Generation) Experimental ，不仅加了两个字，而且位置还往上挪了，这是怕人不知道哈~）
输出格式请选：Images and text

输入框写指令，比如：生成一只柯基

Gemini 分了三步，第一步文字响应，第二步做图，第三步文字总结。每一步的左下角都有计时。

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

10.1 秒就给我生成了一只坐在地上的柯基。

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

我们可以继续发指令（比如：让它站起来），Gemini 可以继续改图，如下：

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

（柯基出生就有尾巴，是可以不断尾的。图中尾巴末尾看着有点怪？其实是末尾那段是白毛，加上背景是白色，所以…… 嘿嘿）

我们【换一个在背景，晴天、户外草地】，尾巴就正常了。（狗狗的影子也是合理的）

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

狗狗太孤独了，给它加一个狸花猫作伴

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

当然了，并不是每次发指令都返回正确结果。比如：我想给柯基和狸花猫戴墨镜的时候，翻车两次。

① 第一次左下角多了一只猫猫：

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

② 让它删掉左下角的猫，结果又把柯基的墨镜摘掉了。

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

实操2：做菜的图文教程

上点难度，让 Gemini 给我整一个红烧肉的图文教程。

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

十个步骤，截图太麻烦，Max 录了一段视频，想看完整视频的小伙伴可以移步下面的公众号👇🏻：

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

看着是不是还不错？

如果要求不那么精致，也是可以换赛道做个美食博主了，哈哈哈。

实操3：游戏武器

概念图设计，我感觉完全不在话下。

比如设计一把和平精英 556 的突击步枪。

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

Max 不懂设计，也不会 PS，这功能对我这种零基础小白来说，简直就是福音。

昨天下午起断断续续玩了四五个小时，根本停不下来！

Gemini 文生图目前限免开放中，有兴趣可以来试试。

最后

对了，这篇文章封图是让 Gemini 根据一句唐诗解析后再生成的。

谷歌突发王炸！10 秒极速出图，竟能聊天指挥改图？

你知道是哪一句么？请在留言区写下来。

行业动态 # Gemini

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

国产 DeepSeek V3 被秒成”前浪”？谷歌开放最强 Gemini 2.0 全家桶：速度快 60 倍，上下文还长 16 倍！

国产 DeepSeek V3 被秒成”前浪”？谷歌开放最强 Gemini 2.0 全家桶：速度快 60 倍，上下文还长 16 倍！

行业动态 # DeepSeek # Gemini # Google

1年前

0

“李飞飞团队50 美元炼出 DeepSeek R1”被质疑，上海交大本科生新“低成本推理”或成新宠！

“李飞飞团队50 美元炼出 DeepSeek R1”被质疑，上海交大本科生新“低成本推理”或成新宠！

行业动态 # DeepSeek # 李飞飞

1年前

0

刚刚，DeepSeek 开源 DeepEP，推理效率起飞了

刚刚，DeepSeek 开源 DeepEP，推理效率起飞了

行业动态 # DeepEP # DeepSeek

1年前

0

5 人 3 小时复刻开源版 Manus，部署就能用，关键是不用邀请码…

5 人 3 小时复刻开源版 Manus，部署就能用，关键是不用邀请码…

行业动态 # Manus

11个月前

0