本來我是不跟風的,我都把 AI 算力資源投入在更有意義的事務上(例如:用人工智慧對抗社會不公不義 歡迎來到 AI 陳抗世界)。但因為有朋友要求示範,那既然都示範生成了這些圖片,就順便來發表一下使用心得。
目前經驗上覺得, Google AI Studio 工具的生成品質,細膩程度比較高, Google Gemini 工具則較普通。雖然兩個工具背後都是 Google Gemini 多模態 AI 模型,但專門用途比較不同吧, Google AI Studio 工具的功能更進階、專業,生成品質較優。
比方說 Google Gemini AI 置入於安卓、信箱、地圖、搜尋、相簿、雲端硬碟、廣告等, Google Gemini 在這些 Google 產品生態系統中,各自扮演不同的角色任務。
而近期關於 AI 公仔手辦的新聞事件,主要圍繞著網友利用 Google AI 繪圖模型來生成個人或寵物的公仔概念圖,並探討了這個新興趨勢背後的相關議題。
Nano Banana 帶動的 AI 公仔熱潮
Google 的 Nano Banana ( Gemini 2.5 Flash Image )近期在網路社群上引發了一股將個人照片、寵物照片轉化為擬真公仔手辦圖的風潮。
以下就是透過 Google AI Studio 最新的 Nano Banana 模型( Gemini 2.5 Flash Image 模型),所製作的人像公仔圖片。
附1張照片的處理

附2張照片的合成

要求 AI 再重新生成一張

換一個”舞台”場景好了,看看效果如何?

換成”伸展台”如何?

2人再合體一下

光是圖片好像不夠有趣喔,我們再用 Google Gemini Veo 3 影片模型,讓圖片動起來。 既然是伸展台,那就來個走秀吧~
當然,也可以浪漫一下啊~
嗯,我們也讓圖片中的宋杯杯動起來吧~
走秀、握手,還不夠看?! 那就來跳舞吧!~~~
以上就是透過 Google Gemini 的 Veo 3 影片模型,讓人像公仔,在伸展台走秀的影片,話說 AI 搭配的背景音樂還滿有感的。
相關技術名稱與連結:
- Google AI Studio
- Nano Banana
- Gemini 2.5 Flash Image
- Veo 3 Fast
在此附上 Google Gemini 對於 Nano Banana AI 的說明。
Gemini:”Nano Banana (奈米香蕉) 是 Google 最近推出的一個強大的 AI 圖像生成和編輯模型,其正式名稱為 Gemini 2.5 Flash Image。
它之所以被稱為「奈米香蕉」,是因為它擁有小巧且極快的運算速度,能讓使用者透過簡單的文字指令,迅速完成複雜的圖像生成與編輯任務。
主要特色與功能
圖像一致性(Consistency):這是 Nano Banana 最強大的特色之一。過去的 AI 繪圖模型在多次修改或生成不同場景時,很難保持人物或物件的外觀一致。但 Nano Banana 能夠記住角色的特徵,讓你在不同背景、服裝或姿勢下,仍然保持角色樣貌的連貫性。這對於品牌行銷、漫畫創作或個人作品集來說,是一項革命性的突破。
自然語言操作:使用者不需要寫複雜的程式碼或專業指令,只要用日常語言描述需求,例如「把背景換成海邊」、「讓人物穿上藍色 T 恤」或「把這張圖變成公仔風格」,它就能立即生成相應的圖片。
多圖融合與局部編輯:它可以同時處理多張圖片,並將它們融合成新的作品,例如將產品圖片放入不同的展示場景中。此外,它也支援精準的局部編輯,使用者可以只針對圖片的特定區域進行修改,如調整光影、改變髮型或修復細節。
快速生成:如其名,Nano Banana 的生成速度非常快,能在幾秒鐘內產出高品質的圖像,大幅提升創作效率。
如何使用 Nano Banana?
目前,使用者可以透過以下兩種主要方式體驗 Nano Banana 的功能:
Google Gemini 應用程式:在 Gemini 介面中選擇 Gemini 2.5 Flash Image 模型,上傳圖片並輸入指令即可。
Google AI Studio:這是一個更進階的平台,使用者可以在這裡選擇並使用 Nano Banana 模型,進行更專業的圖像生成與編輯。
總結來說,Nano Banana 是一個兼具速度與精準度的 AI 圖像工具,它將繁瑣的修圖與創作過程變得簡單且直觀,讓更多人能夠輕鬆實現自己的創意想法。”
2025.09.07
