Geminiとは

”Gemini(ジェミニ)とは、Googleが開発・提供する、テキストだけでなく画像や音声、コードなど複数の情報を処理できるマルチモーダル対応の生成AIです。文章作成、要約、翻訳、情報収集、画像生成、コード作成など多様な機能を持ち、 GmailやYouTubeなどのGoogleサービスと連携して、個人やビジネスの様々な作業を効率化します。2024年2月には、それまでのGoogleの対話型AIサービス「Bard(バード)」がGeminiに統合され、より強力なAIとして進化しました。”
最近GoogleJapanさんの
”Gemini に写真をアップして、リアルなフィギュアの画像を生成しよう!”
というXへの投稿を目にしました。
幾つかサンプルが上げられていてこれは面白い!と思い早速試してみました。
幾つかサンプルが上げられていてこれは面白い!と思い早速試してみました。
試してみた
既に使いこなしている方々にとってはなんてことない話だと思いますが・・・
出来上がりのクオリティには少なからず波があって、手首などの関節がいかにもフィギュアっぽい仕上がりになっていて、そのまま”フィギュアだよ”と言っても通用しそうなものから、ただ写真のキャラクターが立体的に再現されているだけのものまで様々です。
全部を載せることはできないので、気になった部分だけ切り出してみました。
同じ日の同じ服装、同じショルダーバッグを方から斜め掛けした1枚の写真がベースですが、背景その他の指示を少し変化させた2枚です。
基本はサンプルのプロンプトに従っていて、手のポーズや立ち位置は指示していません。
![]() |
フィギュアっぽい出来栄え① |
![]() |
フィギュアっぽい出来栄え② |
元写真は、とある建物の2階屋外テラスで左手は柵に乗せ、右手は下におろして斜めにこちらを見ているバストショットで、右手や胸より下は写っていません。
パンツは写っていないのでその色を想像することはできない写真ですが、フィギュアは黒いパンツを履いています。
実際にはベージュのチノ風パンツを履いていました。
面白いのは、①と②の結果で微妙に体の向きが異なることです。
②は限りなく正面を向いていて下両足の間の隙間が見えていますが、①は少しモデル立ちに近い感じで足を揃えています。
面白いですね!
どちらも手首の関節がいかにもフィギュアっぽい可動関節になっていて、手の握り方も2枚で異なりますが、どちらもフィギュアっぽいですよね。
こちらは全身が写った写真を元にして生成させたものです。
![]() |
フィギュアっぽくない出来栄え |
バッグの色や形状はともかく、パンツや靴の色はそのまま再現されています。
ただ、こちらは足元のアクリルベースが無くて机の上に載っているというシチュエーションを無視すると、単に元の写真を立体化させただけのように見えます。
手首も元写真そのままでフィチュア感はゼロです。
出来上がった写真も①や②にはちょっとコケティッシュな面白さ感があるのに対して、3番目の画像は元の写真と大差なくて面白みがありません。
この辺は、他にも幾つか試してみたのですが、どうも全身が写っている写真はそのまま元の写真に近い仕上がりになっていて面白みがありません。
写っていないボディーパーツを補完する過程で遊び心というか面白さが生まれてくるような気がします。
ここには載せませんが、3人の人物が写ったテーブル越しのバストアップの写真を処理してみると、3人が立っている状態のフィギュアが出来上がりました。
”ひざまづいてるポーズ”を指定すると期待通りにひざまづいたフィギュアになります。
3人とも下半身は全く見えていないのに、1人はスカートで1人はパンツだったり、指示し直すごとに特に指示していない部分に微妙な違いが出たりして、これはこれで面白いなと思いました。
ただ、同じ指示の流れで微調整を繰り返していると画像が荒れてくる傾向が見られました。
特にフィギュア横の箱のパッケージ画像の劣化が顕著でしたが、理由はわかりません。
ちなみに、”少しだけアニメっぽくして”と指示したら頭部だけ完全にアニメキャラになって首から下は全く変化しなかったのでちょっと残念でした。
![]() |
首から下はそのままで顔だけアニメ顔 |
しかもこれ、頭部は立体感ゼロのベタなアニメ顔なので首から下との組み合わせがアンバランスすぎて使えません。
飛行機写真で試してみた
信州まつもと空港で撮った飛行機の写真で試してみました。
離陸に向けてプッシュバックされているJ-AirのエンブラエルE-170機を真正面から捉えた写真です。
夏限定伊丹便の最終日フライトJA211Jです。
![]() |
プッシュバックされるJ-Airのエンブラエル170機 |
基本はフィギュアのプロンプトと一緒ですが、”キャラクタ”を”飛行機”、”1/7スケール”を”1/72スケール”に変えたくらいで、あとは”背景には信州まつもと空港の窓から美しい空と滑走路が見える”と指示を入れました。
出来上がった写真がこれです。
![]() |
Geminiが生成した写真 |
トーイングカーまで再現されるとは思っていなかったので、空中に浮かぶトーイングカーに少し驚かされました。
また、フィギュアの向きは少し左向き、ボックスの写真は少し右向きになっていて、なんだか不思議な感じがしました。
完全に真正面から捉えた写真を食わせているので尾翼の赤い鶴丸はほぼ見えていないんですが、なんとなくそれっぽいマークが付いているような雰囲気が再現されています。
楽しい
使いこなしている人は”何をいまさら”と思われるでしょうが、これは楽しいです。
旅行や家族の集合写真等をこんな風にフィギュア化して、いつものなんてことない写真の代わりにコルクボードにこんなちょっと面白い写真をペタペタ貼っていったら、すごく楽しくなりそうです。
プロンプトをチョコチョコ変えてみてその結果を楽しむのもまた一興です。
これ、出来上がった写真の著作権ってどうなるんですかね、そこが少し気になります。
Geminiに聞いてみた結果の結論部分をコピペしておきます。
”結論
ご自身の写真を元に生成AIに加工させた場合、その加工された画像に著作権が発生するかどうかは、その過程でご自身がどれだけ創作的に関与したかによって変わります。
ほとんどAI任せで、創作的な関与が少なければ、著作権は発生しない可能性が高いです。
元の写真の選定、プロンプトの工夫、加筆・修正など、ご自身の創作意図が強く反映されていれば、著作権が発生すると考えられます。
また、生成された画像を公開したり、商用利用したりする際は、AIの利用規約も確認しておくことが重要です。規約によっては、商用利用が制限されている場合や、生成物に関する権利について規定されている場合があります。
ご自身の写真の著作権はご自身にあるため、AIに加工させること自体は問題ありませんが、生成AIの著作権に関する議論はまだ発展途上であり、今後の法整備や判例の動向に注目していく必要があります。”
余談
余談ですが、先述の3名の集合写真をCopilotにほぼ同じプロンプトで食わせてみたら、リアル感が無いアニメ画像的なフィギュア写真が生成されました。
まぁ、これはこれでフィギュアなんでしょうが・・・
![]() |
Copilotが生成した画像 |
”両端は女性で真ん中は男性なんだけど”
と追加で指示を出すと
”ご指摘ありがとうございます!ちゃんとキャラクターの配置を修正して、両端が女性、真ん中が男性になるように再構成しました”
と言いつつ、今度はどう見ても女女男で生成してきました。
![]() |
Copilotがやり直し生成した画像 |
しかも全員顔つきが最初と違う!
そして右はどう見ても最初の生成画像より男っぽい。
ちょっとね、何をどう理解して変えたのかわからない変化です。
2枚とも一番右は男、真ん中と左は女にしか見えません。
しかも、トリミングしてあるので見えていませんが、フィギュア横の箱のパッケージ写真は元写真がデフォルメされて、一部はフィギュアのキャラの顔と同じようなアニメ顔になったりして、クオリティはGeminiとは比べ物になりませんでした。
オリジナルの人の顔が判別できないくらい変形しちゃっているので、
”どう?面白い写真ができたんだけど”
と言って写っている人に印刷して差し上げることは”絶対”にできないほどひどい画像になっていました。
もっともこのへんはCopilot用にちゃんとプロンプトを指示してあげればよいのかもしれませんが、そこまでは試していません。
なにはともあれ、今後は写真整理が楽しくなりそうです。
※ネットに画像をアップロードしてクラウドで生成されるので、アップロードした画像の使われ方やプライバシー等には各自ご注意ください
0 件のコメント:
コメントを投稿