MEDIUM

BLOG

ブログ

【Whisk】動画生成AI解説 #5

DIVE in AI
サムネイル画像

はじめに

トップページのメインビジュアルに採用している動画は、動画生成AIを活用したものです。
2025年5月から6月にかけて、最先端のツールを用いて試行錯誤しながら11の動画を生成しました。
生成の過程を中心に、動画生成AIの特徴やコツ、実際のプロンプト(AIに生成してほしい内容を伝えるための指示文)をみなさまに共有します。
第5回の記事では、モバイル版のメインビジュアルで流れる「青空の下の女性」の動画をテーマにご紹介いたします。

※本記事で紹介するWhiskは、執筆時点(2025年7月)では試験運用版として提供されています。本記事は、将来の本運用版に向けた先行情報として、その機能やプロンプトのコツを解説するものです。

Whiskとは?

Whiskは「アイデアの試行錯誤、調整、組み合わせは、簡単かつ視覚的に、友人と一緒に作業するような感覚で行える」よう、Googleが挑戦した「試験運用版メディア生成ツール」です。プロンプト作成に関する知識が少なくても使用しやすいAIツールと言えるでしょう。
詳細はWhisk ヘルプセンターをご覧ください。

今回の記事では、AIで動画を生成するための基となる画像を生成するために使用したWhiskを中心にご紹介します。動画生成に使用したFlowについては、以下の2つの記事で詳しく紹介しておりますので是非ご一読ください!
【Flow】動画生成AI解説 #3
【Flow】動画生成AI解説 #4

Whiskの設定項目について

Whiskの画像生成設定画面。画面上部、下部、左側に設定項目が並んでいる。
以下は筆者がピックアップした項目ですので、UIを探っていくと他にも設定項目があります。一部の主要な設定項目として参考にしていただければと思います。
– 画面上部
画面上部には3つのボタンが並んでいます。左から、画像生成、動画生成、お気に入り、それぞれの画面に切り替えるためのボタンです。
今回はWhiskでの画像生成について解説いたしますので、先のキャプチャは画像生成をするための画面です。
動画生成をするためには、まずWhiskで画像生成をする必要があります。また、生成物をお気に入りに登録すると、お気に入りの画面でいつでも閲覧することができます。
– 画面左側
モデル、背景、スタイルの3点に分けて、テキストか画像で設定することができます。これが、Whiskが理想とする「簡単かつ視覚的」な画像生成ができるポイントだと思っています。
生成する画像に取り入れたい要素を明文化し、AIに指示するためのプロンプトとして適切な状態に整形するというこれまでの画像生成に不可欠だったプロセスを、画像のアップロードという簡単な操作でほぼ完結するからです。
さらに、画像に含まれる要素を3点に分けることで、ピンポイントで詳細な指示をAIに出しやすくなります。
– 画面下部
画面左側で設定した要素に追加したい情報をテキストで入力する欄、ランダムでテキストを生成するボタン、縦長・横長・正方形の3種類からアスペクト比を選択するボタン、シード値とAIモデルを選択するボタンが並んでいます。
この中で筆者が初めて触れた要素として、シード値というものがあります。シード値とは、ランダムな出力のそれぞれに割り振られる識別番号です。通常、同じプロンプトを同じAIに入力しても異なる画像が出力されますが、同じプロンプトと同じシード値を指定することで似た画像を出力しやすくなります

モデル、背景、スタイルの設定方法

Whiskの画像生成設定画面左上部分。モデルという要素に画像が当てはめられている。
先ほどWhiskのポイントであると述べた、モデル、背景、スタイルを画像アップロードで指定する際の設定方法について3点で共通する部分を解説します。
– ランダムで画像を適用、枠を追加
まず画像をアップロード、あるいはテキストを入力する前から設定できるのは、Whisk側がランダムで画像を適用してくれる機能と、枠を追加することです。例えば画像内に人と犬を配置したい、かつ人と犬をそれぞれ別の画像で設定したい場合に枠を追加することで対応できます。
– 画像をダウンロード、削除
Whisk側がランダムで画像を適用してくれる機能を使った場合、その画像をダウンロードすることができます。また、適用された画像をボタンで削除することも可能です。
– 参照する or しない
画像をアップロード、あるいはテキストを入力したら、それを画像生成の際に参照するかしないかをチェックマークのボタンで切り替えることができます。完全に削除することなく切り替えることができるので、生成の試行錯誤に向いている機能だと感じます。
– プロンプトを表示
Whiskの画像生成設定画面でモデルに適用させた画像のプロンプトを表示しているモーダル。
アップロードした画像、あるいはWhiskがランダムで適用した画像が、どのようなプロンプトに変換されているのかをモーダル表示することができ、さらにそのモーダル内でプロンプトを編集することもできます。
Whisk内で利用するにあたってもちろん有用な機能ですが、Whisk以外のAIツールを利用する際にも参考になります。どのようなプロンプトが生成AIに理解されやすいのか、そのお手本が画像から生成される点が素晴らしいと考えます。特に画像生成や動画生成においては英語のプロンプトを求められる場面が多いため、ここで生成されたプロンプトから学ぶことはとても多いです。

Whiskで動画を生成できるのか?

Whiskの画像生成設定画面。AI生成されたティーカップの画像が2枚並んでいる。
Whiskでは、画像生成だけでなく動画生成も可能です。
まず画像を生成し、それをアニメーション化させるという手順を踏む必要があります。
上記画像のように、生成した画像にマウスカーソルを乗せると左上に「アニメーション化」というボタンが現れるのでクリックしてください。
どのようなアニメーションをつけるのかは、プロンプトで指示する必要があります。

ご紹介する動画の基本情報

WhiskとFlowで生成した青空の下の女性の動画の一場面
- モチーフ:女性
- 画像生成AI:Whisk(Imagen4)
- 動画生成AI:Flow(Veo2-Fast)
- カメラワーク:ドリーアウト(Dolly out)
- 始点フレーム:青空の下の女性
- 動画生成プロンプト全文
Under clear skies, they are dancing contemporary dance.
動画生成のポイントは?
ポイントはWhiskで生成した画像のクオリティを維持して動画化したことです。
Under clear skies(快晴の空の下)という表現で、画像の状況を引き継ぐことを明確にしています。

おわりに

今回はWhiskの導入と特長について解説しました。
執筆時点(2025年7月)では試験運用版として提供されていますが、本格リリースに向けてとても期待できるツールだと思います。ぜひ一度利用してみてください。
今後、Whiskで生成したプロンプトを他のAIツールで利用した実例もご紹介予定です。

弊社では動画生成以外にも、さまざまなAI活用に取り組んでおります。お気軽にご質問、ご相談くださいませ。