SeaHot 創造性を解放しよう
今日、あなたのアイデアを素晴らしいAIアート作品に変えてみましょう
無料トライアル
SeaHot AI - 無料AI 画像ジェネレーター

HappyHorseプロンプトガイド|実際に検証した動画生成テンプレート20選

杉野 りんご
5 分で読める
HappyHorse 1.0で使える動画生成プロンプト20選を紹介。実際にテストして効果を確認したコピー&ペースト可能なテンプレートと、プロンプトの書き方のコツをまとめました。

HappyHorse 1.0がArtificial Analysis Video Arenaのリーダーボードで1位を獲得しました。実際に数日間試してみると、その評価にも納得できます。1080pの動画を、音声同期込みで40秒以内に出力できるのはかなり強いです。

AI動画モデルをいくつも触ってきた方ほど、HappyHorse 1.0の完成度には驚くと思います。ただし、ひとつ注意点があります。HappyHorseは、プロンプトをかなり文字通りに受け取るモデルです。ほかのAI動画モデルのように曖昧な指示をうまく補ってくれるというより、構造がはっきりしたプロンプトの方が安定します。

happyhorse プロンプト

50回以上生成を試す中で、ようやく安定しやすい書き方が見えてきました。この記事では、その中で実際にうまくいったHappyHorse用プロンプトを20個紹介します。そのままコピペしてもいいですし、自分のシーンに合わせて少し調整して使っても大丈夫です。

HappyHorseとは?

HappyHorse 1.0は、Alibabaが公開したオープンソースのAI動画生成モデルです。40層のTransformerアーキテクチャを採用し、合計150億パラメータで構成されています。

Seedance 2.0、Kling 3.0、Google Veo 3.1といった競合モデルと比べても評価が高く、Eloレーティングでは60ポイント以上の差をつけて上回っています。

HappyHorse 1.0 ランキング

主な特徴を整理すると、次のようになります。

  • ネイティブ1080p HD動画を約38秒で生成
  • 音声と映像を1回の生成でまとめて処理できるため、別の音声モデルが不要
  • 7言語のリップシンクに対応し、単語誤り率もかなり低い
  • シネマティック、アニメ、ドキュメンタリー風まで50種類以上のスタイルプリセットを用意
  • ベースモデル、蒸留モデル、超解像モジュールを含む形でオープンソース公開

なかでも印象的なのは、音声と映像の同期です。

たとえば「バリスタがラテアートを注いでいる」と書くだけで、エスプレッソマシンの蒸気音、カップが触れる音、手元の動きがひとつの動画の中で自然につながります。あとから音声を重ねる編集をしなくても、映像と音が最初からまとまりやすいのがHappyHorseの強みです。

そのまま使えるHappyHorseプロンプト集:テキストから動画へ

実際に試して、比較的安定した結果が出やすかったプロンプトをジャンル別に紹介します。

人物・ポートレート

① 地下鉄のバイオリニスト

プロンプト:

A street musician playing violin on a subway platform, commuters passing in soft blur behind him, overhead fluorescent lights creating high contrast, handheld medium shot following his bow movement, echo-heavy acoustics with violin melody.
地下鉄のホームでバイオリンを弾くストリートミュージシャン。後ろをぼんやりした通勤客が行き交い、天井の蛍光灯が高コントラストな光を作る。弓の動きを追うハンドヘルドのミディアムショット。残響の多い音響の中にバイオリンのメロディが響く。

② シンプルなトーキングヘッド

プロンプト:

A woman in her early 30s speaks directly to camera, medium close-up, soft daylight from a window on the right, shallow depth of field, steady framing, speaking Japanese clearly at a natural pace.
30代前半の女性がカメラに向かって話す。ミディアムクローズアップ。右の窓から差し込む柔らかい自然光。浅い被写界深度。安定したフレーミング。自然なペースで日本語をはっきりと話している。

③ 手元だけの料理クローズアップ

プロンプト:

Close-up on hands tearing basil and sprinkling it over a steaming bowl of pasta, warm kitchen lighting, shallow depth of field, slow camera drift, with quiet kitchen ambience audible.
バジルをちぎってパスタの湯気の立つボウルに散らす手元のクローズアップ。温かみのあるキッチンの照明。浅い被写界深度。ゆっくりとしたカメラドリフト。静かなキッチンの環境音が聞こえる。

④ シンプルなスタジオダンス

プロンプト:

A dancer performs a slow, controlled spin in a minimal studio, slow motion, strong rim light from behind, soft shadows, full-body framing, complete silence.
ミニマルなスタジオでダンサーがゆっくりとコントロールされたスピンを披露する。スローモーション。背後からの強いリムライト。柔らかな影。全身のフレーミング。完全な無音。

⑤ ふたりの静かな瞬間

プロンプト:

Two friends sit by a cafe window and share a quick laugh, warm afternoon sunlight, gentle handheld feel, shallow depth of field, with soft cafe chatter and cup clinks audible.
カフェの窓際に座るふたりの友人がさっと笑い合う。午後の温かな陽光。やわらかなハンドヘルド感。浅い被写界深度。カフェの静かなざわめきとカップのチン音が聞こえる。

自然・広大なシーン

① 夜明けのサーフ

プロンプト:

Wide shot of early sunrise over the ocean, rolling surf washes onto dark stones, sea spray catches the first orange light, slow motion, with waves and wind audible.
早朝の日の出を海の上からワイドショットで捉える。波が黒い岩に打ち寄せ、飛沫が最初のオレンジ色の光を受ける。スローモーション。波と風の音が聞こえる。

② 雨の森の靄

プロンプト:

A temperate forest in a light drizzle, static wide shot, thin mist drifting between trunks, raindrops tapping leaves and ferns, with rain on foliage audible.
霧雨の中の温帯林。静止したワイドショット。幹の間を漂う薄い靄。雨粒が葉やシダを叩く。木の葉に当たる雨音が聞こえる。

③ 雪の街灯シーン

プロンプト:

A small residential street at night during thick snowfall, streetlamp glow diffuses through the flakes, snow gathers on fences and car roofs, wide static shot, complete silence.
濃い雪が降る夜の住宅街の小さな通り。街灯の光が雪片を通して滲む。フェンスと車の屋根に雪が積もる。ワイドの固定ショット。完全な無音。

④ 砂漠の雲の影

プロンプト:

Time-lapse of fast-moving clouds casting sweeping shadows across a desert plateau, wide establishing shot, sharp afternoon contrast, with dry wind audible.
砂漠の高原を素早く移動する雲が広い影を落とすタイムラプス。ワイドのエスタブリッシングショット。午後の鋭いコントラスト。乾いた風の音が聞こえる。

⑤ 水中の光の筋

プロンプト:

Underwater scene with tall kelp swaying gently, sunbeams streak down through the water, tiny particles float through the rays, slow upward drift, with muffled underwater ambience audible.
高い海藻がゆっくり揺れる水中シーン。光の筋が水中に差し込む。小さな粒子が光線の中を漂う。ゆっくりとした上方向のドリフト。くぐもった水中の環境音が聞こえる。

素早い動き・カメラワーク

① 夜明けのスプリント

プロンプト:

A runner accelerates along an empty road at dawn, side tracking shot, background streaks with motion blur, cool blue morning light, with breathing and footsteps audible.
夜明けに空いた道を走者が加速する。サイドトラッキングショット。背景がモーションブラーで流れる。冷たい青みがかった朝の光。息づかいと足音が聞こえる。

② 山道のバイク

プロンプト:

A black motorcycle leans through tight mountain turns, low tracking shot close to the road surface, golden late-day light on the asphalt, with engine sound audible.
黒いバイクが急カーブの山道を傾きながら走る。路面に近いローアングルのトラッキングショット。アスファルトに当たる夕方の金色の光。エンジン音が聞こえる。

③ ドローンリビール

プロンプト:

A drone rises from just above the waterline and pulls back to reveal a rugged coastline at sunrise, smooth motion, warm horizon glow, with wind audible.
ドローンが水面のすぐ上から上昇し、引き戻して日の出の荒々しい海岸線を明らかにする。滑らかな動き。温かみのある地平線の輝き。風の音が聞こえる。

④ 屋上ジャンプ

プロンプト:

An athlete jumps between two rooftops at dusk, wide framing, slow motion at the highest point, city lights starting to flicker on, with distant traffic audible.
黄昏時にアスリートがふたつの屋上の間をジャンプする。ワイドフレーミング。最高点でスローモーション。街の灯りが灯り始める。遠くの交通音が聞こえる。

⑤ 草原を駆ける馬

プロンプト:

A chestnut horse gallops across open grassland, side tracking shot, dust kicks up from hooves, mane streams in the wind, warm afternoon light, with hoofbeats audible.
栗毛の馬が広い草原を疾走する。サイドトラッキングショット。蹄から土埃が舞い上がる。たてがみが風にはためく。温かな午後の光。蹄の音が聞こえる。

商品撮影・スタジオ系

① コーヒーを注ぐマクロ

プロンプト:

Extreme close-up of coffee pouring into a ceramic cup, steam rising and swirling, warm studio lighting, slow motion, with the pour sound audible.
陶器のカップにコーヒーが注がれる超クローズアップ。蒸気が立ち上り渦を巻く。温かいスタジオ照明。スローモーション。注ぐ音が聞こえる。

② 機械式時計のマクロ

プロンプト:

Macro close-up inside a mechanical watch, gears turning and the balance wheel oscillating in real time, warm desk-lamp lighting, crisp metallic reflections, with faint ticking audible.
機械式時計の内部のマクロクローズアップ。歯車が回転し、テンプがリアルタイムで振動する。温かいデスクランプの照明。鮮明な金属の反射。かすかな時計の音が聞こえる。

③ 香水のヒーローショット

プロンプト:

A glass perfume bottle rotates slowly on a glossy dark surface, clean studio highlights glide across the bottle edges, a fine mist puff appears briefly, complete silence.
ガラスの香水瓶が光沢のある暗い面の上でゆっくりと回転する。クリーンなスタジオのハイライトが瓶のエッジを滑る。細かなミストがほんの少し現れる。完全な無音。

HappyHorse 1.0 プロンプトの書き方

入れておきたい5つの要素

HappyHorseで安定した動画を作るには、プロンプトに次の5つの要素を入れておくと効果的です。

  • 主体:何が、または誰が中心なのか 【例:「白いエプロンをつけたバリスタ」】
  • 場面:どこで、いつのシーンなのか 【例:「朝の光が差し込むコーヒーショップ」】
  • 動作:何が起きているのか 【例:「スチームミルクをラテに注いでいる」】
  • スタイル・構図:カメラアングルや照明 【例:「クローズアップ、自然な窓の光」】
  • カメラの動き:カメラをどう動かすのか 【例:「ゆっくりドリーイン」または「固定ショット」】

音も指定すると効果的

HappyHorseは音声生成にも対応しているため、必要に応じて音の指示も添えると仕上がりをコントロールしやすくなります。

たとえば、「カフェの環境音、エスプレッソマシンの蒸気音」のように、シーンに合う音を具体的に書いておくと効果的です。

3つのルール

ルール1:動作ではなく主体から書き始める

❌ NG:「森の中を歩いている、ある女性が…」

✅ OK:「ハイキングウェアの女性が森の中を歩いている…」

誰が中心なのかを先に書くと、モデルが主役を捉えやすくなります。

ルール2:カメラワークをはっきり指定する

HappyHorseは、「クローズアップ」と「ワイドショット」を別の指示として受け取ります。寄りで見せたいのか、引きで見せたいのか、カメラアングルは必ず書いておきましょう。

ルール3:プロンプトは30~55語程度に収める

短すぎると、出力が抽象的になりやすくなります。逆に長すぎると、モデルが一部の指示を拾いきれないことがあります。

目安としては、30~55語程度で、具体的かつわかりやすい言葉に絞るのがおすすめです。

画像から動画へのプロンプトのコツ

画像から動画を作るときは、テキストから動画を作る場合とは少し考え方が変わります。

静止画の時点で、被写体、服装、照明、構図はほぼ決まっています。なのでプロンプトでは、画像に写っているものをもう一度説明するよりも、最初のフレームから最後のフレームにかけて何を動かすのかを書く方が大事です。

たとえば、元画像に赤い車と濡れた道路がすでに写っているなら、「濡れた道路に赤い車」と書く必要はあまりありません。その分の言葉は、車がどう動くのか、カメラがどう寄るのか、背景にどんな変化を入れるのかに使った方が結果が安定します。

特に書いておきたいのは、次の3つです。

  • 動きの方向:カメラに向かって歩く、頭を左に向ける、葉が下へ流れる
  • カメラの動き:ゆっくりプッシュイン、右方向へ横移動するトラッキング、固定ショット
  • 付随する動き:髪が揺れる、布がはためく、カップから湯気が立ち上る

ループ動画を作りたい場合は、開始と終了の状態も指定しておきます。

画像から動画へのプロンプトのコツ

たとえば、「最後のフレームが最初のフレームと自然につながるシームレスループ」と書いておくと、モデルが終わり方を意識しやすくなります。この指定がないと、途中のポーズや中途半端な動きで終わることがあります。

静止画からトーキングヘッド動画を作る場合は、音声の指示も入れてください。

「自然なペースで日本語を話し、音声トラックに合わせてリップシンクする」のように書くと、口の動きと音声を合わせる意図が伝わりやすくなります。結果として、口元だけが不自然に動いたり、音声とずれたりする失敗を減らせます。

202604291

HappyHorseプロンプトの使い方

ここまで紹介した20個のプロンプトは、SeaArt AI上でそのまま試せます。SeaArt AIの動画生成ツールにはHappyHorse 1.0が搭載されているため、特別なセットアップは必要ありません。

新規ユーザーには毎日スタミナが無料で付与されます。有料プランに移行する前に、複数のプロンプトを試して自分に合うスタイルを確かめられます。

SeaArt AI 動画生成インターフェース

SeaArt AIでHappyHorseプロンプトを使う手順

ステップ1:SeaArt AIに登録する

まずはSeaArt AIにアクセスし、無料アカウントを作成します。新規ユーザーには無料スタミナが付与されるため、最初から課金しなくてもHappyHorseのプロンプトを試せます。

ステップ2:AI動画生成ツールを開く

ログインしたら、ダッシュボードからAI動画生成ツールを開きます。モデル選択のドロップダウンメニューがあるので、一覧からHappyHorse 1.0を選びます。

モデルを選ぶ画面

ステップ3:生成モードを選ぶ

生成方法は、大きく分けて2つあります。

🔸 テキストから動画

この記事で紹介したプロンプトを、そのまま入力欄に貼り付けます。HappyHorseがプロンプトの内容をもとに、ゼロから動画を生成します。

🔸 画像から動画

参考画像をアップロードし、その画像をどう動かしたいかをプロンプトで指定します。参考画像は、SeaArt AI上でGPT Image 2.0、Seedream、FLUXなどを使って作成したものでも問題ありません。

生成モードの選択画面

ステップ4:プロンプトを貼り付けて生成する

入力欄にプロンプトをコピー&ペーストして、生成を開始します。最初の1枚は設定を変えずにそのまま走らせてみてください。出力を見てから、カメラアングルや動きの強度を調整するのが手順として自然です。

同じプロンプトで2~3パターン生成して並べてみると、どの方向性が自分の意図に近いか判断しやすくなります。

よくある質問

HappyHorseのプロンプトはどれくらいの長さが理想ですか?

目安は30~55語ほどです。短すぎると指示が曖昧になり、どこにでもありそうな動画になりやすくなります。逆に60語を超えると、モデルが一部の内容を拾いきれないことがあります。

主体、動き、カメラ、音の情報を入れつつ、できるだけ簡潔に書くのが扱いやすいです。

同じプロンプトなのに結果が安定しないのはなぜですか?

同じプロンプトでも、HappyHorseの出力には少しばらつきがあります。これはAI動画モデルではよくあることです。

対策としては、1つのプロンプトにつき2〜3パターン生成し、その中から一番よいものを選ぶのがおすすめです。あわせて、主体、状況、動き、スタイル、カメラワークの5つが入っているかも確認してみてください。どれかが抜けていると、仕上がりが不安定になりやすいです。

HappyHorseで音声を入れるにはどうすればいいですか?

HappyHorseは、プロンプトの内容をもとに音声も自動で生成します。

プロンプトの最後に、音の情報を足しておくと伝わりやすくなります。たとえば「カフェの環境音、エスプレッソマシンの蒸気音」や「セリフ:『行こう。』」のように書きます。

リップシンクを使いたい場合は、話してほしい言葉を引用符の中に正確に入れてください。HappyHorseは、対応言語の音素に合わせて口の動きを生成します。

HappyHorseは複数言語のプロンプトに対応していますか?

HappyHorseは複数言語のプロンプトに対応しています。

ただし、安定した結果を狙うなら英語プロンプトの方が使いやすいです。モデルの学習データが英語中心のため、日本語よりも英語の方が意図が伝わりやすい場面があります。セリフやリップシンクについては7言語に対応しており、音声と口の動きを合わせた動画も作れます。

まとめ

何度か試して分かったのは、HappyHorseは曖昧な指示をうまく補ってくれるタイプのモデルではない、ということです。

Seedance 2.0のように、足りない部分を自然に埋めてくれる柔軟さはあまりありません。その代わり、主体、状況、動き、カメラアングル、音の指示をきちんと書くと、かなり完成度の高い動画が出てきます。

今回紹介した20個のプロンプトは、そのまま試してもいいですし、自分の作りたいシーンに合わせて少しずつ変えて使っても大丈夫です。

基本は、主体、状況、動き、スタイル、カメラワークの5つです。30~55語を目安にしながら、カメラアングルや照明、音の情報を具体的に入れてください。同じプロンプトでも、出力には少し差が出ます。1回だけで判断せず、2~3パターン生成して比べると、残したい動画が見つかりやすくなります。

まずはSeaArtのAI動画生成ツールで、気になるプロンプトをひとつ試してみてください。どの指示が効きやすいのか、どこを具体的に書くべきなのかが、実際の出力を見るとかなり分かってきます。