Getting Started
前提条件
- Node.js 20 以上
- Google AI Studio で発行した Gemini API key
- チャット + avatar を使う場合は、マイク入力と WebGL を使えるブラウザ
- 任意の YouTube Live relay を使う場合は Google OAuth Web client ID
依存関係のインストール
bash
npm installアプリ起動
bash
npm run dev -- --hostname 127.0.0.1 --port 3100http://127.0.0.1:3100 を開き、Gemini API key を入力して Start を押します。
GeminiVRM は現在 gemini-3.1-flash-live-preview 前提で調整しています。 別の Live model を意図的に試すのでなければ、 NEXT_PUBLIC_GEMINI_LIVE_MODEL はこの値のまま使ってください。 古い preview model への自動フォールバックは無効です。
アプリと docs を同時起動
bash
npm run dev:all起動先:
- app:
http://127.0.0.1:3100 - docs:
http://127.0.0.1:4173
最初の成功チェック
- 既定の
Kiyoka.vrmが読み込まれることを確認します。 - Gemini API key を入力します。
- 短い prompt を送ります。
- assistant transcript と音声ストリーミングが始まることを確認します。
Settingsを開き、model、voice、system prompt、motion preset を確認します。
Podcast Mode をすぐ試す
新しいデュアルホスト体験を確認したい場合は次を行います。
Settingsを開き、Conversation modeをPodcast modeに切り替えます。KiyokaとYukitoの viewer が両方 ready になるまで待ちます。- 必要なら
Podcast settingsから最大ループ数と host 別の prebuilt voice を調整します。 - 短い話題を入力して送信します。
- ステージ上で話者が交互に切り替わり、設定したターン数で自動停止することを確認します。
任意の YouTube Relay 設定
配信コメントを Gemini に流し込みたい場合は次を使います。
- アプリで使う origin を許可した Google OAuth Web client ID を作成します。
NEXT_PUBLIC_GOOGLE_CLIENT_IDを設定するか、Settings->Streaming->YouTube relayに client ID を貼り付けます。- Google でログインし、broadcast list を更新して、監視したい active / upcoming stream を選びます。
- relay mode を有効にし、必要なら stream 準備後に auto-reply も有効にします。
- 保存した client ID と短命の access token は、sign-out または期限切れまで browser の local storage から復元されます。
詳しい設定、relay の挙動、トラブルシュートは YouTube Relay Guide を参照してください。
主な環境変数
NEXT_PUBLIC_GEMINI_API_KEYNEXT_PUBLIC_GOOGLE_CLIENT_IDNEXT_PUBLIC_GEMINI_LIVE_MODELNEXT_PUBLIC_GEMINI_LIVE_VOICEBASE_PATHNEXT_PUBLIC_DOCS_URL