freshcrate
Skin:/
Home > AI Agents > nano-banana-pro

nano-banana-pro

# Manga-Autonoma (powered by nano-banana-2) Autonomous AI 4-panel manga production system using Gemini API. / Gemini APIを活用した、完全自律型AI4コママンガ制作システム。

Why this rank:Recent releaseHealthy release cadenceStrong adoption

Description

# Manga-Autonoma (powered by nano-banana-2) Autonomous AI 4-panel manga production system using Gemini API. / Gemini APIを活用した、完全自律型AI4コママンガ制作システム。

README

Nano Banana 2 Powered Super AI 4-koma System

"To what extent can humans step away from the creative process?" 「人間は、どこまで制作から降りられるのか?」

An experimental web application that leads AI manga production beyond "automation" to full "unmanned" autonomy. AIによるマンガ制作を「自動化」ではなく、その先にある「無人化」へと導く実験的Webアプリケーション。

Tip

Detailed Commentary Available / 詳細な解説記事を公開中 For insights into the design philosophy and behavior differences between Google Gemini API models, please refer to the following note article. / 本プロジェクトの設計思想や、Google Gemini APIのモデル毎の挙動の違いについては、以下のnote記事で詳しく解説しています。 AIマンガ制作を「自動化」ではなく「無人化」へ / Beyond Automation: Toward "Unmanned" AI Manga Production (note / Japanese content)


🚀 Overview / 概要

This project aims to intentionally exclude humans from the creative process, allowing AI to act as a director and complete everything from brainstorming to composition, direction, and rendering. 本プロジェクトは、人間をクリエイティブな工程から意図的に排除し、AIがディレクターとして「ネタ出し・構成・演出・作画」のすべてを完結させることを目的としています。

Sample Output Retro Sample

🎥 Operation Tutorial / 動作手順動画

https://www.youtube.com/watch?v=wmC8BgKliKk (Click to watch / 動画を再生)

📺 Introduction / 解説動画

https://www.youtube.com/watch?v=FmSQ267vrZg (Click to watch / 動画を再生)


📰 Media & Community / メディア掲載・コミュニティ


💡 Concept: Full Autonomy / コンセプト:制作からの完全離脱

Unlike conventional AI tools that assist humans, this system is based on the following philosophy: 従来のAIツールが「人間の補助」であったのに対し、本システムは以下の思想に基づいています。

  • Dynamic Trend Sync / トレンド動的同期: Dynamically acquires the latest news to self-select topics based on current social trends. 実行当日の最新ニュースを動的に取得。社会情勢に合わせたネタをAIが自ら選定します。
  • Unmanned Direction / 無人ディレクション: AI self-constructs the plot and determines the 4-panel structure without human intervention. 人間の指示を待たず、AI自身がプロットを組み立て、4コマの構成を決定。
  • Physical Identity Enforcement / 同一性の物理的強制: Maintains high-precision character consistency across all panels through a unique protocol. 独自のプロトコルにより、キャラクター造形を全コマで高精度に維持します。

✨ Features & Modes / 機能とモード

📅 Date-Specified News Search / 日付指定ニュース検索

Users can specify a target date to retrieve and visualize past news trends. 対象の日付を指定して、過去のニュースを取得・漫画化できます。

  • Categories: General, Technology, Business, Entertainment, Science, Health, Sports, Art.

✏️ Manual Input Mode / 自由入力モード

A "Free Input" mode allows users to generate manga from any text, such as personal diaries or specific creative prompts. 自由にテキストを入力して漫画を生成できるモードです。個人的な日記や、特定の創作ネタなど、ニュース以外のトピックも扱えます。

Note: Direct URL input is often blocked by security (403 errors). Copy-pasting the article text is recommended. URLの直接入力はセキュリティによりブロックされることが多いため、記事のテキストを直接コピペすることを推奨します。


🔍 Deep Analysis (技術詳解)

🏗️ Unique Architecture Highlights / 固有アーキテクチャの要点

This system is not a simple "prompt-and-generate" tool. It is a multi-stage compiler that transforms raw news into finished manga through a series of autonomous processing layers. 本システムは単純な「プロンプト→生成」ツールではありません。生のニュースから完成漫画までを自律的な処理レイヤーの連鎖で変換する マルチステージ・コンパイラ です。

  • Fully Autonomous "Storyboard-to-Screen" Pipeline: The entire workflow — from news retrieval → scenario generation → cast analysis → prompt compilation → image generation — runs end-to-end with only an API key. Zero human intervention produces a finished manga. ニュース取得→シナリオ生成→キャスト解析→プロンプト組立→画像生成の全5ステップを、APIキー入力のみで一気通貫。人間の介入ゼロで完成漫画を出力します。

  • Cross-Stage Character Identity Lock: Character information born in Step 2 (Scenario) is transformed into an Identity Matrix in Step 3 (Prompt Compilation) and injected into every panel of Step 4 (Image Generation). This cross-stage consistency guarantee is a design unique to this system. Step 2で生まれたキャラ情報をStep 3でIdentity Matrix化し、Step 4の全パネルに注入。ステージを跨いだ一貫性保証は他のAI漫画ツールにない設計です。

  • Scenario → Prompt Compiler: An intermediate processing layer that "compiles" AI natural language scenarios into structured image prompts. Emotion tags → VFX conversion, camera names → lens distortion tag mapping, and speaker analysis → placement rule generation are all fully automated. AIの自然言語シナリオを構造化プロンプトに「コンパイル」する中間処理層。感情タグ→VFX変換、カメラ名→レンズ歪みタグ変換、話者解析→配置ルール生成を全自動で行います。

  • Deterministic Camera Diversity: Fisher-Yates shuffle mathematically guarantees that all 4 panels use different camera angles — the probability of any two panels sharing the same angle is zero. Fisher-Yatesシャッフルにより、4パネルが同じカメラアングルになる確率を数学的にゼロにします。

🇯🇵 [JP] コード解析によるAI漫画システム詳解

本システムの設計思想、Absolute Physical Geometry Lock(絶対的物理ジオメトリロック)、Weighted Immutable Prompts(重み付き不変プロンプト)などのコア技術、および法的・哲学的な考察を含む詳細な解析レポート(日本語版)です。

🇺🇸 [EN] Comprehensive Analysis of Autonomous AI Manga System

A detailed analysis report (English version) covering the system's design philosophy, core technologies such as Absolute Physical Geometry Lock and Weighted Immutable Prompts, and legal/philosophical considerations.


🛠 Featured Protocols: Super FURU Manga Protocol / 搭載プロトコル

  1. ABSOLUTE PHYSICAL GEOMETRY LOCK Controls 4-panel layout, aspect ratio, and perspective at the pixel level to suppress hallucinations. レイアウト、アスペクト比、パースをピクセル単位で制御。ハルシネーション(AIの誤描画)を物理的に抑制します。

  2. Weighted Immutable Prompts Weights character-specific features to prevent "fusion" or blending between characters. 特徴量に重みを付与。キャラ同士が混ざり合う「フュージョン」を徹底的に防ぎます。

  3. Animation Quality (Level EX-2) Emulates physics-based lighting and SSS (Subsurface Scattering) for peak animation quality. 物理ベースのライティング、SSS(肌の透過)をエミュレート。最高峰のアニメクオリティを追求します。

  4. ANTIGRAVITY HYPER-DYNAMIC CAMERA PROTOCOL (v4.0) AI-selected camera names (bird's eye, fish-eye, dutch angle, etc.) from the scenario stage are automatically converted into specific lens distortion weight tags during image generation. Fisher-Yates shuffle mathematically guarantees all 4 panels use different camera angles. AIがシナリオ段階で選んだカメラ名(俯瞰、フィッシュアイ、ダッチアングル等)を、画像生成時に具体的なレンズ歪みウェイトタグへ自動変換。Fisher-Yatesシャッフルにより4コマ全てが異なるカメラアングルになることを数学的に保証します。

  5. IDENTITY MATRIX — Autonomous Character Consistency (v2.25) Automatically analyzes hair color, hairstyle, and glasses status from character sheets and injects a "verification matrix" into every panel's prompt, forcing the AI to self-verify before drawing each panel. Includes anti-clone prevention (no duplicate character drawing), automatic background cast placement, solo shot detection, and 3-zone slotting for 3-character dialogues. キャラクターシートから髪色・髪型・メガネ有無を自動解析し、全コマのプロンプトに「照合マトリクス」として注入。AIが各コマを描く前に自己検証を強制します。クローン防止(同一キャラの二重描画禁止)、背景キャスト自動配置、ソロショット判定、3人掛け合い時のゾーンスロッティングまで全自動です。

  6. Emotion Style Tag System — Per-Panel Art Style Switching The scenario AI autonomously selects the optimal style tag for each panel's emotion (CHIBI_GAG / GEKIGA / SHOUJO / HORROR / BLANK / IMPACT, etc. — 11 styles). Art style, VFX, and proportions are automatically switched during image generation. Includes fallback styles for multi-character panels. シナリオ生成AIが各コマの感情に最適なスタイルタグ(CHIBI_GAG / GEKIGA / SHOUJO / HORROR / BLANK / IMPACT等11種)を自律選択。画像生成時に絵柄・VFX・プロポーションが自動切替されます。マルチキャラパネル用のフォールバックスタイルも搭載。


💻 Tech Stack / 技術スタック

  • Frontend: React 19 / Vite 7 / Tailwind CSS v4
  • LLM/VFM: Google Gemini API (3.x Flash / 2.5 Flash / 2.5 Pro) + Gemini Native Image Generation
  • Logic: Zenith Protocol — Multi-tier model fallback (5-model text cascade, 4-model image cascade) with automatic 429/404 retry and account-level model auto-discovery.

📝 Setup & Launch / セットアップと起動

🌍 Cloud / Browser (Deploy)

  1. Get API Key: Obtain a Gemini API key at Google AI Studio. Google AI Studio で Gemini API キーを取得してください。
  2. Access: Open the deployed web app. Webアプリにアクセスし、APIキーを入力してスタートします。

    Demo Link / デモサイト: https://furuyan1234.github.io/nano-banana-pro/

💻 Local Launch (Windows) / ローカルでの起動 (Windows)

You can launch strict local environment with a single click. 以下の手順で、ローカル環境で簡単に起動できます。

  1. Download: Download the Source Code (ZIP) from Releases or click "Code" -> "Download ZIP". Releases または "Code" ボタンからZIPファイルをダウンロードします。
  2. Unzip: Extract the ZIP file to any folder. ダウンロードしたZIPファイルを解凍してください。
  3. Run: Double-click start_app.bat. フォルダ内の start_app.bat をダブルクリックします。 (Node.js required / 事前にNode.jsのインストールが必要です)
  4. Start: The system will automatically install dependencies and launch the browser. 必要なライブラリが自動インストールされ、ブラウザが立ち上がります。

⚖️ Compliance & Legal Stance / 法的遵守について

Japanese Copyright Law (Article 30-4)

This project is developed in full compliance with Article 30-4 of the Japanese Copyright Act, which allows for the exploitation of copyrighted works for information analysis and technological development of AI. 本プロジェクトは、日本の著作権法第30条の4(情報解析目的の外での利用)に基づき、技術検証および情報解析を目的として開発されており、法的に適正な範囲内で公開されています。

Official API Usage

All generations are performed through the official Google Gemini API. This system adheres strictly to Google's "Generative AI Forbidden Use Policy" and Terms of Service. 本システムはGoogle公式のGemini APIを介して動作しており、Googleが定める「生成AI禁止事項」および利用規約を厳格に遵守しています。

Autonomous & Deterministic Generation

Unlike simple image synthesis, this system uses an autonomous "Unmanned" pipeline and the ABSOLUTE PHYSICAL GEOMETRY LOCK protocol.

  • It does not aim to replicate specific existing artworks.
  • It generates original compositions based on real-time trend analysis and mathematical geometric constraints. 本システムは、特定の作品の模倣を目的としたものではありません。リアルタイムのトレンド分析と、独自の「物理幾何学ロック」プロトコルに基づき、AIが自律的に構図を決定・生成するものであり、依拠性のない独自創作を志向しています。

No-Profit & Research Focus

The core logic (Prompts/Protocols) is released under CC BY-NC-SA 4.0. Any commercial misuse by third parties is strictly prohibited. This project exists solely for the advancement of AI agent technology and the democratization of creative tools. 核心的なロジックはCC BY-NC-SA 4.0(非営利)の下で公開されています。第三者による悪質な商用利用はライセンス違反となります。本プロジェクトは、AIエージェント技術の発展と、創作ツールの民主化を目的とした研究成果です。


⚖️ License & Rights / ライセンス・権利関係

This project uses a hybrid license to balance technology sharing and intellectual property protection. 技術の共有と創作の保護を両立するため、以下のハイブリッドライセンスを採用しています。

  • Source Code: MIT License Applies to software logic and implementation code. / ソフトウェアの動作ロジックや実装コードに適用。
  • Logic & Prompts: CC BY-NC-SA 4.0 Applies to original design philosophy and prompt structure. / 設計思想およびプロンプト構造に適用。
  • Output Ownership / 生成物の帰属: The CC SA (ShareAlike) requirement does not apply to manga works generated by this system. Rights belong to the user. 本システムで生成されたマンガ作品に上記CCライセンスの継承義務は適用されません。権利はユーザーに帰属します。 Maintaining the signature "Generated by Super FURU AI 4-Koma System" is strongly recommended. 署名の維持を強く推奨します。

Commercial Use and Paid Seminars / 商用利用・有料セミナーについて Usage of this system (including prompts and logic) in high-priced information products, paid seminars, or any "get-rich-quick" schemes is strictly prohibited under the CC BY-NC-SA 4.0 license. 本システム(プロンプトおよびロジックを含む)を、高額な情報商材、有料セミナー、または「副業・稼げる」等の謳い文句を伴うビジネスに無断で使用することは、CC BY-NC-SA 4.0ライセンスに基づき、固く禁じます。

Any commercial or educational use involving fees requires explicit prior written consent from the developer (FURU). 有料の教育目的や商用利用を検討される場合は、必ず事前に開発者(FURU)の書面による承諾を得てください。


利用規約 / Terms of Use

1. 目的 / Purpose

本ツールは創作支援を目的としたものであり、既存の著作物、ブランド、キャラクター、または特定の作家・作品の再現や代替を目的とした利用は想定していません。
This tool is intended for creative assistance and is not designed to reproduce, substitute, or replicate existing copyrighted works, brands, characters, or specific creators.


2. 生成コンテンツに関する禁止事項 / Prohibited Uses

ユーザーは、本ツールを使用して以下の行為を行ってはなりません。
Users must not engage in the following:

(1) 著作権・知的財産権侵害 / Intellectual Property Infringement

  • 既存の漫画、アニメ、小説、映画、ゲーム等を実質的に再現・模倣する行為
  • 特定の作品、キャラクター、作家のスタイル・作風を識別可能なレベルで再現する行為
  • 構図、セリフ、デザイン、ストーリー等の無断流用
  • 商標、ロゴ、ブランド要素の無断使用

Reproducing or closely imitating existing works, recognizable styles, or protected elements.

(2) 権利侵害コンテンツの利用 / Use of Infringing Content

  • 第三者の著作権、商標権、肖像権、パブリシティ権等を侵害するコンテンツの生成、公開、販売、共有
  • 既存IPに類似したコンテンツの無断商用利用

Generating, distributing, or monetizing infringing or derivative content without permission.

(3) 入力データの不正利用 / Misuse of Input Data

  • ユーザーは、入力する画像・テキスト等について、適法な権利または使用許諾を有することを保証するものとします
  • 権利を有しない第三者コンテンツを入力として使用する行為

Users must have legal rights to all input data.

(4) 不正利用の助長 / Facilitation of Misuse

  • 権利侵害を目的としたプロンプト、テンプレート、ワークフローの作成・共有
  • 他者に侵害行為を促す行為

Creating or sharing tools intended for infringement.

(5) 法令違反・不正行為 / Illegal Activities

  • 適用される法令に違反する行為
  • 詐欺、不正行為、または有害な目的での利用

Any illegal or harmful use.


3. 生成物の責任および権利 / Responsibility & Ownership

生成されたコンテンツの内容および利用に関するすべての責任はユーザーに帰属します。
The user bears full responsibility for generated content.

本ツールの利用によって生成されたコンテンツについて、開発者は著作権その他の権利を主張しませんが、その適法性・利用可能性を保証するものではありません。
The developer does not claim ownership of generated content but does not guarantee its legality or usability.


4. 免責事項 / Disclaimer

本ツールは「現状有姿(AS IS)」で提供され、明示または黙示を問わず、いかなる保証も行いません。
This tool is provided "as is" without any warranties.

開発者は、本ツールの利用または生成コンテンツに起因するいかなる損害についても責任を負いません。
The developer shall not be liable for any damages arising from use.


5. 権利侵害への対応 / Infringement & Takedown

権利侵害の申し立てがあった場合、開発者は独自の判断により以下の対応を行う場合があります。
Upon receiving a valid claim, the developer may:

  • 該当コンテンツの削除要請または削除
  • 利用の制限または禁止
  • リポジトリの公開停止等の措置

Remove content, restrict usage, or take necessary actions.


6. 規約の変更 / Changes

本規約は予告なく変更される場合があります。
These terms may be updated without notice.


7. 準拠法 / Governing Law

本規約は日本法に準拠します。
These terms are governed by the laws of Japan.


AI Manga Creative Suite / AIまんが制作エコシステム

This project is part of an integrated ecosystem designed to support AI-powered manga and story creation. 本プロジェクトは、AIを活用した漫画・ストーリー制作を支援する統合エコシステムの一部です。

Ecosystem Components / 構成システム

1. Nano Banana 2 Powered Super AI 4-koma System

A system specialized in creating 4-panel manga with AI. AIを活用した4コマ漫画制作に特化したシステムです。

2. AI Story Maker

A tool for generating creative stories and plots using AI. AIを用いてクリエイティブなストーリーやプロットを生成するツールです。

3. AI Character Sheet Maker

An assistant for designing detailed character sheets and settings. 詳細なキャラクターシートや設定をデザインするための支援ツールです。

4. AI Comic Translation Tool

A tool for translating manga into 10 languages using AI. AIを使って漫画を10言語に翻訳するツールです。


Developed by FURU


📋 ChangeLog

v2.60.0-alpha (2026-04-21)

  • [Critical Fix] Camera angle lens distortion weights not being applied to image generation — added cameraLensMap dictionary / カメラアングルのレンズ歪みウェイトが画像生成に反映されないバグを修正(cameraLensMap追加)
  • [Fix] Removed hardcoded Extreme Reaction Mandate from default prompt, restoring natural expressions / デフォルトシナリオの過剰演出(Extreme Reaction Mandate)を除去し、自然な表情に回復
  • [Fix] Increased NO EYE CONTACT weight from 1.7 to 2.5 to suppress characters looking at the camera / カメラ目線(第四の壁破壊)抑制ウェイトを1.7→2.5に強化

v2.59.0-alpha (2026-04-21)

  • [Major] Deprecated legacy Imagen models (scheduled for full removal 2026/06/24). Gemini Native Image Generation is now primary / Imagen全系列を廃止予定に伴い非推奨化。Geminiネイティブ画像生成をプライマリに
  • [Major] Rebuilt text/image model lists with Gemini 3.x generation priority / テキスト/画像モデルリストをGemini 3.x世代優先に再構築
  • [New] Added Gemini API Model Audit Protocol to AGENTS.md / Gemini APIモデル定期監査プロトコルをAGENTS.mdに追加

v2.52.0-alpha

  • [BugFix] PRO TIPSの文章における「カンニングできる」という不適切な表現を「参照できる」に修正

v2.48.0-alpha (2026-04-15)

  • [UI Fix] APIキー未入力時のぼかし範囲を修正。出力結果エリア(プロンプト欄・コピペボタン・PRO TIPS・画像生成ログ・生成画像エリア)がcurrentStep < 3の時に正しくロックされるよう修正
  • [UI Fix] STEP3完了前にプロンプト欄・DYNAMIC ENGINE等が丸見えになっていた構造上の不備を修正(出力結果divにロックオーバーレイを追加)
  • [UI New] ステータスバーにAPI接続状態バッジ(🟢 CONNECTED / 🔴 NO API KEY)を常時表示
  • [UI New] APIキー入力UIをインラインバー形式に変更(フルスクリーンモーダル廃止)
  • [UI New] コピペボタンより下(STEP4ボタン・PRO TIPS・コンテンツポリシーパネル)をfinalPrompt未生成時にぼかすUI改善

v2.47.0-alpha (2026-04-14)

  • [Feature] シナリオ強化: カメラワーク強化トグル追加
  • [Feature] シナリオ強化: セリフ・ギャグ強化トグル追加
  • [BugFix] STEP3構築中にSTEP2が消えるバグ修正(isAssembling条件除外)

Release History

VersionChangesUrgencyDate
v4.6.4## What's New / 更新内容 - Fixed a dialogue extraction bug where character names containing specific particles were incorrectly filtered out. / セリフ抽出時の助詞(「と」「の」等)を含む特定文字長キャラクターのセリフ欠落バグを修正。 - Improved exact cast matching logic. / 完全一致判定で、名前の後に続く発言内容が正しく描画されるように改善。High6/3/2026
v4.4.3## What's New / 更新内容 ### v4.4.3 (2026-05-28) - **[Fix & Model Sanitization]** OpenAI画像生成APIクライアント(`openai.js`)内に残存していた「gpt-image-2」という架空モデルの定義を完全に排除し、実在モデルである「dall-e-3」に正常化。また不要なデバッグ用モデルリストスクリプト等を削除。 - **[Fix & Model Sanitization]** Completely eradicated fictitious model ID "gpt-image-2" inside openai.js and standardized on "dall-e-3". Cleaned up obsolete diagnostic/test scripts. High5/28/2026
v4.0.3## What's New / 更新内容 ### v4.0.3 (2026-05-21) - ** [Fix & UX] ** 吹き出しへの五感ラベル混入バグおよびアクターZONE・EMOTIONスタイル誤切替の修正 / Fix sensory label hallucination in speech bubbles and incorrect actor ZONE/EMOTION style transitions High5/21/2026
v3.54-alpha## What's New / 更新内容 - Completed 360° background integration pipeline. Injected 4 cropped perspective images as multimodal references in Gemini mode for highly accurate per-panel scenery generation. / 360°背景統合パイプライン(Phase 3)の完了と安定化。Geminiモードで4枚のクロップ画像をマルチモーダル参照として注入し、コマ別の方角に合わせた精密な背景描画を実現。 - Fixed UI layout issue where text and image overlays overlapped in the camera work preview panel. / カメラワーク確認UIにおいて、テキスト(「各コマで使用される背景の方角」)と画像オーバーレイが重なって表示されるレイアウト崩れを修正。High5/15/2026
v3.12-alpha### v3.12-alpha (2026-05-09) - **[UI/UX]** UI/ログの完全日本語化を実施。思考トレース(Thinking Trace)が利用できない標準モデル使用時のメッセージを「通常処理が完了しました。」と簡潔化し、不要な注釈を排除しました。 / Localized UI logs to Japanese completely. Simplified the fallback message for standard models without Thinking Trace to "通常処理が完了しました。" (Normal processing completed), removing confusing annotations. High5/9/2026
v3.02.0-alpha## What's New / 変更点 ### BugFix - **[BugFix]** Fixed a bug in ChatGPT mode (GPT-image-2) where a black border was drawn around the entire page. The phrase "OUTER FRAME" in the CANVAS LOCK section was interpreted by DALL-E as a physical border drawing instruction; replaced with "image boundaries" and added explicit "NO PAGE BORDERS" rule to the ANTI-NOISE section as a double-block countermeasure. - **[BugFix]** ChatGPTモード(GPT-image-2)で生成されるプロンプトにおいて、ページ全体に黒い外枠(border)が描画される問題を修正。CANVAS LOCKセクションのHigh5/3/2026
v2.77.0-alpha# v2.77.0-alpha — Enhanced GPT-image-2 Anti-Noise Protocol / GPT-image-2ノイズ対策プロトコル大幅強化 ## What's New / 変更点 ### ✨ Feature / 新機能 - **Enhanced GPT-image-2 Anti-Noise Protocol**: Integrated comprehensive noise countermeasures based on community research to significantly improve image quality when using ChatGPT Images 2.0 mode. - **Positive Safe Rendering Block**: Injected safe rendering keywords (`smooth cel shading`, `clean color surfaces`, `low texture density`, etc.) to actively guide the moHigh4/29/2026
v2.66.0-alpha### 📝 Update Documentation for ChatGPT & Enhancements #### English * **[Docs]** Updated `README.md` to formally document the new **ChatGPT Images 2.0 Mode** and **Scenario Enhancement** features. * Adjusted terminology to reflect compatibility with DALL-E 3, enforcing A4 aspect ratios and vertical text rules via prompt injection. #### 日本語 * **[Docs]** `README.md` を更新し、新たに搭載された **ChatGPT画像生成サポート** および **シナリオ演出強化** 機能に関する公式ドキュメントを追加しました。 * DALL-E 3生成に最適化されたA4縦長指定や、縦書きの視線誘導フォーマットに対応した設計であることを技術詳High4/22/2026
v2.60.0-alpha# Nano Banana Pro v2.60.0-alpha 🚀 **Dynamic Camera Recovery & Scenario Normalization Update** ## 🔧 Fixes & Optimizations * **Camera Lens Mapping [Critical Fix]**: Fixed an issue where Extreme Camera Angles (v2.55) were being stripped of their specific lens distortion weights (fish-eye, telephoto, dutch angle, etc.) during generation. AI-selected camera names are now explicitly mapped to heavy weighted lens tags, restoring the hyper-dynamic camera distortion. * **Scenario Enhancements NorHigh4/21/2026
v2.59.0-alpha## Nano Banana Pro v2.59.0-alpha ### EN - **Optimization**: Completely overhauled the Gemini API model fallback lists in preparation for the deprecation of the official Imagen series models (June 24, 2026). Promoted `gemini-3.1-flash-lite-preview` and `gemini-2.5-flash-image` as primary free-tier fallbacks, and correctly updated modal payloads for native Gemini image generation. - **System**: Implemented the multi-agent `Model Audit Protocol` across the standard `AGENTS.md` file, standardizingHigh4/21/2026
v2.58.0-alpha## Nano Banana Pro v2.58.0-alpha ### EN - **Fix**: Resolved issue where low-angle (Aori) and worm's-eye camera shots sometimes generated shoe-only close-up panels instead of full-body character compositions. All low-angle prompts now explicitly mandate full-body rendering. - **Fix**: Removed "cracking/shattering panel borders" VFX from the IMPACT emotion style, which caused undesirable fracture lines on panel edges. Replaced with a clean "intense glowing energy aura" effect. ### JP - **修正**: ロHigh4/20/2026
v2.57.0-alpha## Nano Banana Pro v2.57.0-alpha ### EN - **Enhancement**: Refined Fisheye (Ultra wide-angle) camera perspective prompt logic. - Added strict prohibition against generating "bulbous noses" (pig noses) during fisheye distortion to prevent undesirable facial collapse while maintaining extreme visual perspective. ### JP - **改善**: フィッシュアイ(超広角)アングル時のカメラプロンプト指示を修正しました。 - 極限の遠近感を出しつつも、「団子鼻(豚鼻)」になるような不細工な造形崩壊をシステム側で明示的に絶対禁止とするよう対応しました。 High4/20/2026
v2.56.0-alpha### Changes / 更新内容 - **[Fix]** Removed "Macro Close-up" from camera options to prevent the AI from generating huge face/eye close-ups that violate the "all characters must be fully drawn" rule. - **[Feature]** Replaced the macro option with "Panning/Tracking Shot" where the camera tracks characters with dynamic motion blur. --- - **[修正]** カメラ選択肢から「マクロ特写」(顔や瞳の極端なアップ)を削除しました。これにより、AIが全員を描画せずに画面全体に巨大な顔を生成してしまうグリッチを防止します。 - **[機能追加]** マクロ特写の代わりに、「パンニング/追跡ショット」(キャラを追跡し背景がモーションブラーで流れる演出)を追加しました。 High4/20/2026
v2.55.0-alpha## What's New / 変更内容 ### 🎬 Extreme Physical Camera Description Mode (v2.55) - **Initial scenario generation now produces 3x-enhanced-level camera descriptions automatically** — no need to press the Enhance button multiple times - Camera Direction Tag section in scenario prompt completely rewritten: AI must now describe **physical scene details** (what the camera sees, how objects distort, how light falls) instead of just naming the camera angle - Added **Extreme Reaction Mandate**: all charactHigh4/20/2026
v2.54.0-alpha# Hyper-Dynamic Camera Protocol Maximize - Boosted AI image generation prompt weights for camera distortion and angle enforcement to their absolute maximum limits (2.5 - 3.0 range). - Re-implemented the `getCameraForPanel` AI angle classification logic to correctly force specific camera distortions based on AI's cinematic choice. - Added a Japanese watermark on the outside bottom-left border of the 4th panel for automated tracking. # 超ダイナミックカメラ・プロトコル最大化 - カメラの歪みとアングル強制のAI画像生成プロンプトのウェイトを、限界突破の絶対High4/20/2026
v2.53.0-alpha## What's New / 変更点 ### 🎬 ANTIGRAVITY HYPER-DYNAMIC CAMERA PROTOCOL v3.2 ### 🎬 カメラワーク超強化プロトコル v3.2 **EN:** - Integrated the Antigravity Hyper-Dynamic Camera Protocol v3.2 — a comprehensive overhaul of manga panel composition to enforce extreme, non-eye-level camera angles in every panel. - Added **OVERRIDE PROHIBITION** to prevent the AI from softening distortion for "readability" or "narrative flow." - Added **MANDATORY LENS ENFORCEMENT** blocks to each panel requiring visible proof of distHigh4/19/2026
v2.52.0-alpha### 🇯🇵 日本語 - **[BugFix]** PRO TIPSの文章における「カンニングできる」という不適切な表現を「参照できる」に修正 ### 🇺🇸 English - **[BugFix]** Corrected inappropriate wording ('cheat') in PRO TIPS description to 'reference'. High4/18/2026
v2.51.0-alpha## 🎯 Scenario-Driven Location & Outfit (v2.43 Architecture) ### English - **Location & Outfit now read from scenario text** — no more STEP 2 re-generation needed to change location/outfit - Input fields serve as convenience shortcuts for STEP 2; afterwards, edit `Location:` / `Outfit:` lines directly in the scenario - GENERATION PREVIEW now shows real-time values parsed from scenario text - Outfit placeholder updated with "普段着" (casual wear) example - All existing outfit enforcement (per-panelHigh4/16/2026
v2.50.0-alpha## 🇯🇵 日本語 - **不具合修正 (Bug Fix)**: 新しいシナリオを生成した際に、前回のシナリオ強化状態(元のシナリオ、強化ログ)がリセットされず、「強化済」の表示が残ったままになったり、「強化前に戻す」を実行した際に古いシナリオが復元されてしまう問題を修正しました。シナリオ生成開始時に確実に状態をクリアするようになりました。 ## 🇺🇸 English - **Bug Fix**: Fixed an issue where the Scenario Enhancement state (original scenario, enhancement logs) was not properly reset when generating a new scenario. This caused the UI to incorrectly display the "Scenario Enhanced" status and the "Revert" button to unexpectedly restore a scenario from a previous sHigh4/15/2026
v2.49.0-alpha# v2.49 Alpha - API認証バッジ & 描画エリアロック ## 🇯🇵 日本語 ### 新機能・改善 - **API認証状態バッジ**: タイトル枠内に「✅ API認証済」/「⚠ 未接続」バッジを常時表示 - 緑色光るドット付きバッジ(認証済み時) - 赤色点滅バッジ(未接続時) - **サブタイトル中央配置**: 「SOCIAL SATIRE ENGINE」とAPI認証バッジを水平中央揃えに修正 - **描画エリアロックオーバーレイ**: STEP3(プロンプト構築)未完了時、STEP4の画像生成結果エリア全体にぼかしオーバーレイを表示 - 枠線・タイトルヘッダー・中央アイコン・「Ready to Start」テキストがボケた状態に - STEP3完了後に初めてクリアに表示される --- ## 🇺🇸 English ### New Features & Improvements - **API Authentication Badge**: Persistent "✅ API Authenticated" / "⚠ Not ConnectHigh4/15/2026
v2.47.0-alpha# v2.47 Alpha - Camera Work & Dialogue Enhancement / カメラワーク・セリフ強化 ## 🐛 Bug Fixes / バグ修正 - **STEP3 "最終プロンプトを構築する" ボタン押下時にSTEP2エリアが消えるバグを修正** - Fixed: STEP2 overlay incorrectly activated during STEP3 prompt assembly (`isAssembling` removed from STEP2 lock condition) - **STEP3構築中にSTEP4エリア(ボタン下)が真っ黒になりログが見えないバグを修正** - Fixed: STEP4 overlay now hides during prompt assembly so users can see the build progress log ## ✨ New Features / 新機能 ### シナリオ強化パネル - 2カテゴリ追加 (4→6) - **📷 カメラワーク強化**: 各コマにアオリHigh4/15/2026
v2.46.0-alpha## Nano Banana Pro v2.46 Alpha - UI Locking Mechanism Overhaul 🔒 ### 🐞 Bug Fixes & Improvements (English) * **STEP UI Disablement Overhaul**: Completely rewrote the UI element deactivation logic for steps that are currently locked (e.g. while processing or waiting for preceding steps). * Replaced unreliable Tailwind `blur` filter classes with robust inline-styled overlay panels (`absolute inset-[-2px] z-[200] background-color: rgba(0,0,0,0.92) backdrop-filter: blur(8px)`). * ThHigh4/14/2026
v2.45.0-alpha## Release Notes (v2.45 Alpha) ### 🎨 UI & UX Improvements (UI/UXの改善) - **Standardized Progress Windows**: Unified font sizes across all progress logs and explanation panels (STEP 4 & Content Policy) to `text-xs` (12px) for improved readability, while maintaining `11px` for high-density neural process logs. Fixed a bug where dynamic height changes caused UI layout shifts by enforcing a static `160px` height structure. (進捗窓のフォントサイズと高さを全ステップで統一。コンテンツポリシーやPRO TIPの説明は視認性の高い12pxに、プロセスログは情報密度の高い11Medium4/14/2026
v2.44.0-alpha## 🚀 Updates / 変更点 * **UI/UX Refinements (Progress Trackers):** Fixed intermittent countdown stalling during cross-model fallback steps by switching interval logic to a resilient inline regex update. Also decoupled `isGeneratingImage` state in STEP 4 to prevent total screen deactivation while retaining action-lock on necessary elements. * **Content Policy Rescue UI Upgrade:** Frozen the generated output console via inline `style={{ height: '240px' }}` forcing stable panel footprint regardless Medium4/14/2026
v2.43.0-alpha## 🚀 Changes in v2.43.0-alpha / 変更点 ### 🛡️ Anti-Cloning Logic Enhancement / キャラクター重複防止の強化 - **Total Character Count Protocol (登場人数の厳密な制約)**: - The AI generation prompt now explicitly calculates and locks the total number of individuals in the scene. - If a scene has 2 main actors and 1 background character, it will strictly enforce "EXACTLY 3 distinct individuals. Each person appears ONLY ONCE." This forcefully stops the AI from mistakenly duplicating main characters as background observHigh4/14/2026
v2.41.0-alpha### Changes / 最新の変更点 * **New Feature: Scenario Enhancement Panel** — Added a collapsible panel between STEP 2 output and STEP 3 that allows fine-tuning the generated scenario's dramatic impact before image generation. * 4 individual toggle switches: **Expressions** (大げさ表情), **Body Language** (全身リアクション), **Effects** (照明・VFX演出), **Backgrounds** (背景描写強化) * "Execute Enhancement" button sends the scenario back to Gemini for dramatic upgrade * "Undo" button restores the original pre-enhancementMedium4/13/2026
v2.40.0-alpha### Changes / 最新の変更点 * **Revert (Camera Experiments v2.36–v2.39)**: Rolled back 4 consecutive versions of camera angle experiments that failed to break the eye-level prior of Gemini's image generation model, while degrading overall prompt quality. Restored the stable v2.35 prompt structure. * **Restore (Panel Grid)**: Re-enabled `CRITICAL PANEL SIZE COMMAND` (strict 4-equal-panel grid) and `CRITICAL COMPOSITION RATIO` (2:3 golden ratio) that were removed during camera experiments. * **Restore (Medium4/13/2026
v2.39.0-alpha### Changes / 最新の変更点 * **Fix (Markdown Prior Override)**: Imagen often ignores structural Markdown tags like `[SCENE CAMERA OVERRIDE]:` as pseudo-code or structural metadata, defaulting back to flat comic-strip layouts. The camera angle instruction has been fully integrated into the natural language of the `Visual Action` description as a strong declarative sentence. * **Refactor (Relax 4-Koma Grid)**: Removed the `CRITICAL COMPOSITION RATIO` (Strict 2:3 golden ratio) entirely and relaxed the `Medium4/13/2026
v2.38.0-alpha### Changes / 最新の変更点 * **Fix (Camera Angle Deadlock)**: Imagen 4 was stubbornly defaulting to a flat eye-level camera because the `CHARACTER BODY POSITION LOCK` rules logically forced a theatrical "stage-play" layout (e.g., "Physically standing on the LEFT half"). * **Refactor (Spatial Relaxation)**: Changed the position lock rules from absolute physical stage instructions (`MUST be physically standing...`) to camera-relative visual composition instructions (`From the camera's perspective... aMedium4/13/2026
v2.37.0-alpha### Changes / 最新の変更点 * **Fix (Camera Override)**: Imagen 4 was aggressively ignoring camera angles due to the strict "4 EQUAL horizontal panels" and "golden ratio" alignment instructions, rendering flat eye-level grids. Modified the Composition Ratio rule to explicitly permit "warping the interior perspective". * **Refactor (Camera Prompt)**: Converted the bracketed `[Camera Angle: ...]` tag entirely into natural language (`The scene is shot from a ...`). Removed the flat "Medium-Full Shot" andMedium4/13/2026
v2.36.0-alpha### Changes / 最新の変更点 * **Fix (Prompt)**: Resolved an issue where Imagen 4 ignored the `Camera` instruction due to pseudo-code formatting. By embedding the dynamic camera angle directly into the `Visual Action` text block, the AI now successfully renders dramatic shots (Low Angle, Bird's Eye, Dutch Angle) instead of defaulting to monotonous eye-level perspectives. * **Refactor**: Cleaned up orphaned code variables (`VAR_PANEL_1_KI`, etc.) that were no longer used in the layout assembly. --- * Medium4/13/2026
v2.35.0-alpha## 🚀 Changes in v2.35.0-alpha /変更点 ### 🛡️ Content Policy Rescue / コンテンツポリシー救済パネルの強化 - **Smart Collapsible UI (直感的な折りたたみUI)**: - The Rescue Panel now automatically expands only when an AI Content Policy Error is detected, maintaining a clean UI without unnecessary whitespace. - (画像生成が安全基準でブロックされた時だけパネルが自動展開される、完全折りたたみUIを実装。不要な余白をゼロにしました) - **Prompt Integrity Lock (修正プロンプトの完全維持)**: - The AI prompt advisor is now strictly guided via Meta-Prompting to preserve the exact length, detail, and Medium4/12/2026
v2.34.0-alpha## 🚀 Changes in v2.34.0-alpha /変更点 ### 🎭 Manga Composition Variety / 登場人数のバラエティ対応 - **Dynamic Character Counts (コマごとの話者数の意図的な変化)**: - Enforced a rule to naturally mix the number of speaking characters across the 4 panels. At least one panel MUST be a solo monologue, and at least one MUST be a 2-person dialogue, preventing the AI from creating 4 identical panel compositions. - (全コマが同じ人数にならないよう、1人での独白シーンと2人での会話シーンを最低1つずつ入れるルールを義務化しました) - **Background Mob Detection (非話者キャストの背景モブ描画)**: - ChHigh4/9/2026
v2.33.0-alpha## Changes in v2.33.0-alpha / 変更点 ### Dialogue Punctuation System Overhaul / セリフ句読点システム全面改修 - **Natural sentence-ending expressions**: Replaced the rigid period-only rule with a comprehensive punctuation system that matches character emotions and personality - **Terminal vs Modifier marks**: Classified punctuation into terminal marks (。!?♪♡っ!?) that can end sentences alone, and modifier marks (……~ー) that require a terminal mark after them - **Anti-repetition rule**: Same ending expression cannoHigh4/8/2026
v2.32.0-alpha## What's Changed / 変更内容 ### Bug Fixes / バグ修正 - **Fix excessive commas in speech bubbles / 吹き出しの読点過剰挿入を修正** - Removed forced comma insertion rule from both scenario generation (Gemini) and image generation (Imagen) prompts - Manga speech bubbles now use natural Japanese punctuation (periods only, minimal commas) - シナリオ生成・画像生成の両方のプロンプトから「読点を必ず入れよ」ルールを削除 - 漫画の吹き出しに自然な句読点(句点のみ、読点は最小限)を使用するよう変更 - **Fix style labels rendered as text on panels / スタイルラベルがコマ内にテキスト描画されるバグを修正** - Changed 'ARTMedium4/6/2026
v2.31.0-alpha## What's Changed / 変更内容 ### 🔧 Bug Fixes / バグ修正 **Character Identity Preservation / キャラクター一貫性の強化** - 🔒 BLANK (白目) style now preserves glasses on glasses-wearing characters / BLANK(白目)スタイルで眼鏡キャラの眼鏡が消えなくなりました - 🔒 CHIBI_GAG style now preserves glasses in super-deformed form / ちびデフォルメでも眼鏡が保持されるようになりました - 💇 Hairstyle extraction now prioritizes distinctive styles (twintails, hime cut) over generic (long hair) / 髪型抽出がツインテール等の特徴的スタイルを優先するようになりました - ✨ GLITTER style no longer causes hair length chanMedium4/6/2026
v2.30.0-alpha## 🚀 Changes in v2.30.0-alpha /変更点 ### 🎨 Character Consistency Logic / キャラクター同一性の強化 - **Anti-Cloning Enforcement (クローン防止プロトコルの強化)**: - Characters specified in solo-shots will NEVER duplicate. Explicit SINGLE CHARACTER rules are enforced to prevent AI hallucination. - (1人だけのコマでAIが勝手に話し相手を捏造・増殖させる問題を防ぐため、「SOLO SHOT」ルールを追加しました) - **Gag & Emotion Text Filtering (オノマトペやギャグSFXの吹き出し化防止)**: - Visual actions ending in Japanese SFX (e.g., ズコー, ドッ, ガーン) are now cleaned to prevent them from being dMedium4/6/2026
v2.29.0-alpha## What's Changed / 変更内容 ### Bug Fixes / バグ修正 - **Glasses Detection (Identity Matrix)**: Rewrote glasses detection logic to use WEIGHTS tags as the authoritative source. Added a locking mechanism to prevent subsequent lines from overwriting the correct determination. Characters without glasses are no longer incorrectly assigned 'MUST HAVE glasses'. - **眼鏡判定ロジック根本修正**: WEIGHTSタグを権威ソースとする方式に全面書き換え。ロック機構により後続行の上書きを防止。眼鏡なしキャラに「MUST HAVE glasses」が誤付与される問題を解消。 - **Narration Leak Prevention (PrimaryMedium4/5/2026
v2.28.0-alpha## v2.28 Alpha - Prompt Quality Overhaul / プロンプト品質大改修 ### What's Changed / 変更点 **🔴 Critical Fixes / 重大バグ修正** - **Glasses Detection Logic Fix**: The Identity Matrix no longer misidentifies characters with glasses (e.g. `度なし` matching `なし`) — Rin and Hikari now correctly get `MUST HAVE glasses` - **眼鏡判定ロジック修正**: Identity Matrixが「度なし」等の表記で眼鏡キャラを「眼鏡なし」と誤判定するバグを修正。リンとヒカリの眼鏡が正しく描画されるように - **EMOTION Tag Speaker Contamination Fix**: `[EMOTION: RETRO]` tags were being extracted as character names in Medium4/4/2026
v2.27-alpha## English - Enhanced Safety Age-Up Filter: Automatically replaces sensitive character attributes (girl, teenager, school uniform, serafuku, etc.) with safe adult alternatives in the prompt pipeline. - STEP1 Template Root Fix: Analysis prompt now outputs safe tags (woman, young adult, formal outfit) by default, reducing reliance on post-processing filter. - Character Body Position Lock: Uses visual trait anchoring (hair color, features) to lock character physical positions (LEFT/RIGHT) per paMedium4/3/2026
v2.25.0-alpha## What's New / 変更内容 ### Identity Matrix & Emotion Style Engine / アイデンティティ・マトリクス&感情スタイルエンジン - Character identity locking (hair color, hairstyle, glasses) enforced across all 4 panels / キャラクターの識別特徴(髪色・髪型・メガネ有無)を4コマ全パネルで強制固定 - 12 emotion style tags (`[EMOTION: XXX]`) for dynamic art direction per panel / パネルごとに12種の感情絵柄タグで画風を動的に制御 - NORMAL, CHIBI_GAG, GEKIGA, SHOUJO, HORROR, BLANK, IMPACT, WATERCOLOR, SKETCH, RETRO, GLITTER, SHADOW ### API Model Priority Update / APIモデル優先順位の更新 - PromoteMedium4/1/2026
v2.24.0-alpha### Changes - Added ANTI-FLOATING-EYE RULE to prevent floating close-up eyes or partial face crops from appearing as ghostly background overlays in panels. - Removed "Dramatic Close-up on eyes" from camera angle pool, replaced with "Medium Shot (Waist-up)". - Added CRITICAL COMPOSITION BAN constraint to Important Constraints section reinforcing the anti-floating-eye rule. - Strengthened horizontal watermark enforcement: explicitly prohibits 90-degree rotation, vertical stacking, and per-lettMedium3/25/2026
v2.23.0-alpha## What's Changed / 変更内容 ### Model Stack Modernization / モデルスタック最新化 **Removed deprecated models / 廃止モデルの除去:** - ❌ `gemini-2.0-flash` — Returns 404 (no longer available) - ❌ `gemini-2.0-flash-lite` — Returns 404 (no longer available) **Added next-gen preview fallbacks / 次世代プレビューモデルをフォールバックに追加:** - 🆕 `gemini-3-flash-preview` — Next-gen fast model (preview) - 🆕 `gemini-3.1-flash-lite-preview` — Next-gen lightweight model (preview) ### Updated Model Priority / 更新されたモデル優先順位 1. `gMedium3/23/2026
v2.22.0-alpha## What's Changed / 変更内容 ### English - **Fixed**: Critical bug where all speech bubbles were suppressed during prompt generation - Root cause: `extractDialogueOnly()` function failed to match character names when format differed between castList and scenario (e.g. "アカリ (AKARI)" vs "アカリ") - When matching failed, the function returned a destructive fallback: `"(CRITICAL: Do NOT draw any speech bubbles or text)"`, which caused the image generation AI to omit all dialogue - **Improved**: Medium3/23/2026
v2.21.0-alpha## What's Changed / 変更内容 ### English - **Fixed**: Local development (localhost) STEP2 scenario generation failing with "SYSTEM FAILURE: All models failed" - **Root Cause**: Google Search Grounding tool calls are blocked/restricted from `localhost` origins, and the failover condition in `gemini.js` only caught `400` and `"not supported"` errors — missing other error types (403, CORS, PERMISSION_DENIED) - **Fix**: Expanded grounding failover to retry WITHOUT tools on ANY error when `googleSeLow3/19/2026
v2.20.0-alpha## What's Changed / 変更内容 ### English - Added `CROSS-PANEL OUTFIT CONSISTENCY (MANDATORY)` rule to the image generation prompt - Ensures every character wears the EXACT same outfit across all 4 panels - Works regardless of whether a custom outfit override is specified - Placed immediately after the `Character Identity Anchor` section for maximum effectiveness ### 日本語 - 画像生成プロンプトに `CROSS-PANEL OUTFIT CONSISTENCY (MANDATORY)` ルールを追加 - 全4コマでキャラクターの服装を厳密に一致させるための指示文 - カスタム服装指定(Outfit OveLow3/18/2026
v2.19.0-alpha## What's Changed / 変更内容 ### 🛡️ Outfit Override Bias Fix (Plan 3: Dual Defense) / 服装オーバーライドのバイアス修正(案3: 二重防御) When a custom outfit (e.g. spacesuit) was specified via OUTFIT OVERRIDE, the AI image generator would revert to the reference image's default clothing (e.g. school uniform) in panels 2-4, caused by the reference image's visual bias overpowering the text instruction. / カスタム服装(例: 宇宙服)をOUTFIT OVERRIDEで指定した際、参照画像の視覚バイアスにより2〜4コマ目でデフォルト服装(例: 制服)に戻る問題を修正。 **Fix 1 - REFERENCE IMAGE CLOLow3/14/2026
v2.18.0-alpha## What's Changed / 変更内容 ### API Model Optimization / APIモデル最適化 - **Text Generation (gemini.js)**: Replaced deprecated/unstable models with stable GA versions: - `gemini-2.0-pro-exp` → `gemini-2.0-flash` (Stable GA) - `gemini-pro-latest` → `gemini-2.5-flash-lite` (Explicit lightweight) - `gemini-flash-latest` → `gemini-2.0-flash-lite` (Explicit lightweight) - **Image Generation (imagen.js)**: Removed dead Imagen 2 legacy model (`image-generation-001`) - **テキスト生成 (gemini.js)**: 廃Low3/14/2026
v2.16.0-alpha## Release Notes (v2.16.0-alpha) ### 🚀 Features & Improvements (English) * **Relaxed Cast Limits**: Relaxed the strict character exclusion logic in the background, allowing non-speaking characters and background mobs to be generated naturally alongside the main speaking characters. This restores the lively and expressive nature of the manga panels. * **Anti-Hallucination Measures**: Implemented a highly restrictive negative prompt `(ABSOLUTELY NO ENGLISH TEXT outside watermark. Do NOT Low3/7/2026
v2.11_Alpha### 🚀 Updates (v2.11 Alpha) - **Watermark Text Fix**: Optimized the watermark generation prompt with strict quote syntax to correctly handle target text without hallucinating internal instructions (e.g., "(LTR) ONLY ONE"). - **Font Constraint Enforcement**: Enhanced speech bubble text rendering stability by explicitly applying the `bold sans-serif Japanese font` constraint to dialogue rendering. ### 🇯🇵 更新内容 (v2.11 Alpha) - **ウォーターマーク文字化け問題の修正**: AIがシステム側の生成指示文を透かしテキストとして誤認("(LTR) ONLY OLow3/7/2026
v2.10.0-alpha- Fixed the issue where AI generated hallucinations in the watermark text / AIがウォーターマークのテキストでハルシネーションを起こす問題を修正 - Enforced single horizontal rendering for the watermark / ウォーターマークを横書きで1回のみ描画するようルールを強制 - Removed the word "System" from the watermark text to prevent typographic errors / タイポを防ぐためウォーターマークのテキストから"System"の文字を物理的に除外 Low3/6/2026
v2.09.0-alpha### Bug Fixes * **Resolved Outfit Hallucination**: Fixed an issue where original character outfit tags (e.g., "school uniform") persisted in the final generation prompt even when a specific outfit override (e.g., "casual wear") was requested. This ensures that the AI accurately reflects the newly specified outfit without mixing clothing styles. ### バグ修正 * **服装のハルシネーション修正**: 「普段着」などの服装の上書きを指定した際、元のキャラクターシートにあった「制服」等の服装指示がプロンプトの末尾にそのまま残存してしまい、AI生成時に両方のデザインが混ざる(ハルシネーションが起きる)問題を修正しました。これにより、指定しLow3/6/2026
v2.08.0-alphaEn (English) Model Tier Optimization: Modernized the API substrate by replacing deprecated models with the latest stable iterations (gemini-2.5-flash, gemini-2.5-pro, gemini-2.0-pro-exp) to enforce zero-failure API connections and resolve 404 Not Found errors. Neural Process Logging: Implemented fully localized (Japanese) "Thinking Process" commentary. Error events (Safety, 404, Output Empty) and transition success messages are now broadcast in real-time to the UI log window. Quality & SafetyLow3/6/2026
v2.07-alphaThis update addresses critical API 404 errors causing models to fall back, and fixes an issue where Gemini 2.0 Flash would drop characters when multiple images were uploaded. このアップデートは、APIの404エラーによるモデル転落問題と、複数画像アップロード時にGemini 2.0 Flashがキャラクター解析を途中で打ち切ってしまう重大なバグを修正するものです。 🐛 **Bug Fixes & Improvements / バグ修正と改善** * **[Fix] Character Parsing Drop-off / 複数キャラ解析時の打ち切りバグ修正**: Resolved an issue where Gemini 2.0 Flash would intentionally stop parsing after the first two characters. AltereLow3/4/2026
v2.06-alpha## 🚀 Release Notes / リリースノート (v2.06 Alpha) This update addresses critical deployment pathing issues specifically targeted for environments beyond GitHub Pages, such as Hugging Face Spaces. このアップデートは、GitHub Pages以外の環境(Hugging Faceなど)での表示バグを根本的に解決するものです。 ### 🐛 Bug Fixes & Improvements / バグ修正と改善 - **[Fix] Universal Path Resolution / ユニバーサルパス解決**: Changed the Vite build configuration to use a relative base path (`base: './'`). This ensures that all generated assets resolve correctly regaLow2/28/2026
v2.05-alpha🚀 Updates / 更新内容 Fixed critical bugs in the automated versioning script that caused infinite loops of "NaN" generation and corrupted version strings across the app. バージョン情報を自動更新するシステムのロジックを根本から書き直し、「NaN(数値ではない)」というエラー文字列が混入するバグや、小数点第3位が勝手に付与されてしまう問題を完全に修正しました。 🔧 Feature Restorations & Fixes / 復旧・修正された機能 * **Strict Version Format Enforcement** * Completely rewrote `update_version.js` to strictly enforce the addition of +0.01 without semantic patches, eliminating floating-point mathLow2/28/2026
v2.02-alpha🚀 Updates / 更新内容 Fixed layout rules to prevent the 4 manga panels from shrinking and creating excessive white margins. Added a strong anti-cloning protocol to stop the AI from drawing the same character twice in a single panel. 4コマの枠が小さくなりすぎて不要な余白が広がる問題と、AIが同じコマの中に同一キャラクターを2人描いてしまう「分身現象」を抑制する強力なプロンプト対策を実装しました。 🔧 Feature Restorations & Fixes / 復旧・修正された機能 * **Strict Panel Width and Margin Fix / コマ幅と余白の厳格化** * Changed the layout prompt to force panels to occupy 95% of the canvas widtLow2/28/2026
v2.01-alpha🚀 Updates / 更新内容 Implemented a strict English prompt protocol ("CRITICAL VISUAL REPRODUCTION PROTOCOL") to forcefully dictate that the AI must maintain 100% fidelity to the attached character reference image, especially concerning hairstyle, hair color, and glasses. 添付画像がある場合、AIに対して「元画像のキャラクターデザイン(髪型、髪色、眼鏡の有無)を100%忠実に再現すること」を強制する、非常に強固な英語のプロトコルを追加実装しました。 🔧 Feature Restorations & Fixes / 復旧・修正された機能 * **Strict adherence to Image Prompting / 画像プロンプトへの追従性を大幅向上** * Placed a stern instrLow2/28/2026

Dependencies & License Audit

Loading dependencies...

Similar Packages

Grinta-AgentLocal-first autonomous coding agent that plans, executes, validates, and finishes software tasks end-to-end.main@2026-06-07
entonBuilds an autonomous AI robot with vision, voice, and decision-making capabilities using Python, PyTorch, and CUDA technology.main@2026-06-02
GENesis-AGIAutonomous AI agent with persistent memory, self-learning, and earned autonomy. Cognitive partner that remembers, learns, and evolves.v3.0b13
openclaw-qaOpenClaw Q&A 社区 — AI Agent 记忆系统、多Agent架构、进化系统、具身AI | 龙虾茶馆 🦞main@2026-05-14
taijiAI-powered self-learning OS with I Ching philosophy | 融合易经哲学的自学型 AI 操作系统v0.2.0

More in AI Agents

@blockrun/franklinFranklin — The AI agent with a wallet. Spends USDC autonomously to get real work done. Pay per action, no subscriptions.
hermes-agentThe agent that grows with you
awesome-copilotCommunity-contributed instructions, agents, skills, and configurations to help you make the most of GitHub Copilot.
e2bE2B SDK that give agents cloud environments