何が変わったのか——「Wordsmith」という命名の意味
モデル名に「Creative Wordsmith」と刻んだ理由は明快だ。Gemma 4 31B instructは汎用性に優れるが、創作文章においては散文のリズムが機械的になりやすい。ベースモデルが持つ「正確だが平板」という特性を、ファインチューンによって「自然で起伏のある」文体へと押し上げることが本モデルの主目的である。
Sourceによれば、改善対象は3領域——創作文章(Creative Writing)、翻訳(Translation)、ロールプレイ(RP)だ。いずれも「自然な英語」と「より良い散文品質(Better Prose)」を軸に調整されている。
プロンプトエンジニアリングの観点から見ると、ファインチューンとプロンプト設計は補完関係にある。ベースモデルの出力傾向が変われば、同じプロンプトでも引き出せる品質の天井が変わる。Ortenzyaはその天井を上げる試みだ。
提供形式と入手経路——SafetensorsとGGUFの選択
配布形式はSafetensorsとGGUFの2系統だ。
- Safetensors版: `llmfan46/gemma-4-Ortenzya-The-Creative-Wordsmith-31B-it-uncensored-heretic`
- GGUF版: `llmfan46/gemma-4-Ortenzya-The-Creative-Wordsmith-31B-it-uncensored-heretic-GGUF`
GGUF形式はllama.cppやLM Studio等のローカル推論エンジンで直接読み込める。31Bクラスのモデルをローカルで動かすには相応のVRAMが必要だが、GGUF量子化版であれば要件を下げられる可能性がある。量子化ビット数の選択がここで効いてくる。
作者のllmfan46はNVFP4版・GPTQ版の追加提供も検討中と述べており、需要次第で拡充される見通しだ。全モデルはHuggingFaceのllmfan46アカウントから参照できる。
プロンプト設計への実践的示唆
このモデルを最大限に活用するには、プロンプト側の調整も必要だ。筆者の経験則を述べる。
創作特化モデルは「指示の粒度」に敏感に反応する。汎用モデルに「小説を書いて」と投げるのと、創作チューンモデルに同じ指示を投げるのでは、出力の起点が異なる。後者は散文的な展開を「期待している」状態にあるため、過剰な制約指示がかえって品質を下げる場合がある。
ナイーブなプロンプト(失敗例):
Write a short story about a detective. Make it interesting and detailed. Use good English.
この指示は汎用モデル向けの補助輪だ。「interesting」「detailed」「good English」はモデルに判断を委ねる曖昧語であり、創作チューン済みモデルには冗長になる。出力はむしろ「指示に応えようとする説明的な文体」に引っ張られる危険がある。
改善版:
A rain-soaked detective stands outside a locked apartment.
Write the opening scene in third-person limited POV.
Tone: noir. Sentence rhythm: short punches interspersed with longer observations.
Do not summarize. Show, don't tell.
変更点を分解する。
| 要素 | 変更前 | 変更後 | 効果 |
|---|---|---|---|
| 場面設定 | 抽象的 | 具体的情景で開始 | モデルの「続き生成」モードを起動 |
| 視点指定 | なし | third-person limited | 文体の一貫性を担保 |
| トーン | 「interesting」 | 「noir」 | ジャンル文法をモデルに想起させる |
| リズム指定 | なし | 短文と長文の交互 | 散文品質の具体的制御 |
| 禁止指示 | なし | 「Do not summarize」 | 説明文への退行を防ぐ |
「interesting」という1語を削除し「noir」に置換するだけで、出力の文体的一貫性は体感で大きく変わる。これはモデルの学習データに含まれるジャンル文法を直接呼び出す操作だ。創作チューンモデルはこのジャンル語彙に対してより鋭く反応する可能性がある。
翻訳用途では別のアプローチが有効だ。
Translate the following Japanese text into English.
Target register: literary prose, early 20th century British style.
Preserve sentence-level rhythm. Do not normalize colloquialisms.
[翻訳対象テキスト]
「literary prose」「early 20th century British style」という時代・様式の指定が散文品質の天井を引き上げる。Ortenzyaのような創作チューンモデルはこの種の様式指定に対してより豊かな語彙選択を示す可能性がある。
RP用途では「キャラクター設定の外部化」が基本戦術だ。モデルにキャラクターを「演じさせる」のではなく、設定を構造化して渡し、モデルが「その設定の中で最も自然な反応を生成する」状態を作る。
[Character]
Name: Elara
Role: Court mage, age 34
Speech pattern: formal, occasional dry wit, avoids contractions
Current emotional state: suppressed grief
[Scene]
Elara receives news of her mentor's death from a messenger.
Write Elara's response in dialogue and action beats. Stay in character.
結論——ファインチューンはプロンプトの「地盤」を変える
Ortenzyaの登場が示すのは、コミュニティ主導のファインチューンが特定用途においてベースモデルの限界を実用的に押し上げられるという事実だ。
ただし注意が必要だ。本記事で言及した品質改善の数値はソース元に記載がなく、筆者の観察に基づく定性的評価を含む。定量的な比較検証は現時点では公開されていない。実際の品質差は用途・プロンプト設計・量子化レベルによって変動する可能性がある。
プロンプトエンジニアリングの立場から言えば、モデルを変えることとプロンプトを変えることは同じ問題の両面だ。Ortenzyaを使うなら、汎用モデル向けの補助的な品質指示語(「interesting」「detailed」「good」)を外し、ジャンル・様式・リズムの具体的指定に切り替えることを勧める。モデルの能力に合わせてプロンプトを再調整する——それが職人の仕事だ。
まず試すべきは、手元の創作プロンプトからすべての形容詞的品質指示を削除し、代わりにジャンル名と文体様式を1行で指定することだ。
関連リンク
- gemma-4-Ortenzya-The-Creative-Wordsmith-31B-it-uncensored-heretic(Safetensors版):創作文章・翻訳・RP特化でファインチューンされたGemma 4 31B派生モデルのSafetensors配布ページ。
- gemma-4-Ortenzya-The-Creative-Wordsmith-31B-it-uncensored-heretic-GGUF(GGUF版):ローカル推論エンジン向けのGGUF量子化版配布ページ。
- LM Studio:GGUF形式モデルをローカル環境でGUI操作で手軽に実行できるデスクトップアプリ。






