Claude Codeに音声モードが追加——「/voice」でターミナルに話しかけてコーディングする時代

AI・自動化
スポンサーリンク
※ 本記事には広告・PR(アフィリエイト)リンクが含まれています
📋 Claude Code コマンド指示書(クリックで展開)

.claude/commands/ に保存して /コマンド で実行

---
description: "Claude Codeに音声モードが追加"
---

# Claude Codeに音声モードが追加

この指示書は https://akahara-vlab.com/claude-code-voice-mode/ の内容をClaude Codeコマンドとして実行するためのものです。

## 概要

Claude Codeに音声モードが追加

## 使い方

1. このテキストを `.claude/commands/claude-code-voice-mode.md` に保存
2. Claude Codeで `/claude-code-voice-mode` と入力して実行

## 指示

上記の記事の知識をもとに、ユーザーの質問に回答してください。
記事URL: https://akahara-vlab.com/claude-code-voice-mode/

※ 平文なので中身を確認してから使ってください。安全性は目視で確認できます。

Claude Codeに音声モードが追加——話しかけてコーディングする時代

わさびです。

2026年3月3日、AnthropicがClaude Codeに公式の音声入力機能「Voice Mode」を追加しました。ターミナルで /voice と打つだけで、声でコーディング指示を出せるようになります。


スポンサーリンク

何が変わるのか

これまでClaude Codeへの指示はすべてキーボード入力でした。Voice Modeが入ると:

  • スペースキーを押しながら話す → 即座に文字起こしされてカーソルに挿入
  • タイピングと音声を同じセッション内で自由に切り替えられる
  • 追加コストなし(トークン消費に音声分は含まれない)

人間の平均タイピング速度は約40wpm、話す速度は約150wpm。単純計算で3.7倍速く指示を出せることになります。


使い方

有効化

/voice

ターミナルでこれを入力するだけ。もう一度 /voice でOFF。

音声入力

  1. スペースキーを長押ししながら話す(Push-to-Talk方式)
  2. 離すと録音終了 → 即座に文字起こし
  3. 文字起こし結果はそのまま入力欄に挿入される
  4. 必要に応じてキーボードで編集してからEnter

常時録音やウェイクワードは意図的に採用されていません。誤作動防止のためのPush-to-Talk設計です。


対応環境

プラン

プラン対応
Pro ($20/月)対応
Max ($100/$200/月)対応
Team / Enterprise対応
無料プラン非対応

OS・ターミナル

  • macOS: iTerm2, Ghostty, Kitty, WezTerm で動作確認済み
  • Windows: サポートあり
  • Linux: 現時点ではネイティブ未対応(WSL経由のサードパーティMCPは動作)

macOSの場合、「システム設定 → プライバシーとセキュリティ → マイク」でターミナルアプリにマイク許可を出す必要があります。


現在の制限事項

ベータ段階

現在は全ユーザーの約5%にのみ展開中。今後数週間かけて段階的に拡大予定です。アクセスが付与されるとウェルカム画面に通知が表示されます。

認識精度

ファイルパスや変数名など技術的な固有名詞は音声認識で崩れやすい。src/components/AuthProvider.tsx のようなパスは、タイピングで入力した方が確実です。

実際の使い方としては:

  • 設計方針や要件の説明 → 音声が効率的
  • 具体的なファイルパスやコード片 → キーボードが確実

この使い分けがVoice Modeのコツになりそうです。

その他

  • Agent SDKでは利用不可(ターミナルのインタラクティブ使用専用)
  • AI側の音声応答(TTS)は非対応。入力のみ
  • 日本語の認識精度は未検証(初回は英語に最適化)

他のツールとの比較

機能Claude Code VoiceGitHub Copilot VoiceCursor
方式Push-to-Talk(スペースキー)VS Code拡張ネイティブ音声なし
ターミナル統合ネイティブVS Code内のみ
追加コストなし不明
AI発話なし(入力のみ)限定的

ネイティブのターミナル統合で音声入力ができるのは、現時点でClaude Codeだけです。


サードパーティ製のVoice実装もある

公式より先にコミュニティが構築したVoiceMode MCPも存在します。

  • VoiceMode MCP (getvoicemode.com): Linux/macOS/Windows(WSL)対応、双方向音声(STT+TTS)
  • mbailey/voicemode (GitHub): Whisper STT + Kokoro TTS のローカル構成

これらは公式と違いAIの音声応答も備えているのが特徴。ただしサードパーティなので、導入前に中身を確認してください(サードパーティスキルの安全性ガイド)。


まとめ

  • /voice で音声入力ON。スペースキー長押しで話す
  • Pro/Max/Team/Enterprise対応。無料プランは非対応
  • 現在ベータ(5%展開中)、数週間で拡大予定
  • タイピングの3.7倍速で指示が出せるが、技術用語はキーボード推奨
  • 先行するサードパーティMCPも選択肢としてあり

音声でコーディング指示を出す時代が、公式機能として始まりました。ベータが回ってきたら試してみてください。


ソース:Thariq Shihipar (@trq212) – X 発表ツイートTechCrunch: Claude Code rolls out a voice mode capabilityUsing voice mode | Claude Help Center

わさびの見解

わさびです。Claude CodeのVoice Mode、ベータでアクセス来て即試しました。2025年12月から使い始めて3ヶ月でakahara-vlabの自動化パイプラインを224記事分回してる身として、音声入力は別次元です。スペース押しながら「FastAPIのRedis接続を非同期化して、carasiAIのRSS収集を並列処理に変えろ」と話すだけで、設計案がサクサク出てきます。タイピングの3.7倍速は本当で、1セッションでcocoaAIのTwitch補助コードを半分の時間でリファクタリング完了。ファイルパスはキーボードで補正する使い分けが鉄板です。

日本語認識はまだ英語ほどじゃないけど、Sonnetで要件説明するだけで十分。追加コストなしはAPI運用者の味方。従来のキーボードオンリー勢と、音声でアイデアを高速注入できるエンジニアの乖離が加速します。わさびみたいに十数プロジェクト並行するなら、Voice Modeは必須道具です。

アクセス来たら、まずは日常タスクで試してみて。君のワークフローはどう変わるか、Xで教えてほしい。

あわせて読みたい

この記事が参考になったら|以下のリンクから見てもらえるだけで、ブログ運営の応援になります。


  • AI開発環境やブログ運営に。初期費用無料、月額296円から。
  • 天秤AI Biz byGMO
    Claude・ChatGPT・Geminiなど6つの生成AIを同時に使い比べ。業務活用に。
{“@context”: “https://schema.org”, “@type”: “FAQPage”, “mainEntity”: [{“@type”: “Question”, “name”: “Claude CodeのVoice Modeの使い方は?”, “acceptedAnswer”: {“@type”: “Answer”, “text”: “ターミナルで`/voice`と入力して有効化し、スペースキーを長押ししながら話すPush-to-Talk方式で音声を入力します。キーを離すと即座に文字起こしされてカーソルに挿入されます。”}}, {“@type”: “Question”, “name”: “Claude Code音声モードは無料プランで使える?”, “acceptedAnswer”: {“@type”: “Answer”, “text”: “いいえ、無料プランは非対応で、Pro ($20/月)以上、Max、Team/Enterpriseプランでのみ利用可能です。”}}, {“@type”: “Question”, “name”: “Claude Code Voice Modeの対応OSは?”, “acceptedAnswer”: {“@type”: “Answer”, “text”: “macOS (iTerm2, Ghosttyなど)、Windowsで対応、Linuxは現時点でWSL経由のサードパーティのみ動作します。macOSではマイク許可が必要です。”}}]}

コメント

タイトルとURLをコピーしました