AIチャットに話しかけるための、Mac向け高速音声入力アプリです。
旧称・アプリ本体名は API音声ソフト です。
ChatGPT / Claude / Codex などの入力欄に、Fn と Enter だけで素早く音声入力します。文章を過度に整えるより、話した意図を速く正確にAIへ渡すことを重視しています。
- AI入力向けのシンプルな音声入力
- Groq Whisper
whisper-large-v3による高速な文字起こし - アプリ独自アカウント不要
- ユーザー自身のGroq APIキーを使用
- APIキーはmacOS Keychainに保存
- 録音中はコンパクトな波形overlayを表示
- overlayに×/チェックなどのクリック用ボタンを置かず、キー操作だけで完結
Fn → Fnは入力欄へ貼り付けのみFn → Enterは貼り付け後にEnter送信
使い方ページ: https://api-voice-input.vercel.app/
最新版はGitHub Releasesからダウンロードできます。
- 最新Release: https://github.com/yosinn1-blip/api-voice-input/releases/latest
- v0.1.5 ZIP: https://github.com/yosinn1-blip/api-voice-input/releases/download/v0.1.5/api-voice-input-0.1.5-6.zip
- SHA256: https://github.com/yosinn1-blip/api-voice-input/releases/download/v0.1.5/api-voice-input-0.1.5-6.zip.sha256
- Release notes: https://github.com/yosinn1-blip/api-voice-input/releases/download/v0.1.5/api-voice-input-0.1.5-6-release-notes.txt
このアプリはメニューバー常駐型です。起動しても通常のウィンドウは開かず、画面上部のメニューバーに 🎙 が表示されます。
- macOS 14以降
- GroqアカウントとAPIキー
- マイク権限
- アクセシビリティ権限
まずは3分セットアップだけ確認してください。起動しても通常のウィンドウは開かないので、画面上部のメニューバーに出る 🎙 から進めます。迷ったら 🎙 → 初回セットアップを開く でこの使い方ページを開けます。
API音声ソフト.appを開きます。- macOSに止められる場合は、Finderで右クリックして
開くを選びます。 - マイク権限を許可します。
🎙→アクセシビリティ設定を開くからAPI音声ソフトを許可し、必要ならアプリを再起動します。🎙→無料のGroq APIキーを取得を選びます。- GroqでAPIキーを作成し、コピーします。
🎙→Groq APIキーを設定…から貼り付けて保存します。- AIチャットの入力欄をクリックし、
Fn → 話す → Fnで文字が入るか確認します。
APIキーはMacのKeychainに保存されます。
- メニューバーに
🎙が出ている 🎙→Groq APIキー設定状況が設定済みになる🎙→アクセシビリティ設定を開くからAPI音声ソフトが許可済みになっている- 入力欄をクリックしてから
Fn → 話す → Fnで文字が入る - そのまま送信したい入力欄で
Fn → 話す → Enterが使える
- ChatGPT / Claude / Codex などの入力欄をクリックします。
Fnを押して録音を開始します。- 話します。
- 入力欄に入れるだけなら、もう一度
Fnを押します。 - そのまま送信したいなら、
Enterを押します。
このアプリは画面上の×/チェックボタンをクリックする設計ではありません。Fn と Enter を覚える代わりに、視線を入力欄から外さずに操作できます。
長い文章を Fn → Enter で送る場合は、貼り付け完了を待つために自動Enter送信まで少しだけ待ちます。もし送信されない場合は、もう一度 Enter を押してください。
このアプリは whisper-large-v3 を使います。Groq公式のRate Limitsでは、無料枠の目安として次の制限が案内されています。
- 1分あたり最大20回
- 1日あたり最大2,000回
- 音声は1時間あたり最大7,200秒、つまり約2時間分
- 音声は1日あたり最大28,800秒、つまり約8時間分
このアプリでは、基本的に Fn → 話す → Fn または Fn → 話す → Enter の1回がAPIリクエスト1回です。
たとえば平均15秒で話すなら、音声時間だけで見ると1日約1,900回分です。平均30秒なら約960回分です。実際には1日2,000回のリクエスト上限もあるため、短い入力を大量に使う場合は回数上限に先に当たる可能性があります。
日常的なAIチャット入力ならかなり余裕がありますが、会議文字起こしのように長時間連続で使う用途では上限に近づきやすいです。最新の正確な値はGroq ConsoleのLimitsページを確認してください。
メニューの 録音開始時にYouTubeを一時停止 は、公開向け初期状態ではオフです。
オンにすると、録音開始時にブラウザやmacOSのメディア情報を使ってYouTubeの一時停止を試みます。この機能は追加のmacOS許可ダイアログが出ることがあり、環境によって動作が異なります。
Chromeで動画を確実に一時停止したい場合は、Chromeのメニューバーから 表示 → デベロッパー → Apple Events からの JavaScript を許可 をオンにしてください。これがオフの場合、アプリは動画の一時停止ではなく、一時的なシステム音声ミュートへフォールバックすることがあります。
通常の音声入力だけならオフのままで問題ありません。
| 症状 | 確認すること |
|---|---|
| 起動しても画面が出ない | メニューバーの 🎙 を確認してください。通常ウィンドウは開きません。 |
Fn に反応しない |
アクセシビリティ権限を許可し、アプリを一度終了して再起動してください。 |
| 文字起こしに失敗する | Groq APIキーの設定状況と、Groq側の利用上限を確認してください。 |
| 文字は作られるが貼り付かない | アクセシビリティ権限を再確認してください。失敗時も文字はクリップボードに残ります。 |
Fn → Enter で送信されない |
貼り付け後にもう一度 Enter を押してください。長文では自動送信を少し遅らせます。 |
このMVPは直接配布用です。App Store版やnotarize済み版ではありません。
そのため、初回起動時にmacOSのGatekeeper警告が出る場合があります。公開配布を強める場合は、Apple Developer IDでのnotarizationが次の作業です。手順は docs/notarization.md を参照してください。
swift test
./scripts/dev-cycle.sh
bash scripts/verify-release-scripts.sh
./scripts/package-release.shrelease ZIPは dist/ に作成されます。次回Releaseの公開リンク更新は bash scripts/update-release-links.sh、ホームページdeployは docs/deployment.md、notarization準備は docs/notarization.md を参照してください。
詳しくは PRIVACY.md を参照してください。