macOS 語音輸入工具 — 按住右側 ⌘ 說話,自動辨識並輸入文字。
- 語音辨識(STT):使用 Groq Whisper 即時將語音轉為文字
- 語意修正(LLM):使用 OpenAI gpt-4o-mini 將口語自動改寫為通順的書面語
- 系統級輸入:辨識結果直接輸入到任何應用程式的游標位置
- MenuBar 常駐:不佔 Dock,安靜地在背景等待使用
- Apple Silicon(M1 / M2 / M3 / M4 / M5)
- macOS 14.0 Sonoma 以上
- 從 Releases 下載
TypeGood.dmg - 開啟 DMG,將 TypeGood 拖到「應用程式」資料夾
- 首次開啟時,授權麥克風與輔助使用權限
- 點選 MenuBar 麥克風圖示 → 偏好設定 → 填入 API Key
TypeGood 需要兩組 API Key:
- 前往 console.groq.com 註冊/登入
- 左側選單點「API Keys」→「Create API Key」
- 複製
gsk_開頭的 Key,貼到設定中的 Groq 欄位
Groq 提供免費額度,日常語音輸入使用綽綽有餘。
- 前往 platform.openai.com 註冊/登入
- 點「API Keys」→「Create new secret key」
- 複製
sk-開頭的 Key,貼到設定中的 OpenAI 欄位
需預先儲值(最低 $5 USD),使用 gpt-4o-mini 模型,費用極低。
- 確認 MenuBar 出現麥克風圖示
- 將游標放在任何輸入框
- 按住右側 ⌘ 鍵開始說話
- 放開按鍵,文字會自動辨識、修正後輸入
- 辨識語言:選擇主要語言(預設繁體中文),Whisper 會優先辨識該語言
- 中英文混合模式:開啟後可同時辨識中英文混雜的語句
- 標點符號風格:選擇全形或半形標點
- 中英文自動加空格:在中文與英文之間自動插入空格,提升可讀性
- Whisper 提示詞:加入常用專有名詞(如公司名、技術術語),幫助 Whisper 提升辨識準確度
- LLM 語意修正:可開關 LLM 後處理,關閉後直接輸出 Whisper 原始辨識結果
- LLM 系統提示詞:自訂 LLM 的改寫風格,例如調整正式程度或特定領域用語
詞彙庫用於修正 Whisper 經常辨識錯誤的詞彙,例如:
| 辨識錯誤(來源) | 正確文字(目標) | 說明 |
|---|---|---|
| 太好了 | TypeGood | App 名稱 |
| 瑞乃特 | React | 前端框架 |
| 派森 | Python | 程式語言 |
- 點擊 + 新增替換規則
- 支援匯出 / 匯入 JSON 格式,方便備份或分享
- 每條規則可獨立啟用或停用
本專案使用 XcodeGen 管理 Xcode 專案。
# 安裝 XcodeGen
brew install xcodegen
# 產生 Xcode 專案
xcodegen generate
# 用 Xcode 開啟
open TypeGood.xcodeproj| 元件 | 技術 |
|---|---|
| UI 框架 | SwiftUI + AppKit |
| 快捷鍵 | CGEvent Tap(右側 ⌘,keyCode 54) |
| 錄音 | AVFoundation(16kHz, 16-bit, mono WAV) |
| 語音辨識 | Groq Whisper API(whisper-large-v3-turbo) |
| 語意修正 | OpenAI Chat Completion API(gpt-4o-mini) |
| 文字輸入 | CGEvent 鍵盤事件模擬 |
| API Key 儲存 | 檔案式加密儲存(~/Library/Application Support/TypeGood/) |
- CHANGELOG.md — 版本更動紀錄
- BUILD.md — 建置與打包指南(環境設定、簽署、DMG 打包)
- DEVELOPMENT.md — 開發指南(架構、模組說明、資料流、擴充方式)
