Skip to content

Releases: kutd/Handy

Handy Qwen3 MLX Stable Undo for macOS

13 May 15:00

Choose a tag to compare

변경점

  • 중간 전사 미리보기가 실행 중이어도 최종 전사가 예약되면 새 미리보기가 끼어들지 않도록 우선권을 조정했습니다.
  • 이전 입력 컨텍스트가 있는 후처리에서도 사용자가 선택한 일반 후처리 프롬프트가 transcription 결과 정리 규칙으로 계속 반영되도록 수정했습니다.
  • 방금 입력한 전사 삭제 단축키를 유지하고, 빠르게 두 번 누르면 현재 입력칸 전체를 지우는 동작을 포함했습니다.
  • 한국어/영어 전용 언어 옵션과 Qwen3 MLX 모델 자동 다운로드/전용 Python 런타임 생성 흐름을 포함합니다.
  • VAD 기반 중간 전사 미리보기와 오버레이 표시 개선을 포함합니다.

macOS 전용

이 릴리즈는 macOS Apple Silicon용 실험 빌드입니다. Qwen3 MLX 경로는 Apple MLX 런타임을 사용하므로 M 시리즈 Mac을 대상으로 합니다.

설치

  1. 아래 DMG를 다운로드합니다.
  2. Handy.app을 Applications 폴더로 이동합니다.
  3. macOS에서 마이크와 손쉬운 사용 권한을 허용합니다.
  4. 앱 설정에서 Qwen3 ASR MLX 모델을 선택하고 필요한 모델을 다운로드합니다.

검증

  • DMG: Handy_0.8.4_aarch64.dmg
  • SHA256: 7839a3e84982e398926d34d1096649d5faf29269fe7a19e4cfcec9ab71ca3567
  • 로컬 검증: hdiutil verify 통과

참고

  • 로컬 서명 빌드이며 Apple notarization은 적용되지 않았습니다.
  • 최초 Qwen3 MLX 사용 시 전용 Python 런타임과 mlx-qwen3-asr 설치 때문에 시간이 더 걸릴 수 있습니다.

Handy Korean Zipformer Streaming for macOS

12 May 15:50

Choose a tag to compare

변경점

  • macOS Apple Silicon 전용 빌드입니다.
  • sherpa-onnx 기반 Korean Zipformer Streaming 모델을 추가했습니다.
  • 프로그램 안에서 Korean Zipformer 모델을 다운로드할 수 있습니다.
  • Sherpa-Onnx도 Qwen3 MLX와 마찬가지로 앱이 로컬 Python 실행 환경을 자동으로 준비합니다.
  • Qwen3-ASR MLX 0.6B/1.7B 모델과 한국어 context hint 기능은 그대로 유지했습니다.
  • 실시간 미리보기는 Korean Zipformer가 더 빠르고, 최종 전사 정확도는 Qwen3-ASR 1.7B 4bit 쪽이 더 좋을 수 있습니다.

사용 방법

  1. Handy 설정에서 전사 모델을 Korean Zipformer Streaming으로 선택합니다.
  2. 모델 다운로드 버튼을 눌러 앱 안에서 모델을 받습니다.
  3. 낮은 지연시간의 실시간 미리보기가 필요하면 Zipformer를, 더 높은 최종 정확도가 필요하면 Qwen3-ASR 1.7B 4bit를 선택하세요.

DMG

  • Handy_0.8.3_aarch64.dmg
  • SHA256: 17356a9ac6ee46f5e3d3acf140e5e17786d6e48abdc89cbd5135ac900e15eaa1

Notes

  • This release is for macOS Apple Silicon.
  • Adds a Korean-only Sherpa-Onnx Zipformer streaming ASR option for very low-latency live preview.
  • The app can download the model in-app and can create the required local Python runtime automatically.

Handy Qwen3 MLX Fast Live Preview for macOS

12 May 14:59

Choose a tag to compare

변경점

  • macOS Apple Silicon 전용 실험 릴리즈입니다.
  • Qwen3 MLX 실시간 미리보기 지연을 줄였습니다.
  • streaming chunk를 2.0s에서 0.8s로 낮췄습니다.
  • 미리보기 finalization mode를 accuracy에서 latency로 변경했습니다.
  • 미확정 꼬리를 unfixed_chunk_num=1, unfixed_token_num=4로 줄였습니다.
  • Rust 쪽 live preview feed도 0.25초 단위로 더 자주 전달합니다.
  • 최종 입력 정확도는 유지하기 위해 stream_finish 결과를 최종 입력으로 쓰지 않습니다. 녹음 종료 후 기존 offline 전체 전사 결과를 실제 입력값으로 사용합니다.
  • 실제 입력될 최종 offline 결과를 overlay에 마지막으로 반영해, 마지막 표시 내용과 붙여넣는 내용이 맞도록 했습니다.
  • 이전 실시간 미리보기 릴리즈 v0.8.3-qwen3-mlx-ko.5-live-preview와 안정 롤백 태그 stable-before-live-qwen-preview는 그대로 보존했습니다.

왜 stream_finish를 최종 입력으로 쓰지 않나

  • streaming은 짧은 chunk를 순차 디코딩하고, 제한된 context와 rollback으로 빠르게 표시합니다.
  • offline 전사는 전체 오디오를 한 번에 보고 디코딩하므로 문장 경계, 앞뒤 문맥, 마지막 꼬리 정리가 더 유리합니다.
  • 따라서 정확도를 떨어뜨리지 않으려면 최종 입력은 offline 전사를 유지하는 편이 안전합니다.
  • 대신 최종 offline 결과를 overlay에 마지막으로 보내서 실제 입력 내용과 화면의 마지막 표시를 일치시켰습니다.

다운로드

  • Handy_0.8.3_aarch64.dmg: macOS Apple Silicon용 앱

Qwen 모델 파일은 기존 v0.8.3-qwen3-mlx-ko.4 릴리즈 자산을 그대로 사용합니다. 앱 안에서 모델 다운로드를 누르면 자동으로 받아옵니다.

SHA256

  • Handy_0.8.3_aarch64.dmg: 736c636318b542067c0195340ed9367f99476e31b1f174f2286aa54d04e996f1

주의

  • 이 기능은 로컬 Qwen3 MLX streaming 기반의 실험 기능입니다.
  • latency 모드의 미리보기는 빠른 표시를 우선하므로 중간 문장은 더 자주 바뀔 수 있습니다.
  • 최종 입력은 offline 전사를 사용하므로 최종 정확도는 기존 경로를 유지합니다.
  • 이 빌드는 공개 배포용 DMG지만 Apple notarization은 적용하지 않았습니다. 처음 실행 시 macOS 보안 확인이 표시될 수 있습니다.

Handy Qwen3 MLX Live Preview for macOS

12 May 14:35

Choose a tag to compare

변경점

  • macOS Apple Silicon 전용 실험 릴리즈입니다.
  • Qwen3 ASR MLX 선택 시 녹음 중 overlay에 실시간 미리보기를 표시합니다.
  • 실시간 미리보기는 선택된 Qwen3 MLX 모델의 streaming API를 사용합니다. Qwen 1.7B 4-bit를 선택하면 미리보기도 1.7B로 동작합니다.
  • Qwen 스트리밍의 stable_text와 미확정 꼬리 구간을 분리해 표시합니다. 모델이 뒤쪽 텍스트를 다시 쓰면 overlay도 즉시 다시 렌더링됩니다.
  • 최종 전사 경로는 기존처럼 녹음 종료 후 전체 오디오를 다시 전사합니다.
  • 낮은 에너지 조각은 live preview에 보내지 않아 무음 환각을 줄입니다.
  • Qwen 모델 다운로드와 앱 전용 Python 런타임 자동 생성은 유지됩니다.
  • 기존 안정 기준은 stable-before-live-qwen-preview 태그와 v0.8.3-qwen3-mlx-ko.4 릴리즈로 보존했습니다.

다운로드

  • Handy_0.8.3_aarch64.dmg: macOS Apple Silicon용 앱

Qwen 모델 파일은 기존 v0.8.3-qwen3-mlx-ko.4 릴리즈 자산을 그대로 사용합니다. 앱 안에서 모델 다운로드를 누르면 자동으로 받아옵니다.

SHA256

  • Handy_0.8.3_aarch64.dmg: c5f619e13d85aaed9b82b183efb88c44e267447ac5417fb4b5a6703eac4c56b4

주의

  • 이 기능은 로컬 Qwen3 MLX streaming 기반의 실험 기능입니다.
  • 긴 녹음 중에는 1.7B 미리보기로 인해 배터리와 발열이 늘 수 있습니다.
  • 이 빌드는 공개 배포용 DMG지만 Apple notarization은 적용하지 않았습니다. 처음 실행 시 macOS 보안 확인이 표시될 수 있습니다.

Handy Qwen3 MLX Korean ASR for macOS

11 May 17:22

Choose a tag to compare

변경점

  • macOS Apple Silicon 전용 릴리즈입니다.
  • Qwen3 ASR MLX 모델을 프로그램 안의 모델 다운로드 화면에서 받을 수 있게 했습니다.
  • 사용 가능 모델: Qwen3 ASR 0.6B 8-bit MLX, Qwen3 ASR 1.7B 4-bit MLX.
  • Qwen 모델 실행 시 한국어 언어 힌트를 사용하되, 기본 한국어 context 문구는 더 이상 모델 context로 보내지 않습니다.
  • 예전 한국어 context 힌트 문구만 전사 결과로 나온 경우에는 붙여넣지 않도록 빈 결과로 처리합니다.
  • Handy 사용자 지정 단어는 선택적으로 Qwen3 context에 전달합니다.
  • 별도 Python 환경을 직접 준비하지 않아도 되도록, 앱에 uv를 포함했습니다. Qwen 모델 최초 사용 시 앱 전용 Python 런타임을 만들고 mlx-qwen3-asr==0.3.3을 자동 설치합니다.
  • 기존에 HANDY_QWEN3_MLX_PYTHON, .handy-python, qwen3_mlx_python.txt로 지정한 Python 경로가 있으면 그대로 우선 사용합니다.
  • Qwen 1.7B가 정상 동작하던 기준 위에 모델 다운로드와 Python 경로 자동화만 다시 반영했습니다. 녹음/VAD 경로는 건드리지 않았습니다.

다운로드

  • Handy_0.8.3_aarch64.dmg: macOS Apple Silicon용 앱
  • qwen3-asr-0.6b-mlx-q8-g64.tar.gz: 앱 안에서 다운로드되는 Qwen3 ASR 0.6B 8-bit MLX 모델
  • qwen3-asr-1.7b-mlx-q4-g64.tar.gz: 앱 안에서 다운로드되는 Qwen3 ASR 1.7B 4-bit MLX 모델

SHA256

  • Handy_0.8.3_aarch64.dmg: 111e39972439865f54f48d68a1e279e5eaf4cf2e8bf6a3c5d20adddd591fa2a7
  • qwen3-asr-0.6b-mlx-q8-g64.tar.gz: af96f36bd0b6482b237befa441cd951ef3b4b790669deb5dd715c7d312a6307f
  • qwen3-asr-1.7b-mlx-q4-g64.tar.gz: 8ed571e4f49d316ebb96398d021a5a84e051dff2d278b1f09b1117252a5276e3

라이선스 및 주의

  • Handy 코드는 원본 MIT 라이선스를 따릅니다.
  • 포함/연결된 Qwen 모델과 uv에 대한 라이선스 고지는 앱 리소스와 README에 추가했습니다.
  • 모델 파일은 GitHub 릴리즈 자산으로 제공되며, 앱은 위 SHA256으로 내려받은 파일을 검증합니다.
  • 이 빌드는 공개 배포용 DMG지만 Apple notarization은 적용하지 않았습니다. 처음 실행 시 macOS 보안 확인이 표시될 수 있습니다.