ainput

ainput 是一款支持智能候选的 AI 驱动全局输入法。

ainput 支持多种大模型服务和本地 AI 工具，提供输入历史、剪贴板等上下文的智能候选，配置灵活，注重隐私。 ⚠️ 本项目涉及输入内容、窗口信息等数据上传至大模型服务商，详见下文"隐私声明"

需求背景

在任意输入框输入拼音或任意文本，自动弹出 AI 智能候选
多屏/高DPI 环境下，候选框总能精准跟随输入框
输入历史、剪贴板内容智能融合，提升输入效率

使用示例

AI 智能候选
修改配置

完整配置见config.toml

实现原理

ainput 的核心能力依赖于 Windows UI Automation —— 微软官方提供的自动化API，能够跨进程、跨窗口地枚举所有UI控件（如按钮、文本框、窗口、菜单等）。

本项目通过 Tauri 后端（Rust）集成 Windows UI Automation，主要流程如下：

利用 Rust 的 windows crate 调用 UI Automation COM 接口，获取聚焦桌面窗口和控件
获取每个控件的类型（ControlType）、名称、可见性、可交互性、屏幕坐标、窗口层级等属性
结合自定义控件类型映射和过滤规则，生成 AI 候选点
后端将控件信息和 AI 候选点数据传递给前端/Overlay 进行渲染和交互

通过 Windows UI Automation，ainput 能够实现对所有可见窗口和控件的精准捕捉和操作，为全局 AI 候选提供底层支撑。

自绘控件应用的限制与注意事项

部分应用的输入框是“自绘控件”（如微信、钉钉等），它们不完全遵循标准 UI Automation 的文本读写能力。为兼容此类应用，ainput 会采用“剪贴板 + Ctrl+V 粘贴”的方式进行填充，这带来一些使用局限：

填充方式与行为
- 采用“设置剪贴板 → 模拟 Ctrl+V → 等待 → 恢复剪贴板”的流程，不调用 SetValue。
- 仅在光标当前位置粘贴，不读取或修改原有文本内容。
对系统剪贴板的影响
- 粘贴期间会短暂覆盖系统剪贴板，默认约 160ms 后自动恢复原内容。
- 若安装了剪贴板管理/同步工具，可能拦截或持久化这段临时内容，导致恢复异常。
焦点与按键冲突
- 目标输入框必须保持焦点，粘贴才会落到正确位置；切屏/失焦会导致粘贴无效。
- 若其他软件占用/改写了 Ctrl 或 V（全局热键、输入法等），模拟的 Ctrl+V 可能被吞掉。
文本位置与选区
- 由于自绘控件往往不暴露插入点/选区信息，无法精确控制插入位置，只能依赖应用内的光标位置。
受限/安全输入
- 密码框、安全控件或部分富文本区域可能禁止粘贴或清洗特殊字符，不能保证成功填充。
速率与稳定性
- 连续多次粘贴可能触发应用节流。
配置要求
- 请将应用进程名加入 src-tauri/config.toml 中的 ui_automation.self_draw_apps（已内置：Weixin.exe、DingTalk.exe）。
- 如需，补充 ui_automation.app_edit_control_types 以覆盖该应用的编辑控件类型，确保能正确识别为可编辑控件。

总结：自绘控件应用可用，但可靠性取决于目标应用对剪贴板与键盘事件的处理方式；在安全输入、特殊富文本或被第三方工具干预的场景下，粘贴可能失败或表现不一致。

安装与使用

方式一：直接下载

前往 Releases 页面下载最新的 ainput.exe 和 config.toml 文件。
将二者放在同一目录下，修改config.toml添加AI服务接入方式，双击运行 ainput.exe。
托盘会出现 ainput 图标，可右键设置。
如需自定义配置，编辑 config.toml，保存后重启生效。

方式二：源码编译运行

# 克隆仓库
git clone https://github.com/alvinfunborn/ainput.git
cd ainput

# 安装依赖
npm install

# 构建 Tauri 后端
cd src-tauri
cargo build

# 开发模式启动
cd ..
npm run tauri dev

# 打包
npm run tauri build

配置详见 src-tauri/config.toml
支持托盘、开机自启、快捷键自定义

AI服务接入模式

ainput 支持两种大模型调用模式，用户可根据自身需求和已购服务自由选择：

API模式 通过 HTTP API 调用大模型服务（OpenAI大模型API接口定义服务商，如 OpenAI、火山方舟、阿里云百炼等），需在 config.toml 中配置 API Key。适用于拥有相关 API 权限的用户。
CMD模式 通过本机命令行工具（如 gemini-cli）调用大模型。适用于已安装并配置好命令行 AI 工具，有结合本机系统能力需求的用户。

注意： 若使用 gemini-cli，请确保已在本机命令行中完成登录（如运行 gemini），否则无法正常生成候选。

Prompt 传递方式：
- {{prompt_file}} - 临时文件路径（如 cli <{{prompt_file}}）
- {{prompt}} - 内联内容（如 cli -p "{{prompt}}"）
- 无占位符 - 通过 stdin 传递（如 cli -p）

可在 config.toml 中通过 ai_client.provider 字段选择模式，并配置相应参数。

默认快捷键

候选框激活时
- Tab：选择候选词
- 1: 选择候选词的第一个字
- Esc：关闭候选框
其它快捷键可在配置中自定义

性能

内存占用：常驻后台时约 10MB。
CPU 占用：即使频繁扫描 UI，空闲时 CPU 占用通常低于 1%。
启动速度：大多数现代设备下启动时间小于 1 秒。
后台线程：仅有少量轻量线程用于 UI Automation 和事件钩子。

安全性

开源可审计，无后门
仅需普通用户权限

隐私声明

ainput 在生成 AI 候选词时，会采集并上传如下信息到大模型服务商：

当前输入框的内容（你正在输入的文本）
当前窗口的应用名、标题、类名、坐标等
输入历史（部分内容）
剪贴板内容（部分场景）

这些信息会被拼接为 prompt/context，发送到远程 AI 服务，用于生成候选词。

隐私保护现状：

支持通过脱敏正则对部分敏感内容进行脱敏处理
可通过 ignore_apps 配置忽略指定应用，不采集其数据
但仍可能存在未覆盖的隐私风险，部分敏感信息可能被上传
目前尚未实现本地加密或更细粒度的隐私过滤

用户须知：

使用前请充分了解：你的输入内容、窗口信息、历史、剪贴板等可能会被上传到大模型服务商
这些服务商的隐私政策请自行查阅
若对隐私有高要求，请勿在敏感场景下使用，或关闭 AI 功能
本项目不对因隐私泄露造成的后果负责

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ainput

需求背景

使用示例

实现原理

自绘控件应用的限制与注意事项

安装与使用

方式一：直接下载

方式二：源码编译运行

AI服务接入模式

默认快捷键

性能

安全性

隐私声明

附录

FilesExpand file tree

README_zh.md

Latest commit

History

README_zh.md

File metadata and controls

ainput

需求背景

使用示例

实现原理

自绘控件应用的限制与注意事项

安装与使用

方式一：直接下载

方式二：源码编译运行

AI服务接入模式

默认快捷键

性能

安全性

隐私声明

附录