多平台拼音输入法软件的开发

news2024/11/18 7:39:09

在这里插入图片描述

拼音输入法从上个世纪发展到现在, 已经发展了几十年了, 技术上已经非常成熟了. 换句话说, 就是实际上没多少技术含量, 随便来个人就能手搓一个.

在这里插入图片描述

本文介绍一个简单的多平台拼音输入法软件的设计和实现, 支持 GNU/Linux (ibus) 平台 (PC) 和 Android 平台 (手机).

目录

  • 1 中文输入法简介
  • 2 整体架构设计
    • 2.1 数据
    • 2.2 拼音核心
    • 2.3 图形用户界面
    • 2.4 系统输入法接口与应用
  • 3 具体实现栗子
    • 3.1 架构设计
    • 3.2 拼音核心: 查表+激进学习策略
    • 3.3 PC 平台的界面
    • 3.4 Android 平台的界面
    • 3.5 GNU/Linux 应用 (ibus)
    • 3.6 Android 应用
    • 3.7 安全设计
    • 3.8 输入测量
  • 4 总结与展望

1 中文输入法简介

  • 为什么需要输入法 ?

    省流: 因为汉字数量太多了.

    英文输入计算机非常简单, 因为英文字母只有 26 个, 完全可以在键盘上摆下 26 个按键, 然后按一个按键就输入对应的英文字母.

    但是, 目前 (现代汉语/简体中文) 常用的汉字就有 3000/5000/7000 个. 一组简单的测量数据: 常用 3000 汉字占中文文本中出现的所有汉字的 99%, 常用 5000 汉字占 99.9%, 常用 7000 汉字占 99.99%. 剩下还有几万个, 甚至更多的汉字, 但是很少见了.

    如何输入几千个不同的汉字, 就是一个问题了. 因此产生了许多种不同的中文输入法.

  • 中文输入法有哪些 ?

    根据输入方式可以分为: 键盘输入 (包括实体键盘和屏幕触摸键盘), 语音输入 (语音识别), 手写输入, 光学字符识别 (OCR) 等. 未来可能还有脑电波输入 (脑机接口).

    键盘输入有: 拼音输入法, 形码输入法 (比如 五笔), 音形结合 (拼音+形码) 等.

    虽然有很多种不同的输入法, 但目前拼音输入法仍然是使用最多的.

  • 拼音输入法有哪些 ?

    拼音输入法可以分为 全拼双拼.

    全拼就是输入完整的拼音 (比如 qiong), 也包括简拼 (就是省略一部分拼音).

    双拼就是每个拼音对应两个按键 (比如 qs). 双拼有多种不同的具体方案, 比如 自然码.

  • 拼音输入法有哪些主要挑战 ?

    省流: 重码 (同音字).

    常用汉字有几千个那么多, 但是拼音 (普通话, 不带声调) 只有 400 多个. 所以必然存在一个拼音对应多个汉字的情况, 夸张的时候一个拼音对应 100 多个汉字.

    翻页查找需要的汉字必然很慢, 会大大降低输入效率.

    面对用户这个语焉不详的谜语人, 拼音输入法必须想方设法的去猜, 用户到底想输入什么 ? 然后把用户想输入的东西, 在候选项列表里面尽量往前放, 最好放在第一个.

2 整体架构设计

在这里插入图片描述

作为一个支持多平台的拼音输入法, 整体上可分为平台无关的部分, 和平台相关的部分.

平台无关的部分包括数据, 以及拼音核心. 在各个平台上都是通用的.

平台相关的部分包括图形用户界面, 以及系统输入法接口. 最后需要一个适应相应平台的应用, 来把这些东西装进去.

2.1 数据

输入法核心所需的数据, 以及用户数据库 (学习功能).

比如拼音数据 (拼音和汉字的对应关系), 汉字频率数据, 词库, 语言大模型等. 具体取决于核心使用的方法.

这部分数据需要专门收集, 整理, 准备.

2.2 拼音核心

实现拼音到汉字的转换 (这也是输入法的核心功能).

具体可以使用多种方法. 简单的比如查表, 复杂的比如使用 AI 技术 (语言大模型) 等.

2.3 图形用户界面

不同的设备 (比如 PC, 手机) 需要不同的用户界面.

  • PC 平台 (使用 键盘, 鼠标操作, 一般有 大屏显示器) 具体的设备形态包括: 台式机, 笔记本, 迷你主机 等.

    用户界面主要是候选框窗口, 需要跟随文本光标的位置移动.

  • 手机平台: 用户界面主要是屏幕底部的触摸键盘.

2.4 系统输入法接口与应用

不同的操作系统 (比如 GNU/Linux, Android, Windows) 具有各自不同的输入法接口, 以及应用格式.

  • GNU/Linux (PC) 平台: 系统接口 (输入法框架) 有 ibus, fcitx 等.

    通常系统具有软件包管理器 (比如 pacman, apt, rpm 等). 各个软件由软件包管理器统一安装和升级, 并处理软件包之间的依赖关系.

  • Android (手机) 平台: 系统接口是 Android 输入法框架.

    应用的格式是 apk, 编程语言一般是 JVM (比如 java 或 kotlin).

  • Windows (PC) 平台: 系统接口是 TSF 输入法框架.

    应用格式是 .exe 可执行程序.

3 具体实现栗子

好, 上面把理论部分讲完了, 下面说一个具体的实现.

3.1 架构设计

技术选型的主要目标:

  • (1) 低成本, 快速开发.

    这里是指开发的低成本. 运行性能 (运行速度快, 内存占用小) 相对不重要. 用户体验相对不重要. 也就是说, 这个软件主要是为开发者而开发的.

  • (2) 跨平台.

    所选技术应该能够支持多个平台, 尽量在不同的平台之间多共享代码.

  • (3) 低门槛.

    所选技术应该容易学习, 容易入门, 容易上手, 具有大量的开发者.

没错, 说的就是 web 技术 ! 主要编程语言为 JavaScript.

在这里插入图片描述

拼音核心使用 deno (fresh) 运行环境, 编程语言 TypeScript. deno 是一个类似 node 的 js 运行环境, 使用 rust 编写. 使用 deno 开发比使用 node 更容易, 所以选择 deno. 数据库使用 deno-kv, 底层基于 sqlite.

用户界面使用 vue 框架开发, 经典的 web 技术: js + HTML + CSS. 虽然 PC 和手机的界面需要分别开发, 但因为都在一个 vue 项目中, 两个界面之间也共享了很多代码.

electronjs 是一个基于 chromium 浏览器的壳, 支持 GNU/Linux 平台, 负责把 vue 开发的界面显示出来. 艾刷 (librush) 模块负责与 ibus 输入法框架的接口.

Android 应用使用 WebView (背后还是 chromium) 把 vue 界面显示出来. 同时负责系统输入法接口 (Android 输入法框架).

代码行数统计 (cloc): pmim-server 1936 行 (TypeScript), ui-vue 2396 行 (vue/js), pmim-ibus/electronjs 227 行 (js), librush 1222 行 (rust), pmim-apk 531 行 (kotlin). 代码总数 6312 行 (100%), 平台无关部分 4332 行 (68.6%), 平台相关部分 1980 行 (31.4%), GNU/Linux 平台代码 1449 行 (23.0%), Android 平台代码 531 行 (8.4%).

可以看到, 在这个架构之下, 大部分代码都是平台无关的. 特别是 Android 平台只需要很少的平台支持代码.

3.2 拼音核心: 查表+激进学习策略

相关文章:

  • 《从 Unicode 标准提取拼音数据》 https://blog.csdn.net/secext2022/article/details/136110314
  • 《双拼 (自然码) 的简单实现》 https://blog.csdn.net/secext2022/article/details/136120779

拼音数据从 Unicode 数据库中提取. 词库使用了一个 6 万个词的很小的词库. 拼音切分部分, 实现了双拼 (自然码), 以及自定义双拼表. 拼音转汉字部分, 使用了最简单的查表法, 就是直接查词库.


激进的学习策略, 就是用户输入的东西 永远 优先于内置词库. 会在用户数据库存储用户输入内容的时间和频率 (次数), 查询候选项时, 会根据最近使用时间 (7 天内) 和频率排序.

用户数据库存储在本地, 关于更详细的安全分析请见 3.7 章节.

在这里插入图片描述

比如, 第一次尝试输入 “穷人小水滴”, 由于词库中只有 “穷人”, 所以候选项如图所示.

在这里插入图片描述

输入一次之后, 再次输入, 用户数据库中就有了这个词. 这就是简单的学习功能.

随着使用时间的增加, 用户数据的积累, 输入法会变的越来越好用.

3.3 PC 平台的界面

相关文章:

  • 《使用 electronjs 实现 ibus 输入法的用户界面》 https://blog.csdn.net/secext2022/article/details/136143845

在这里插入图片描述

候选框窗口如图所示. 候选框窗口需要跟随文本光标的位置移动, 并按照需要显示隐藏.

中间显示原始输入 (双拼), 上方显示对应的全拼. 下方显示候选项, 每页 10 个, 按 1 ~ 0 数字键输入对应的候选项. 右侧显示有候选项的页码, 总页数. 按 , . 键翻页. 空格键输入第一个候选项. Esc 键取消输入.

由于这个界面是基于 vue 开发的, 对这个界面进行个性化修改应该是很容易的.

3.4 Android 平台的界面

在这里插入图片描述

这个界面负责卖萌. 点击上方的一行字切换不同的输入界面. 右上角的按钮用来关闭软键盘.

在这里插入图片描述

英文键盘 (默认). 左上角 shift 键 (切换大小写), 右上角退格键 (backspace), 下方大大的空格键, 右下角回车键 (enter).

在这里插入图片描述

英文键盘 (shift).

关于键盘布局的问题, 这个键盘布局被窝称为 abcd7109. 这其实是一种很复古的设计, 因为在 qwerty 键盘布局出现之前, 打字机的键盘是按照英文字母的顺序排列的.

对应源代码 (pmim-ibus/ui-vue/src/im2/c/键盘/键盘布局.js):

// 定义键盘布局 (主键盘): abcd7109
export const 布局 = [
  // 第 1 行: 7
  [
    ["a", "A"],
    ["b", "B"],
    ["c", "C"],
    ["d", "D"],
    ["e", "E"],
    ["f", "F"],
    ["g", "G"],
  ],
  // 第 2 行: 10
  [
    ["h", "H"],
    ["i", "I"],
    ["j", "J"],
    ["k", "K"],
    ["l", "L"],
    ["m", "M"],
    ["n", "N"],
    ["o", "O"],
    ["p", "P"],
    ["q", "Q"],
  ],
  // 第 3 行: 9 + 1
  [
    ["r", "R"],
    ["s", "S"],
    ["t", "T"],
    ["u", "U"],
    ["v", "V"],
    ["w", "W"],
    ["x", "X"],
    ["y", "Y"],
    ["z", "Z"],
    [".", "/"],
  ],
  // 第 4 行: (2)
  [
    ["-", "_"],
    [",", ":"],
  ],
];

所以, 想要修改键盘布局是很容易的.


在这里插入图片描述

拼音输入 (默认状态). 左上角的 shift 键换成了 “重输” 键, 按下会清空全部拼音.

在这里插入图片描述

拼音输入状态, 上方显示输入的拼音 (双拼) 和候选项.

在这里插入图片描述

数字键盘.

在这里插入图片描述

ASCII 符号键盘 (英文标点). 此处包含 ASCII 的全部符号 (32 个, 空格除外), 对写代码友好. 从此在手机上也能好好写代码啦 ~~

在这里插入图片描述

中文标点以及一些符号.


此处 Android 软键盘界面的设计, 主要是为了简单. 各个键盘的职责分工明确, 键盘之间的切换简单直接, 保持一致. 别的输入法各种键盘之间的复杂跳转逻辑, 窝是受不了的, 一会儿在这里点这个键, 一会儿到那里点那个键, 一会儿就绕晕了, 不知道自己在哪里 … .

3.5 GNU/Linux 应用 (ibus)

相关文章:

  • 《ibus 源代码阅读 (1)》 https://blog.csdn.net/secext2022/article/details/136099328
  • 《发布 rust 源码包 (crates.io)》 https://blog.csdn.net/secext2022/article/details/136201091

此处选择了 ibus 输入法框架.

为什么要选择 ibus 呢 ? 因为窝使用 GNOME 桌面环境, GNOME 默认集成了 ibus, 所以使用起来比较方便. 并且, 虽然 ibus 的拼音输入法 (ibus-libpinyin) 窝感觉不太好用, 但是 ibus 本身多年来还是很稳的, 基本上没出过大问题. 虽然还有 fcitx 输入法框架, 但是在 GNU/Linux 桌面环境的软件生态中, ibus 相对更普及一些. 甚至 fcitx 本身也选择了兼容 ibus.

ibus 本身使用 C 和 python 开发, 但是使用 D-Bus 协议连接各个组件. 本输入法虽然使用了 ibus 输入法框架, 但是并没有对 ibus 有代码上的直接依赖, 而是选择从 D-Bus 开始, 兼容 ibus 的协议 (艾刷 librush 模块).

在 web 运行环境的选择上, 窝喜欢 chromium 浏览器内核, 所以排除了 tauri, 选择了 electronjs. electronjs 更加成熟稳定, 有 vscode 这个大厂的产品做代表, 并且 electronjs 不用自己编译, 直接拿过来就能用, 比较方便. 在 GNU/Linux 系统上通常都有软件包管理器进行依赖管理, 这可以抵消 electronjs 的大部分缺点.

专门为 electronjs 编写的代码只有 227 行 (js).

3.6 Android 应用

相关文章:

  • 《Android 输入法框架简介》 https://blog.csdn.net/secext2022/article/details/136246340
  • 《在 Android 运行 GNU/Linux 二进制程序 (proot)》 https://blog.csdn.net/secext2022/article/details/136333781

在 Android 系统就要使用 Android 输入法框架. Android 应用是使用 Android Studio 创建的普通应用, 使用 kotlin 编程语言.

在 Android 使用 WebView 显示网页是标准操作, 也就是使用系统自带的浏览器内核 (chromium). 在国产手机 (比如 MIUI) 上即使不 root, 也可以通过安装 Android System WebView 这个 apk 来更新系统 WebView 内核.

在这里插入图片描述

注意版本号.

在 apk 中打包自带一个浏览器内核, 不是做不到, 但是太麻烦了, 并且相比系统 WebView 没有明显优点.


在 Android 运行 deno 使用了 proot. 这样可以让拼音核心运行起来.

使用 proot 并不是最好的方法, 但是可以接受, 性能并不差.

3.7 安全设计

相关文章:

  • 《高版本 Android 如何访问 sdcard/Android/data 目录中的文件 (翻译)》 https://blog.csdn.net/secext2022/article/details/136335220

此处的安全 (security), 是指信息安全, 网络安全, 黑客攻击这方面的.

事先声明, 绝对的安全是不可能实现的. 开发者能够做的, 是让一个软件合理的, 足够的安全, 不要出现严重安全漏洞而已.

在此详细描述安全方面的设计, 是为了能够公开的对其进行检查. 如果发现这里有安全漏洞, 记得联系窝哦 ~~

  • (1) 用户数据库的存储. 用户数据库保存了一部分用户输入的内容, 这部分是敏感数据, 需要重点保护.

    用户数据库使用 deno-kv, 底层对应 sqlite 数据库. https://deno.com/kv

    • 在 GNU/Linux 平台, 用户数据库文件的位置是:

      > ls -l ~/.config/pmim/pmim_user.db
      -rw-r--r-- 1 s2 s2 2977792  3320:29 /home/s2/.config/pmim/pmim_user.db
      

      这位于用户的主目录中, 而用户主目录默认的权限是 700:

      > ls -ld ~
      drwx------ 1 s2 s2 1136  34日 05:28 /home/s2/
      

      也就是说只有用户自己可以访问. 所以, 在系统环境安全 (没有别的恶意软件偷偷读取这个数据库) 的前提下, 这个数据库文件是安全的.


    • 在 Android 平台, 用户数据库文件的位置是: /sdcard/Android/data/io.github.fm_elpac.pmim_apk/files/pmim/pmim_user.db

      这个是 Android/data/包名 目录, 只有应用自己可以访问, 别的应用无法访问. 所以, 在系统环境安全 (比如没有 root) 的前提下, 这个数据库文件是安全的.

  • (2) 拼音核心 (pmim-server) 的 HTTP 接口. 用户界面通过 HTTP 接口 (REST) 对拼音核心进行请求.

    拼音核心对 HTTP 接口 (API) 的调用使用 token 认证, 对应源代码 (pmim/server/routes/pmims_api/_middleware.ts):

    // /pmims_api/* header: x-token
    // 检查口令 (认证)
    export async function handler(
      req: Request,
      ctx: FreshContext<状态>,
    ) {
      // 首先尝试从 headers 中获取 token
      let token = req.headers.get(HH_TOKEN);
      // 其次从 cookie 中获取 token
      if (null == token) {
        token = getCookies(req.headers)["x_token"];
      }
      // 检查 token 是否正确
      if ((null == token) || (!检查口令(token))) {
        return new Response("HTTP 403", {
          status: 403,
        });
      }
    
      return await ctx.next();
    }
    

    检查口令使用定长时间的比较函数, 这是为了对抗时间侧信道的攻击, 对应源代码 (pmim/server/pmims/auth/token.ts):

    import { timingSafeEqual } from "$std/crypto/timing_safe_equal.ts";
    
    // 内存中保存的口令
    const etc = {
      口令: new Uint8Array(),
    };
    
    export function 检查口令(t: string): boolean {
      const d = new TextEncoder().encode(t);
      return timingSafeEqual(d, etc.口令);
    }
    

    token 使用真随机数据生成, 对应源代码 (pmim/server/pmims/auth/token.ts):

    async function 获取随机数据(): Promise<string> {
      // 64 Byte, 512bit 随机数据
      const a = new Uint8Array(64);
      crypto.getRandomValues(a);
    
      // base64(sha256())
      const h = await crypto.subtle.digest("SHA-256", a);
      return encodeBase64(h);
    }
    
    export function 口令文件路径(): string {
      const 目录 = Deno.env.get(ENV_XDG_RUNTIME_DIR)!;
      return join(目录, FP_TOKEN);
    }
    
    export async function 初始化口令() {
      const 口令文件 = 口令文件路径();
      logi(" token: " + 口令文件);
    
      const 口令 = await 获取随机数据();
      // 存储口令
      etc.口令 = new TextEncoder().encode(口令);
    
      await 建上级目录(口令文件);
      await Deno.writeTextFile(口令文件, 口令);
    }
    

    此处使用的是 Web Crypto API https://developer.mozilla.org/en-US/docs/Web/API/Web_Crypto_API.

    同时, 拼音核心只监听 127.0.0.1 IP 地址, 这意味着只有本机的程序可以连接. 对应源代码 (pmim/server/pmims/conf.ts):

    export const 监听地址 = "127.0.0.1";
    

    源代码 (pmim/server/fresh.config.ts):

    export default function getConfig() {
      return defineConfig({
        plugins: [tailwind()],
    
        server: {
          port: 获取端口(),
          hostname: 监听地址,
          onListen,
        },
      });
    }
    

    • 在 GNU/Linux 平台, 口令文件的存储位置是:

      > ls -l $XDG_RUNTIME_DIR/pmim/server_token
      -rw-r--r-- 1 s2 s2 44  3322:27 /run/user/1000/pmim/server_token
      

      XDG_RUNTIME_DIR 的默认权限是 700:

      > ls -ld $XDG_RUNTIME_DIR
      drwx------ 19 s2 s2 660  34日 06:21 /run/user/1000/
      

      同样的, 只有用户自己可以访问.

      electronjs 读取口令文件的源代码是 (pmim-ibus/electronjs/main.js):

      // 读取 deno/fresh server http token
      async function read_token() {
        const xrd = process.env["XDG_RUNTIME_DIR"];
        const 口令文件 = path.join(xrd, "pmim/server_token");
        logi(" read token: " + 口令文件);
      
        return await readFile(口令文件, { encoding: "utf8" });
      }
      

    • 在 Android 平台, 口令文件的存储位置是: /sdcard/Android/data/io.github.fm_elpac.pmim_apk/files/pmim/server_token

      同样的, 只有应用自己可以访问.

      WebView 中的页面读取口令文件的源代码是 (pmim-apk/p/app/src/main/java/io/github/fm_elpac/pmim_apk/im/ImView.kt):

      // 读取 pmim-server 的口令
      @JavascriptInterface
      fun pm_口令(): String {
        // /storage/emulated/0/Android/data/io.github.fm_elpac.pmim_apk/files/pmim/server_token
        val 外部文件目录 = p.getExternalFilesDir(null)!!
        val 口令文件 = File(外部文件目录, "pmim/server_token")
        println("ImView: 口令文件 " + 口令文件.getAbsolutePath())
      
        return 口令文件.readText()
      }
      

    上述这套机制实现了:

    • (1) 每次启动后都重新生成足够长的随机 token.
    • (2) 只有本机的应用 (127.0.0.1) 才可能请求核心的 HTTP 接口.
    • (3) (GNU/Linux) 只有用户自己的应用 (能够读取口令文件) 才可以请求核心的接口. 本机别的用户无法访问.
    • (4) (Android) 只有应用自己才可以请求核心的接口. 本机别的应用无法访问.

  • (3) 艾刷与拼音核心之间的通信 (仅适用于 GNU/Linux 平台).

    艾刷与拼音核心之间使用 UNIX socket, 对应的文件路径是:

    > ls -l $XDG_RUNTIME_DIR/pmim/us
    srwxr-xr-x 1 s2 s2 0  3322:27 /run/user/1000/pmim/us=
    

    同样的, 只有用户自己可以访问.


未来, 还可以考虑使用 deno 权限, flatpak 沙箱 (sandbox) 等安全机制, 进一步增强应用的安全性 (比如完全禁止网络访问).

3.8 输入测量

俗话说, 没有测量就没有发言权. 拼音输入法使用 web 技术 (JavaScript) 开发, 性能会不会很差 ?

拼音核心实现了对输入的简单测量功能. 本章节来回答这些问题.

输入测量功能实现了对输入字数, 候选项序号, 核心的拼音切分和拼音转汉字的响应时间等的统计. 每分钟产生一条测量数据.

测量方法, 比如拼音核心的响应时间对应源代码 (pmim-ibus/ui-vue/src/输入/输入.js):

  // 调用接口进行拼音切分
  async _拼音切分() {
    // 输入测量
    const d1 = new Date();
    const r1 = await pm_pin_yin();
    const d2 = new Date();
    this._mt_pin_yin.push(测量时间(d1, d2));

// 省略

// 测量时间 (Date) 返回 ms
function 测量时间(d1, d2) {
  return d2.getTime() - d1.getTime();
}

使用 js 内置的 Date 进行时间测量, 精度在毫秒级别.


输入测量接口的原始数据类似这样 (有省略):

> curl -H x-token:(cat /run/user/1000/pmim/server_token) -X POST http://127.0.0.1:20200/pmims_api/m -d '{"d": "2024-03-03"}' | jq '.'
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 37051  100 37032  100    19   789k    414 --:--:-- --:--:-- --:--:--  804k
{
  "2024-03-03": {
    "分钟": 144,
    "统计": {
      "c.c": 1347,
      "c.c/m": 1,
      "c.c/M": 25,
      "c.n": 1347,
      "c.n/m": 1,
      "c.n/M": 25,
      "c.t": 2498,
      "c.t/m": 1,
      "c.t/M": 48,
      "c.t_M": 4,
      "c.t_m": 1,
      "i.c": 256,
      "i.c/m": 0,
      "i.c/M": 24,
      "i.c1": 74,
      "i.c1/m": 0,
      "i.c1/M": 12,
      "i.c1_M": 12,
      "i.c1_m": 0,
      "i.c1_n": 1279,
      "i.c1_n/m": 1,
      "i.c1_n/M": 24,
      "i.c_M": 13,
      "i.c_m": 0,
      "i.cn": 182,
      "i.cn/m": 0,
      "i.cn/M": 24,
      "i.cn_M": 13,
      "i.cn_m": 0,
      "i.cn_n": 141,
      "i.cn_n/m": 2,
      "i.cn_n/M": 11,
      "i.n": 1420,
      "i.n/m": 1,
      "i.n/M": 27,
      "i.n_M": 3,
      "i.n_m": 1,
      "t.c": 69075,
      "t.c/m": 13,
      "t.c/M": 1631,
      "t.c_M": 228,
      "t.c_m": 4,
      "t.c_n": 2613,
      "t.c_n/m": 1,
      "t.c_n/M": 50,
      "t.p": 96648,
      "t.p/m": 25,
      "t.p/M": 2021,
      "t.p_M": 112,
      "t.p_m": 3,
      "t.p_n": 5092,
      "t.p_n/m": 2,
      "t.p_n/M": 96
    },
    "平均": {
      "c.n": 9.354166666666666,
      "c.c": 9.354166666666666,
      "c.t": 17.34722222222222,
      "i.n": 1.0541945063103193,
      "i.c": 0.18028169014084508,
      "i.c1": 0.05785770132916341,
      "i.cn": 1.2907801418439717,
      "t.p": 18.98036135113904,
      "t.c": 26.435132032146957
    },
    "数据": {
      "1326": {
        "c.c": 14,
        "c.n": 14,
        "c.t": 24,
        "c.t_M": 2,
        "c.t_m": 1,
        "i.c": 3,
        "i.c1": 0,
        "i.c1_M": 0,
        "i.c1_m": 0,
        "i.c1_n": 13,
        "i.c_M": 3,
        "i.c_m": 0,
        "i.cn": 3,
        "i.cn_M": 3,
        "i.cn_m": 0,
        "i.cn_n": 2,
        "i.n": 15,
        "i.n_M": 2,
        "i.n_m": 1,
        "t.c": 569,
        "t.c_M": 47,
        "t.c_m": 6,
        "t.c_n": 25,
        "t.p": 860,
        "t.p_M": 97,
        "t.p_m": 4,
        "t.p_n": 48
      },
      "1352": {
        "c.c": 2,
        "c.n": 2,
        "c.t": 2,
        "c.t_M": 1,
        "c.t_m": 1,
        "i.c": 0,
        "i.c1": 0,
        "i.c1_M": 0,
        "i.c1_m": 0,
        "i.c1_n": 2,
        "i.c_M": 0,
        "i.c_m": 0,
        "i.n": 2,
        "i.n_M": 1,
        "i.n_m": 1,
        "t.c": 32,
        "t.c_M": 21,
        "t.c_m": 11,
        "t.c_n": 2,
        "t.p": 129,
        "t.p_M": 58,
        "t.p_m": 11,
        "t.p_n": 4
      },

调用接口可以对某一天的测量数据进行统计. 其中 分钟 是指多少分钟内有输入, 因为每分钟产生一条测量数据, 如果这一分钟之内没有进行输入, 就没有对应的测量数据. 统计 是对一天的所有数据进行分项累计. 平均 是一天之内的平均值. 数据 就是列出所有的原始测量数据, 每分钟一条.

此处的统计分析功能很简单, 但是因为以 JSON 格式输出了原始测量数据, 可以很容易的将数据导出, 然后使用更强大的工具 (比如 python) 进行统计分析.


窝这边最近几天的输入测量数据如下表 (GNU/Linux 平台, ibus):

日期分钟字数拼音切分拼音转汉字候选项
2024-02-24119128422.738.10
2024-02-252930521.438.70.414
2024-02-264644820.733.80.121
2024-02-27112179820.133.60.264
2024-02-28236188719.526.80.112
2024-02-29228264720.124.60.075
2024-03-013016220.533.10.014
2024-03-022527318.324.50.084
2024-03-03144249819.026.50.181
2024-03-04*132233717.425.00.211

注:

  • 日期: 测量数据对应的日期 (收集全部 24 小时).

  • 分钟: 在多少分钟内有输入 (每分钟产生一条测量数据).

  • 字数: 输入的总字数.

  • 拼音切分 (ms): 核心进行一次拼音切分的平均响应时间.

  • 拼音转汉字 (ms): 核心进行一次拼音转汉字 (查询候选项) 的平均响应时间.

  • 候选项: 平均候选项序号.

    输入时选择的候选项的序号 (从 0 开始) 的平均值.

  • *: 当天的数据并不完整.


很明显, 输入测量功能是 2024-02-24 开发完成的, 所以并没有之前的数据. 这些是最近几天窝在真实使用场景之下获得的测量数据, 比如写这篇文章.

拼音切分的平均时间基本稳定在大约 20 毫秒. 拼音转汉字后来进行了一点优化, 时间有所下降, 目前稳定在大约 30 毫秒. 这个性能并不算好, 因为如果应用要达到 60fps 的帧率, 每一帧的时间只有 16.6ms.

但是这是一个可以接受的性能. 因为一般人的击键速度难以超过每秒 10 次, 所以 100ms 以内的响应时间是可以接受的. 并且这是在一个性能并不算好的硬件上获得的结果, 窝使用的是 9 年前的破旧笔记本 (CPU i5-6200U). 在更新的硬件上可能会获得更好的结果.

在这里插入图片描述

这是窝随手做的一个击键速度测试 (英文), 最高击键速度每秒 9 次, 每分钟 314 次 (平均 5.2 次/秒).


平均候选项序号, 这个最理想的情况下是 0, 意味着每次输入的候选项都是第一项. 目前这个值大约在 0.1 ~ 0.2 之间, 也就是说大部分输入 (80%) 的候选项是第一项. 这说明输入法核心的性能并不算很差.

目前使用输入法的时间并不长, 用户数据还没有足够的积累. 后续随着不断的使用, 这个值会逐渐下降的.

在这里插入图片描述

这是在一只几年前的旧手机上的运行情况, 内存和存储的占用都在可接受的范围内. 主观感受也能流畅运行.

4 总结与展望

在这里插入图片描述

图片标题: 《拼 2024: 方圆之间, 刺破命运》

本文实现了一个简单的多平台拼音输入法, 支持 GNU/Linux (ibus) 平台 (PC), 和 Android 平台 (手机). 这个输入法的完整源代码只有几千行, 开发这个输入法也只用了十几天的时间.

开发这个拼音输入法主要有两个目的:

  • (1) 自用. 目前这个拼音输入法已经覆盖了窝日常使用的所有设备, 包括一个笔记本 (ArchLinux), 以及 3 只手机 (Android 10, Android 11, Android 12). 从此, 窝就可以只使用自己的拼音输入法啦 ~

  • (2) 用于科普拼音输入法的工作原理.

本输入法基于 web 技术开发, 主要编程语言为 JavaScript, 具有低成本, 快速开发, 跨平台, 低门槛等优点. 经过实际测量, web 技术的性能并不差, 完全可以接受.

输入法需要处理用户输入的敏感数据, 在安全方面需要格外注意. 本文对本输入法的安全设计进行了详细描述.

这个输入法在技术上和功能上都十分简单 (简陋), 拼音核心只使用了最简单的查表法. 但是是可以实际使用的, 比如写这篇文章.

对穷人来说, 便宜, 能用, 就是好.

后续在技术升级方面, 计划一步到位: 使用本地运行的语言大模型.


本文使用 CC-BY-SA 4.0 许可发布.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1488449.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++庖丁解牛】默认成员函数

&#x1f4d9; 作者简介 &#xff1a;RO-BERRY &#x1f4d7; 学习方向&#xff1a;致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 &#x1f4d2; 日后方向 : 偏向于CPP开发以及大数据方向&#xff0c;欢迎各位关注&#xff0c;谢谢各位的支持 目录 前言1. 构造函数1.1 …

低空经济20人|卓翼智能任雪峰:以技术驱动市场,引领无人机细分领域创新

作为国内系留无人机领域的领头羊企业&#xff0c;卓翼智能致力于提供智能无人系统解决方案。本期“低空经济20人”请到卓翼智能CEO任雪峰分享他对系留无人机研发应用的经验以及未来无人机行业生态发展的观点。 如今&#xff0c;无人机的应用场景逐渐广泛&#xff0c;在社会发展…

pycharm社区版+miniconda 环境配置学习

使用电脑为win10 64bit 一、下载&#xff1a; 1.pycharm社区版地址&#xff1a; 其他版本 - PyCharm 2.miniconda下载地址&#xff1a; Index of /anaconda/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 3.python下载地址&#xff1a; https://www.python.or…

百度AI,能否“投”出未来?

图片&#xff5c;freeflo.ai ©自象限原创 作者丨程心、罗辑 2月28日&#xff0c;百度发布了2023年四季度财报及全年未经审计的财务报告&#xff0c;AI大模型带来的收入和利润成为最大的亮点。 财报显示&#xff0c;2023年百度集团总营收达1345.98亿元&#xff0c;同比增…

一文读懂Penpad 以 Fair Launch 方式推出的首个资产 PEN

随着 2 月 28 日比特币重新站上 6 万美元的高峰后&#xff0c;标志着加密市场正在进入新一轮牛市周期。在 ETF 的促进作用下&#xff0c;加密市场不断有新的资金流入&#xff0c;加密货币总市值不断攀升。Layer2 市场率先做出了反应&#xff0c;有数据显示&#xff0c;当前以太…

混合注意力机制全新工作!性能表现SOTA!准确率达98.53%

在神经网络中&#xff0c;为增强模型对数据中重要特征的识别和处理能力&#xff0c;研究者们通常会同时使用不同类型的注意力机制&#xff0c;包括空间注意力、通道注意力、自注意力等。这种结合了多种不同类型注意力机制的技术就是混合注意力机制。 混合注意力机制的研究和应…

Thingsboard本地源码部署教程

本章将介绍ThingsBoard的本地环境搭建&#xff0c;以及源码的编译安装。本机环境&#xff1a;jdk11、maven 3.6.2、node v12.18.2、idea 2023.1、redis 6.2 环境安装 开发环境要求&#xff1a; Jdk 11 版本 &#xff1b;Postgresql 9 以上&#xff1b;Maven 3.6 以上&#xf…

电脑无法开启虚拟化

vm开启虚拟化失败 如果出现以下错误&#xff0c;需要进入bios界面&#xff0c;不同电脑进入界面的方式不一样。这里以hp为例&#xff1a; 1、关机后&#xff0c;按住开机键和f10&#xff0c;进入如下界面&#xff08;语言在主菜单里面&#xff09; 2、选择先进和下面的系统选…

检修弧形导轨需遵守的原则

弧形导轨被广泛应用在各行各业中&#xff0c;特别是工业自动化领域中&#xff0c;是自动化机械设备中重要的传动零部件。在使用弧形导轨时&#xff0c;为防止意外发生或对机械设备造成损坏&#xff0c;在检修过程中必须遵守以下一些原则&#xff1a; ●安全第一&#xff1a;出现…

windows安装pytorch(anaconda安装)

文章目录 前言一、安装anaconda1、进入官网下载&#xff08;1&#xff09;点击view all Installers&#xff08;2&#xff09;下载需要的版本 2、一顿默认安装就行&#xff08;到这一步这样填&#xff09;3、进入开始找到Anaconda Prompt&#xff0c;点击进入到base环境 二、新…

docker部署aria2-pro

前言 我平时有一些下载视频和一些资源文件的需求&#xff0c;有时候需要离线下载&#xff0c;也要速度比较快的方式 之前我是用家里的玩客云绝育之后不再写盘当下载机用的&#xff0c;但是限制很多 我发现了aria2 这个下载器非常适合我&#xff0c;而有个大佬又在原来的基础…

Linux笔记-3

软件安装 概述 在Linux中&#xff0c;软件安装分为3种方式&#xff1a;绿色安装(压缩包解压之后就能直接使用)&#xff0c;rpm安装(类似于Windows中的exe或者msi文件)&#xff0c;yum安装 RPM(Red Hat Package Manager)&#xff1a;红帽提供的软件包的管理工具。可以通过rpm命…

世界的本质是旋转(5)-在复平面上驱动软件无线电SDR交换BPSK波形

在上一篇文章中&#xff0c;我们介绍了复平面、拍照采样的一些思维实验。从本节开始&#xff0c;转入现实应用&#xff0c;通过控制复平面向量的位置&#xff0c;实现一个完整的BPSK全双工通信通道。 发射方&#xff1a;通过控制复平面向量在各个时刻的位置来携带信息的技术&a…

LeetCode234题:回文链表(python3)

代码思路&#xff1a;将链表的值复制到数组列表中&#xff0c;再使用双指针法判断&#xff0c;不断更新current_node的值。 # Definition for singly-linked list. # class ListNode: # def __init__(self, val0, nextNone): # self.val val # self.next…

水泵远程自动控制系统

随着科技的不断进步和工业的快速发展&#xff0c;传统的水泵管理方式已经无法满足现代水利系统的需求。为了应对这一挑战&#xff0c;HiWoo Cloud水泵远程自动控制系统&#xff0c;旨在通过智能化、网络化的技术手段&#xff0c;实现对水泵的远程监控、自动调节和智能管理&…

可让照片人物“开口说话”阿里图生视频模型EMO,高启强普法

3 月 1 日消息&#xff0c;阿里巴巴研究团队近日发布了一款名为“EMO&#xff08;Emote Portrait Alive&#xff09;”的 AI 框架&#xff0c;该框架号称可以用于“对口型”&#xff0c;只需要输入人物照片及音频&#xff0c;模型就能够让照片中的人物开口说出相关音频&#xf…

海外代购系统独立站,商品采集API接口系列

海外代购系统独立站是一个完整的电商平台&#xff0c;专为代购业务设计。这样的系统通常具备商品采集、库存管理、订单处理、支付集成、物流追踪等功能。其中&#xff0c;商品采集是整个系统的基础&#xff0c;而API接口是实现商品采集的关键。 请求示例&#xff0c;API接口接…

3 月 4 日-5 月 3 日|2024 乐鑫全球开发者大会演讲征集中!

乐鑫信息科技 (688018.SH) 全球开发者大会作为一年一度的技术盛宴&#xff0c;旨在为全球开发者们提供一个交流、分享、学习的平台。在这里&#xff0c;您可以与来自世界各地的同行们在线交流&#xff0c;共同探讨技术的最新动态和发展趋势。 30 场技术演讲每年 前沿创新、物…

企业必备监管工具:让管理更简单,效率倍增!

微信作为当前广泛使用的沟通工具&#xff0c;成为企业监管的重要对象。因此&#xff0c;使用微信管理系统成为企业必备的监管工具之一。下面就给大家分享微信管理系统的监管功能&#xff0c;让大家的管理更简单、更高效&#xff01; 1、敏感词监控 设置完成后&#xff0c;一旦…

leetcode日记(36)全排列

想思路想了很久……思路对了应该会很好做。 我的思路是这样的&#xff1a;只变化前n个数字&#xff0c;不断增加n&#xff0c;由2到nums.size()&#xff0c;使用递归直到得到所有结果 代码如下&#xff1a; class Solution { public:vector<vector<int>> permut…