输入法环境变量的故事

有时候我想想,我是不是应该写一些比较普及的文档(你懂得,我特意纠结了一下措辞)。

那么这次先来介绍一下关于输入法的环境变量配置问题:

在远古时代,世界一片混沌,那时世界上还没有 X 窗口下的输入法支持。

神说,要有输入法,于是就有了 XIM 协议。

这个时代(当然还有个几个XIM协议的版本更新),需要设置的环境变量有

XMODIFIERS=”@im=imname”

比较现代的程序的话,是不用纠结imname这个值的,输入法自己会自己也检测一把这个值,然后启动xim的时候也把自己变成这个值。印象中一定要这个环境变量的程序有xterm。

然后XIM有诸多缺点,至少在输入法程序关闭(不一定是死掉)的时候,可能让程序freeze,或者崩溃。

于是神看到XIM是坏的,授意GTK和QT自己做自己的IM Module。

从此天下大乱。

先来看 Gtk 这边,假设没有环境变量,Gtk是读取一些配置文件里面记录的im module的。每个im module都有指定语言,也就是按环境的语言设置匹配。这里来第一个常见问题:英语环境为什么默认不能用输入法而要纠结 LC_CTYPE=”zh_CN.UTF-8″。就是为了让 Gtk 的匹配能够匹配中文的IM Module。当然我个人是反对这种配置的,因为其实只要 GTK_IM_MODULE 足以。世界上据我所知唯一一个奇葩程序一定要这么设置那就是emacs。(因为作为gtk界面的emacs其实是用XIM协议……鬼知道里面hardcode了啥)

第二个常见问题,为什么卸载了ibus就可以用 fcitx,那是因为系统中同时有两个zh的im module(其实是三个,还包括了xim),你不设置环境变量的话,那就会让gtk自己选择了,这个顺序似乎也不确定,如果选到ibus但你用fcitx,或者选到fcitx你用ibus,都会导致你输入法不能正常使用。

设置了GTK_IM_MODULE之后呢?假设匹配到对应的im module,就会使用对应的im module,假设没匹配到,那就返回之前的没有设置的情况。

LC_CTYPE和设置*_IM_MODULE两种方式我偏好后者。

这里还有个很脑残的问题,GTK一定会去读取 /etc/gtk-2.0/gtk.immodules (按发行版,和cpu架构,以及gtk版本可能不同)里面记录的im module,尽管gtk-query-immodules-2.0和gtk-query-immodules-3.0是可以自己查询的。所以打包者必须自己在安装后脚本内更新这些文件。可能当初Gtk想做缓存……不过现在这年头不缓存也没啥大不了的了。

回到 Qt 这边,情况稍好,首先挑选规则还是如之前所述,按语言。但如果没有环境变量QT_IM_MODUE的干预,这个可以通过 qtconfig 进行选择。以及发行版的打包者们可以不用纠结更新类似GTK那些文件。就这样。

另外顺带一提,QT的环境变量检测是分QT和QT4的,不知道为什么Gtk3发布的时候为什么没有把GTK2和GTK3一起考虑进去。虽然说因此而遭殃的只有一个,那就是scim。如果你不知道它为什么会遭殃的话,请重新学习上文的匹配规则。

(顺带一提其实世界上还有 Clutter 的 IM Module 这种东西。)

话说眺望未来什么的话,那假设进入到了 Wayland 时代,不幸,Wayland 还没有类似 XIM 的统一协议,于是如果程序想支持输入法,最好还是选择 Gtk / Qt 来开发。

This entry was posted in fcitx development and tagged , , . Bookmark the permalink.

11 Responses to 输入法环境变量的故事

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.