Tag Archives: fcitx

Fcitx 5 的拼音有哪些新功能

拼音方面做了特别多的改进,但是目前还没有比较集中的地方说明到底有哪些新功能,所以这里特别列举一下。 1、算法的改进数据采用了和 sunpinyin 相同的 open-gram(也是为什么没有 fcitx5-sunpinyin的原因),算法来说是类似的基于统计语言模型计算概率,在用户的历史处理上和 sunpinyin 有所不同,但是整体来说是类似的。和原本的 Fcitx 4 自带拼音相比的话改进则是巨大的。 2、笔画过滤按 ` (反引号)键触发,可以输入 hpszn(横撇竖折捺)进行搜索。 3、输入颜文字对于有对应颜文字的词组可以直接输入,具体列表可以参考 https://github.com/fcitx/fcitx5-chinese-addons/blob/master/im/pinyin/emoji.txt 4、查询读音选中一段文字之后,可以用快速输入输入 duyin 来列出文字的读音。 5、自定义双拼方案音节例如可以直接指定某个音节对应的双拼,而不是根据单独声母/韵母来指定。此外之前似乎一直和标准不符的自然码方案也得到了修复。 6、多词库管理可以直接导入搜狗的细胞词库,单独启用或者禁用某个词库等。 7、Lua 扩展目前加入了针对候选词匹配的功能,而且预置了一些 lua 功能,例如输入时间: 8、拆字输入通过输入汉字部件来找到对应汉字。例如: 9、一些之前就有的功能笔画输入(直接hpszn输入笔画查找汉字),以词定字,联想,简繁转换,输入单词,云拼音,还有 Fcitx 一直以来就有的高度可扩展的快速输入功能。

Posted in fcitx development | Tagged , , | Leave a comment

The Road to Fcitx 5: 7 Get event order right

I didn’t expect this to be a thing that is only fixed recently. And the fix itself goes through a little bit back and forth. So I’d just like to share it since it is an interesting experience. Between the … Continue reading

Posted in fcitx development | Tagged , | Leave a comment

如何现在就在 Arch Linux 用上 Fcitx 5

一开始想了想要不要在标题写 Arch Linux,觉得还是必要的,因为目前只有 Arch Linux (和 Debian)出于套近乎的关系有了 Fcitx 5 全家桶。 1、需要安装的包 IM Module:fcitx5-gtk / fcitx5-qt 拼音和码表:fcitx5-chinese-addons 其他输入法可以参照 fcitx 4 的对应包名安装(例如 fcitx5-chewing 等) 配置工具:kcm-fcitx5(内含 fcitx5-config-qt 对于依赖纠结的人请去拍打 @felixonmars 拆包) 和 Fcitx 4 有一些文件冲突,不能同时安装。 2、环境变量和启动 和 Fcitx 4 一致即可,如果要多说几句的话那就是: ~/.xprofile (X11) 或者 ~/.bash_profile … Continue reading

Posted in fcitx development | Tagged , | 2 Comments

The Road to Fcitx 5: 6. Addon Loader

Due to a frequently request about adding scripting support to Fcitx, I tried to make Fcitx 5 able to be extended in a different way. During Fcitx 4 times, the addon must be written with Shared library and those assumptions … Continue reading

Posted in fcitx development | Tagged , , | Leave a comment

用拼音输入 Emoji

从技术上来说,没有什么难的,就是挂一个额外的词库。唯一难的就是词库从哪来的问题。因为开源软件总是绕不开一个 License 的问题。 从哪来这件事,Unicode 的 CLDR 提供了一个数据来源,根据语言给不同的颜文字标注了各个语言的文字。所以 Emoji 到汉字的映射就是可以从这里来了。到这里,我们其实可以选择直接像实现笔画输入或者英文输入那样直接匹配插入,但是这样当然会带来一个问题,就是很难把输入的词汇频率和这种外部挂接的候选词组合起来。另一方面,也就无法让句子中混合输入 Emoji 和汉字。所以这里就必须把 Emoji 做成一个从拼音映射过去的词库。然而,如果简单的使用 CLDR 的标记的话,就势必会出现类似现在某个挂载了 Emoji 的 Rime 一样,一个词无数个 Emoji 候选。所以还需要小心的对这些数据进行过滤。所以这部分主要就是我手工来进行修改的,总之有以下几个原则。 1、单个 Emoji 不要对应太多不同的意思,避免“联想”含义的意思。2、避免动词,例如有个🪓的Emoji,在数据里面还有“砍”这样的数据。3、避免单字对应。出于拼音输入的特殊性,如果单字对应 Emoji 过多,可能会影响正常输入。4、避免某个读音有大量的 Emoji 对应。5、避免同一个Emoji的对应汉字互相包含。例如摩托和摩托车都对应了🏍,但是如果它们同时出现在数据中,对于用户来说是无法区分🏍是对应了摩托两个字还是摩托车这三个字的拼音,所以要避免这样的情况发生。 虽然这样有不小的手工工作量,但是为了输入效果应该来说是值得做的。 示例:

Posted in fcitx development | Tagged , | Leave a comment