Skip to content

amzxyz/amzxyz

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

35 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Rime 万象拼音生态体系

一套为Rime输入法打造的​​全场景拼音解决方案​​,涵盖输入方案、带声调词库、预测模型、语法模型构建全流程。基于AI优化词库与32GB语料训练,实现智能整句输入与精准多音字处理。


仓库导航

1. RIME-LMDG - 语法模型

​技术亮点:​

  • 🧠 32GB多领域语料训练(新闻/法律/文学/社交等)
  • 📊 多级n-gram模型
  • 🔠 全汉字覆盖(CJK基本区→扩展G区)
  • 🎯 精准多音字处理(词+拼音双键统计)
  • 🛠️ 包含:
    • 模型构建教程
    • 每日更新的词库
    • 语法模型LTS版本
    • 预测模型预览版
    • 分词优化脚本
    • 语料清洗工具链
    • 拼音标注工具链(轻声、变调与幼儿园课本一致)
    • 辅助码标注工具链(万象拼音方案适用)

​适用场景​​:适用于任何编码形式的rime方案,但由于是基于拼音优化,故模型命中利用率应该是:带声调方案>传统拼音(含双拼、全拼)>形码整句>词组类方案(基本等同于词库扩展)


2. rime-wanxiang -万象拼音输入方案

​① wanxiang-base - 标准版双拼输入方案

​核心功能:​

  • ✨ 词库编码为声调全拼,可以通过这个基础库支持任何双拼或者全拼输入
  • ✨ 只支持单字状态下`引导反查定位候选字
  • ✨ 支持`引导的笔画或者部件组词反查
  • ✨ 支持输入编码或者注释里面的带声调编码显示
  • ✨ 支持新型造词用法,避免直接记忆用户词库污染
  • ✨ 智能语言模型支持整句预测
  • 更多详见仓库说明

​适合人群​​:传统输入法大厂输入法首次切换,全拼双拼用户,持有多平台终端的用户,如果万象成为你探索的起点那就从标准版开始吧,


② wanxiang-pro - 双拼辅助码增强版输入方案

​核心功能:​

  • ✨ 支持10种主流双拼(自然码/小鹤双拼/微软双拼/搜狗双拼/紫光双拼/智能ABC双拼/国标双拼/自然龙双拼(声调布局)等,用户也可以通过拼写运算获得任意双拼)
  • ✨ 提供6种辅助码体系(自然码/小鹤/墨奇/汉心/五笔前2/仓颉/虎码首末)
  • ✨ 词库编码为声调全拼+辅助码,可以通过这个库支持任何全拼或者双拼+7种辅助码任意组合搭配
  • ✨ 智能语言模型支持整句预测
  • ✨ 其他配套同标准版本

​​​适合人群​​:具有双拼基础的用户,想要进阶辅助码辅助筛选的用户,持有多平台终端的用户


其他说明

该项目整体两个仓库是为了提升现有rime开源应用中输入体验而做出的努力,并非创造了一种输入布局,开发了一个软件,仅仅是rime生态中基础底座这一环,所以使用者应当清晰认识到,这里找不到教会你使用双拼、使用辅助码的教程,这些应当在你兴趣的作用下自己去调研、去学习, 其次对于rime的用法配置全网也有很多教程和示例,可能需要一定基础才能做到“识货”,本项目也不会在这个上面花过多时间,项目仓库里面写了使用方法。我将会将精力持续放在优化模型、优化词库。 [Star History Chart

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors