Skip to content

togatoga/karukan

Repository files navigation

karukan

Karukan

Linux向け日本語入力システム — ニューラルかな漢字変換エンジン + fcitx5

CI (engine) CI (im) License: MIT OR Apache-2.0

karukan demo

プロジェクト構成

クレート 説明
karukan-im karukan-engineを利用したfcitx5向け日本語入力システム
karukan-engine コアライブラリ — ローマ字→ひらがな変換 + llama.cppによるニューラルかな漢字変換
karukan-cli CLIツール・サーバー — 辞書ビルド、Sudachi辞書生成、辞書ビューア、AJIMEE-Bench、HTTPサーバー

特徴

  • ニューラルかな漢字変換: GPT-2ベースのモデルをllama.cppで推論し、高度な日本語変換
  • コンテキスト対応: 周辺テキストを考慮した日本語変換
  • 変換学習: ユーザーが選択した変換結果を記憶し、次回以降の変換で優先表示。予測変換(前方一致)にも対応し、入力途中でも学習済みの候補を提示
  • システム辞書: SudachiDictの辞書データからシステム辞書を構築

Note: 初回起動時にHugging Faceからモデルをダウンロードするため、初回の変換開始までに時間がかかります。2回目以降はダウンロード済みのモデルが使用されます。

インストール

インストール方法は karukan-im の README を参照してください。

ライセンス

MIT OR Apache-2.0 のデュアルライセンスで提供しています。

About

Japanese Input Method System for Linux, Neural Kana-Kanji Conversion Engine + fcitx5 IME

Topics

Resources

License

Apache-2.0, MIT licenses found

Licenses found

Apache-2.0
LICENSE-APACHE
MIT
LICENSE-MIT

Stars

Watchers

Forks

Packages