bipuuk

v0.2.1-alpha.2

形態論

形態素

bipuuk には大きく分けて2つの形態素があります。

語根

高さ 4 の木を 語根 とします。自然数表記では 26676 に相当し、全部で 651 個あります。

接辞

高さ 0 ~ 3 の木を 接辞 とします。自然数表記では 025 に相当し、全部で 26 個あります。

形態素の連結

接辞 + 接辞

まず、接辞と接辞は連結することができません。なぜなら、連結してできる木の高さが 1 ~ 4 となってしまい、既存の形態素と被ってしまうからです。

この制約によって bipuuk では木の形態素解析が一意にできるようになっています。

語幹 := 語根 | (語幹 + 語幹)

語根と語根を連結すると、新たな辞書定義が生まれます。語根1つ以上のまとまりを 語幹 とします。(もともと語根、語基、語幹あたりの定義にブレがありますがここではそうします。)

語 := 語幹 + 接辞

語幹と接辞を連結すると となります。語幹が意味内容、接辞が文法的役割を決定します。

語 + 語

文はこのような語の連結からなります。