Arael

多合一的跨语言文本处理管线

当我们谈论多语言的时候我们在谈论的是多“多”

Arael 支持超过 170 种语言,并且能以 stream 形式处理数以 TB 计的多语种混合的文本。对于中日韩泰等语言。Arael 能够通过机器学习处理重叠歧义和字典外新词。

轻松融入工作流

不仅能进行基本的字形、词语、句子分割,还能够灵活配置各种分析器与过滤器,组成工作流。

完美处理 Emoji

Arael 还完整支持 Unicode® Standard Annex #29 和 Technical Standard #51,用人话说,就是再复杂的 Emoji 也不在话下!

以下产品正在使用 Arael

其他可选语言: English