Arael
多合一的跨语言文本处理管线。
当我们谈论多语言的时候我们在谈论的是多“多”
Arael 支持超过 170 种语言,并且能以 stream 形式处理数以 TB 计的多语种混合的文本。对于中日韩泰等语言。Arael 能够通过机器学习处理重叠歧义和字典外新词。
轻松融入工作流
不仅能进行基本的字形、词语、句子分割,还能够灵活配置各种分析器与过滤器,组成工作流。
完美处理 Emoji
Arael 还完整支持 Unicode® Standard Annex #29 和 Technical Standard #51,用人话说,就是再复杂的 Emoji 也不在话下!
其他可选语言:
English