x-cmd pkg | franc-cli - 文本语言检测工具

116 阅读2分钟

简介

franc-cli 是文本语言检测工具,用于识别文本所使用的自然语言,最多可识别 419 种语言。

注意

  • franc 参与的决策过程的语言很多,这意味着它对短文本片段的检测是不够准确的。
  • franc 返回 ISO 639-3 代码(三个字母代码)。而不是ISO 639-1 或 ISO 639-2。

首次用户

  1. 使用 x env use franc-cli 即可自动下载并使用

    • 在终端运行 eval "$(curl https://get.x-cmd.com)" 即可完成 x 命令安装, 详情参考 x-cmd 官网
  2. x-cmd 提供1分钟教程,其中包含了 franc-cli 命令常用功能的 demo 示例,可以帮你快速上手 franc-cli 。

  3. 使用案例:

franc-cli-1min-cn

# 安装 franc-cli
x env use franc-cli

# 检测文本自然语言,cmn 代表普通话中文,eng 代表英文
franc "Alle menslike wesens word vry"

# 检测标准输入中文本的自然语言
echo "এটি একটি ভাষা একক IBM স্ক্রিপ্ট" | franc

# 忽略某些语言
franc --ignore por,glg "O Brasil caiu 26 posições"

# 指定语言范围
echo "Alle mennesker er født frie og" | franc --only nob,dan

功能特点

  1. 支持比任何其他库更多的语言提供 3 类语言包,默认使用的 franc 语言支持 187 种语言,franc-min 语言包支持 82 种语言,franc-all 语言包支持 419 种语言。
  2. 相应的衍生作品可移植到其他语言franc 有多种编程语言的移植版,包括 GO、R、Rust、Python 等。

竞品和相关作品

  1. whatlang-rs:franc 的衍生作品,使用 Rust 编写,支持 69 种语言。

  2. lingua-go:Go 语言编写的自然语言检测库,适用于短文本和混合语言文本,支持 75 种语言。

进一步阅读

  • franc-cli 源代码 - franc-cli 项目的源代码托管在 GitHub,你可以在这里找到最新版本的 franc-cli 和参与社区贡献。

关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法