文本分类模型训练及应用

1. 积木功能说明

  • 功能简介:输入的文本集数据进行文本分类。
  • 参数说明
    • 参数1:要进行文本分类的数据样本,参数类型支持 字符串字典 类型。如果是字符串,则表示数据集表格文件的路径。如果是字典,则需要按照指定的格式。具体参见下文样例。
  • 返回值:训练好的文本分类模型路径。

  • 功能简介:加载文本分类模型。
  • 参数说明
    • 参数1:要加载的文本分类模型文件路径。
  • 返回值:文本分类模型对象。

  • 功能简介:用文本分类模型对输入文本进行分类。
  • 参数说明
    • 参数1:文本分类模型对象。
    • 参数2:要分类的文本数据。
  • 返回值:分类结果。类型为字符串。

2. 注意事项

  • 无。

3. 积木块应用案例

3.1 文本分类模型训练

文本分类模型训练可以接收两种格式的数据集,分别为表格文件和字典。

3.1.1 使用表格类型数据进行训练

数据集比较大的时候,推荐用表格数据进行训练。

注意:

  • 参数需要输入数据集表格文件全路径
  • csv表格的格式如下图,列名必须为“text”和“label”,且文本数据为字符串类型。

3.1.1 使用字典类型数据进行训练

数据集少的时候用字典,录入训练数据进行训练很方便。

注意:
字典数据集的格式为:键为类别名,值为该类别下的文本数据列表。

3.2 文本分类模型加载及使用

下图是使用前述训练好的文本分类模型进行分类的示例。

  • 点击这里下载 使用表格类型数据进行训练 的积木代码。

  • 点击这里下载 使用字典类型数据训练 的积木代码。

  • 点击这里下载 文本分类模型加载及应用 的积木代码。

Copyright © 古德微 2023 all right reserved,powered by GDWRobot本课修订时间: 2024-09-28

results matching ""

    No results matching ""