文本分类模型训练及应用
1. 积木功能说明
- 功能简介:输入的文本集数据进行文本分类。
- 参数说明:
- 参数1:要进行文本分类的数据样本,参数类型支持 字符串 和 字典 类型。如果是字符串,则表示数据集表格文件的路径。如果是字典,则需要按照指定的格式。具体参见下文样例。
- 返回值:训练好的文本分类模型路径。
- 功能简介:加载文本分类模型。
- 参数说明:
- 参数1:要加载的文本分类模型文件路径。
- 返回值:文本分类模型对象。
- 功能简介:用文本分类模型对输入文本进行分类。
- 参数说明:
- 参数1:文本分类模型对象。
- 参数2:要分类的文本数据。
- 返回值:分类结果。类型为字符串。
2. 注意事项
- 无。
3. 积木块应用案例
3.1 文本分类模型训练
文本分类模型训练可以接收两种格式的数据集,分别为表格文件和字典。
3.1.1 使用表格类型数据进行训练
数据集比较大的时候,推荐用表格数据进行训练。
注意:
- 参数需要输入数据集表格文件全路径
csv表格的格式如下图,列名必须为“text”和“label”,且文本数据为字符串类型。
3.1.1 使用字典类型数据进行训练
数据集少的时候用字典,录入训练数据进行训练很方便。
注意:
字典数据集的格式为:键为类别名,值为该类别下的文本数据列表。
3.2 文本分类模型加载及使用
下图是使用前述训练好的文本分类模型进行分类的示例。