使用我们在前面的步骤中使用的分类

挖掘器输出已经部分解决了分类问题。其余类别需要手动处理。 分类本身是通过识别分析中的大模式、用通用名称(例如类型或颜色)标记它们并逐渐将单个模式合并到其中来进行的。您可以在这里找到Marko Prokop的精彩指南,了解如何考虑分类和分类以及如何进行分类: http://vyhledavace.info/clanky/246/klasifacni-analyza-klicovych-slov 3.2. OpenRefine 中的数据清理和分类 OpenRefine 是一个很棒的数据清理工具。

即使是大的输入对他来说也不是问题

并且他为您准备了一些非常有用的功 能: 3.2.1.识别不相关的模式 首先,需要在 OpenRefine 中创建一个项目,其中包 德国 Whatsapp 号码 含来自 Marketing Miner 输出的分析数据。我在下面的视频中展示了如何快速分析和删除不必要的模式(说明如下): OpenRefine 具有许多功能来处理快速数据集分析。具体来说,我们将使用所谓的Word facet,它将短语划分为单个单词,然后计算它们的出现频率(类似于我上面提到的词云)。

在其中我找到了不相关的模式

WhatsApp 号码

并借助删除所有匹配行函数将它们从数据集中删除。 3.2.2. OpenRefine 中的分类 分类时,与搜索不适当的问题类似,我会在所 越南电报号码 有问题上方创建一个 Word 分面,在其中查找要分类的模式。根据其中的数据,我创建列,其中包含我想要向其分配问题的类别名称。 视频教程: 我在视频中实际做了什么: 我将创建一个单词构面,从而获得查询出现的频率。 根据 Word 方面的数据,我决定对服务进行分类,因此我为其创建一个空列。

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top