想象。您是一所职业学校的董事会成员。暑假即将来临,这只意味着一件事:制定未来几年的新多年计划。每个课程都写自己的政策计划,每个部门都向你提交一些内容。您的数字办公桌上的纸张堆积日渐增多,您有责任保持良好的概览。哪些政策方案大同小异,哪些部门政策方案截然相反?各个课程对可持续性有何看法?
尼梅托比较和总结多个团队计划。”去年夏天,Nimeto 数字化和 IT 团队负责人 Jelle van Baggem 向 ilionx 提出了这个问题。尼梅托是乌得勒支的一所现代化职业学校,专门培养富有创造力和进取心的学生。因此,毫不奇怪,Nimeto 完全与时俱进,并寻求一种分析文本的现代解决方案。
基于我们的文本分析服务,我们开始工作并构建了一个出色的解决方案,使 Nimeto 能够分析其文本。我们可以在工具中生成关键词和摘要。此外,我们还构建了一个功能,通过测量不同文档中涵盖的主题的相似程度来显示哪些文档是相似的。涵盖相 尼日利亚电报数据 同主题的计划彼此接近,而涵盖完全不同内容的文件则相距甚远。这样我们就可以用坐标系来显示哪些文档是相似的。例如,在左下角我们看到三个计划的集群,Jelle 对此热情地回应:“嘿,没错!这些计划是由三个不同的部门联合编写的,这意味着他们抄袭了彼此文本的部分内容。”
坐标系中的已分析文档。
坐标系中的已分析文档。虽然这些文件已被匿名化,但其思想很明确:相似的文件彼此距离更近。
最后,该解决方案允许灵活搜索。例如,如果你搜索“可持续性”,你还会找到有关“绿化”或“节能”的文本,因为我们已经能够教会计算机这些词是密切相关的。这样,即使您不记得它到底说了什么,也能轻松找到一段文本。