使用JPA的简单标签实现

1. 概述

标签是一种标准设计模式，它允许我们对数据模型中的元素进行分类和过滤。

在本文中，我们将使用Spring Data来实现标签。这是关于实现标签系列文章中的第二篇。要了解如何使用Elasticsearch实现它，请访问此处。

2. 添加标签

首先，我们介绍最直接的标签实现：字符串集合。我们可以通过向实体添加一个新字段来实现标签，如下所示：

@Entity
public class Student {
    // ...

    @ElementCollection
    private List<String> tags = new ArrayList<>();

    // ...
}

注意tags字段上使用的@ElementCollection注解。由于这里涉及到数据库，我们需要告诉它如何存储我们的标签。

如果我们不添加该注解，它们将存储在一个单一的blob中，这会更难处理。这个注解创建另一个名为STUDENT_TAGS(即<entity>_<field>)的表，这可以使我们的查询更加健壮。实际上，这在我们的实体和标签之间创建了一对多关系，我们在这里实现了最简单的标签版本。因此，我们可能会有很多重复的标签(每个实体都有一个标签)，稍后我们会详细讨论这个概念。

3. 构建查询

标签允许我们对数据执行一些有趣的查询。我们可以搜索具有特定标签的实体，过滤表扫描，甚至限制特定查询返回的结果。让我们来看看这些案例中的每一个。

3.1 搜索标签

我们添加到数据模型中的tags字段可以像模型中的其他字段一样进行搜索。在构建查询时，我们将标签保存在单独的表中。

下面是搜索包含特定标签的实体的例子：

@Query("SELECT s FROM Student s JOIN s.tags t WHERE t = LOWER(:tag)")
List<Student> retrieveByTag(@Param("tag") String tag);

因为标签存储在另一个表中，所以我们需要在查询中进行表连接，这将返回所有具有匹配标签的学生实体。

首先，我们添加一些测试数据：

Student student = new Student(0, "Larry");
student.setTags(Arrays.asList("full time", "computer science"));
studentRepository.save(student);

Student student2 = new Student(1, "Curly");
student2.setTags(Arrays.asList("part time", "rocket science"));
studentRepository.save(student2);

Student student3 = new Student(2, "Moe");
student3.setTags(Arrays.asList("full time", "philosophy"));
studentRepository.save(student3);

Student student4 = new Student(3, "Shemp");
student4.setTags(Arrays.asList("part time", "mathematics"));
studentRepository.save(student4);

接下来，我们测试它以确保标签有效：

// Grab only the first result
Student student2 = studentRepository.retrieveByTag("full time").get(0);
assertEquals("name incorrect", "Larry", student2.getName());

我们得到的是Repository中带有“full time”标签的第一个学生，这正是我们想要的。

此外，我们可以扩展这个例子来演示如何过滤更大的数据集，例如：

List<Student> students = studentRepository.retrieveByTag("full time");
assertEquals("size incorrect", 2, students.size());

通过一些重构，我们可以修改Repository以将多个标签作为过滤器，这样我们就可以进一步细化我们的结果。

3.2 过滤查询

简单标签的另一个有用应用是将过滤器应用于特定查询。虽然前面的示例也允许我们进行过滤，但它们处理的是我们表中的所有数据。

由于我们还需要过滤其他搜索，我们来看一个例子：

@Query("SELECT s FROM Student s JOIN s.tags t WHERE s.name = LOWER(:name) AND t = LOWER(:tag)")
List<Student> retrieveByNameFilterByTag(@Param("name") String name, @Param("tag") String tag);

我们可以看到这个查询与上面的查询几乎相同，标签只不过是在我们的查询中使用的另一个约束。

我们的用法示例也将看起来很熟悉：

Student student2 = studentRepository.retrieveByNameFilterByTag("Moe", "full time").get(0);
assertEquals("name incorrect", "moe", student2.getName());

因此，我们可以将标签过滤器应用于该实体的任何查询，这为用户在接口中提供了很大的权力来找到他们需要的确切数据。

4. 高级标签

简单的标签实现是一个很好的开始，但是，由于一对多关系，我们可能会遇到一些问题。

首先，我们最终会得到一个充满重复标签的表。这对小项目来说不是问题，但大型系统最终可能会出现数百万(甚至数十亿)个重复记录。此外，我们的标签模型不是很健壮。如果我们想跟踪最初创建标签的时间怎么办？在我们目前的实现中，我们无法做到这一点。最后，我们不能在多个实体类型之间共享我们的标签。这可能会导致更多的重复，从而影响我们的系统性能。

而多对多关系的标签可以解决大部分的这些问题。

5. 总结

标签是一种能够查询数据的简单直接的方法，结合Java Persistence API，我们获得了一个易于实现的强大过滤功能。虽然简单的实现可能并不总是最合适的，但我们已经强调了帮助解决这种情况的途径。

与往常一样，本教程的完整源代码可在GitHub上获得。

Show Disqus Comments