因此在许多情况下结果

TG Data Set: A collection for training AI models.
Post Reply
Bappy11
Posts: 351
Joined: Sun Dec 22, 2024 6:05 am

因此在许多情况下结果

Post by Bappy11 »

2. 定性评估不同聚类方法在电影色彩分析中的实用性
提到的许多方法都类似,因为它们都采用所谓的聚类分析方法——大多数情况下是K-Means算法。聚类分析广泛应用于数值图像处理领域[34],也广泛应用于电影科学图像处理,而不仅仅是色彩分析。[35] Stutz 在对该领域的系统评估中也强调了聚类分析在研究电影色彩模式中的重要性[36]。

聚类分析的任务是自动将数据集内的相似数据分成几组。这会创建一个颜色值数据集,将影片的某一帧或一系列帧分组为一组相似的颜色值,称为聚类。创建这些聚类的具体方法是聚类算法。由于聚类分析在色彩模式研究中起着核心作用,本分析首先尝试使用聚类算法进行电影研究中的色彩分析。然而,在这种背景下最常用的K-Means算法的采用很快就暴露出了许多困难,这最初导致了对其他聚类算法的测试,并最终产生了一种通常与聚类分析保持距离的新方法。由于该方法的广泛使用,下面将对聚类问题进行简要总结,这些问题涉及定义颜色和在数值分析中捕获颜色的不同方式。各种聚类分析的排序机制已经应用于它们所属的机器学习领域,以及计算机辅助图像处理领域的许多问题。[37]然而,从电影研究的角度来解释这些手段的含义仍有待阐明。

2.1 K均值
K-Means是一种所谓的向量量化算法,它也用于聚类分析。它之所以如此受欢迎,主要还是因为它的性能良好,而且使用起来非常方便。[38]它还在许多机器学习和计算机视觉库中 实现,例如OpenCV [39] 。该算法的抽象功能提供了虚构的所谓聚类中心的初始随机设置,其数量必须在开始分析之前手动确定,并且与所需结果聚类的数量相对应。这个数字用 k 表示,并给该过程命名。然后,使用距离测量(欧几里得距离),将所有数据点分配到距离它们最近的聚类中心。在颜色分析中,这些数据点是图像像素,以颜色值表示。现在,分配允许在分配给它的数据点内重新计算聚类中心,即确定分组内的平均颜色值。重新计算聚类中心后,再重新计算数据点到所有聚类中心的距离。重新计算中心后,如果数据点比第一次计算时所属的中心更接近另一个聚类中心,则它们的聚类隶属关系会发生变化。该过程不断迭代,直到所有数据点都被分配到距离它们中心最近的集群,这样重新计算就不会改变分配。

在电影研究背景下, K-Means的一些困难源自其功能的描述,而其他困难似乎并不是立即显现出来的。首先,必须预先确定结果簇的数量,这意味着在分析中无法充分考虑高颜色复杂度或低颜色复杂度之间的变化。在颜色复杂度较低的序列中,几个结果簇可以包含视觉上相似的颜色,而在颜色复杂度较高的序列中,不同的颜色在一个簇中“混合”。这种颜色混合的效果可以在图 3中清晰地看到 ,屋顶的红色与警察制服的棕色融为一体,而树的绿色几乎看不见。

另一个问题来自于聚类中心的随机设置。当对同一图像多次应用K-Means时,这会导致最终结果略有不同 。尽管从数学角度来看偏差很小,但在个别情况下,色彩印象的这些差异却十分显著。实验证明,三到七个结果簇之间的范围差异特别大。由于之前在电影研究中使用K-Means的应用通常最多使用 7 个结果聚类,

图 3:《行尸走肉》(美国 2010-)中某一帧的聚类分析。摘自 DVD《行尸走肉》。完整的第一季。 (WVG Medien GmbH,2013 年 5 月 31 日)。
图 3 : 《行尸走肉》(美国 2010-)中某一帧的聚类分析。摘自 DVD 《行尸走肉》。完整的第一季。(WVG Medien GmbH,2013 年 5 月 31 日)。
可以通过对同一幅图像和轮廓系数多次应用K-Means来解决此问题。轮廓系数是一种旨在自动评估一个或多个聚类的质量的算法。[40]通过这种方式,可以将具有不同数量结果聚类的聚类分析相互比较(图 3),以自动确定图像的适当数量。然而,在所示的示例中,这样的评估得出的结论是两个集群提供了最好的结果,这与视觉印象不符。

另一个问题是,K-Means倾向于形成尽可能大小相同的聚类,并且聚类中心的设置对所谓的异常值(即与所考虑的大多数数据点有显著偏差的数据点)反应强烈。对于颜色分析,这意味着K-Means更看重主色,即具有高图像内容的颜色,而不是颜色差异。结果,从电影科学角度来看重要的色彩方面很快就消失了,正如在《辛德勒的名单》中的四个色彩簇中清楚看到的那样(图 4)。

图 4:《辛德勒的名单》(美国 1993 年,导演:史蒂文·斯皮尔伯格)中某一帧的 乌拉圭电报数据 聚类分析结果。摘自 DVD《辛德勒的名单》(德国环球影业,2004 年 10 月 21 日)。
图 4 : 《辛德勒的名单》 (美国 1993 年,导演:史蒂文·斯皮尔伯格)某一帧的聚类分析结果。摘自 DVD 《辛德勒的名单 》(德国环球影业,2004 年 10 月 21 日)。
2.2 DBSCAN
DBSCAN是本研究中测试的第二种算法,属于所谓的基于密度的聚类算法。该小组基于这样的假设进行工作:数据空间内具有一组特定数据点的聚类具有这样的特点:数据点之间的距离小于聚类外部的距离。与K-Means的一个显著区别在于该方法的目标:DBSCAN是关于识别和隔离数据集内的聚类。这意味着并非所有数据点最终都是集群的一部分。同样,结果簇的数量也不必预先确定。

DBSCAN由两个主要参数控制: epsilon和MinPts。Epsilon确定计算数据点周围密度的半径,而MinPts 定义半径epsilon内的数据点数量。图 5通过使用不利的epsilon和MinPts值,展示了该策略在胶片科学色彩分析背景下的缺点。最大的聚类(左侧第二列)实际上不是一个聚类,但包含未被考虑到的异常值。尽管这些不再以不良的方式改变聚类结果(就像K-Means的情况一样),但与聚类二到十一相比,它们清楚地表明,结果不是所希望的框架核心颜色的简化调色板。根据所选择的策略,聚类是颜色差异较小的彩色图像区域。此外,在研究范围内找不到任何可以限制这些趋势对色彩分析的影响的参数化。
Post Reply