IB-AV-Analytics 中实现的面部识别算法

TG Data Set: A collection for training AI models.
Post Reply
Bappy11
Posts: 351
Joined: Sun Dec 22, 2024 6:05 am

IB-AV-Analytics 中实现的面部识别算法

Post by Bappy11 »

[ 10 ]最终,形式因素和物质因素的相互作用发生在纯粹的现象学层面上,在这样的背景下,这些相互作用被解读为电影所针对的内容的标志。那是,作为观看情境中的电影等直接给定现象的持久印象,该印象随后仅作为意识的内容可用,并且与其经验基础脱钩。在大多数电影研究分析模型中,哪些可测量或至少可数的成分在最狭义上归因于电影符号或代码,以及它们在多大程度上嵌入物理现实,并不起到任何作用。[31]这使得将电影中呈现的理论转化为清晰、无歧义、易理解的类别变得困难——因此电影分析仅仅是用一个案例的例子来说明理论构造。如果分析中所假设的规则系统严格地基于一个固定的含义,而这往往会预见到受众会受到复杂的社会文化影响,那么与特定内容相关的形式特征在不同的语境中也会达到完全不同的效果。[32]这种研究策略的论证主要基于演绎,总是将一般性转移到个案中,因此很容易失去可信度,因为其结果可以通过其他方式相对化。[33]

[ 11 ]另一方面,对特定材料特性的测量可以显著减少分析主体对构成研究对象的模型的干预。通过分析多部影片,可以从统计上确定其共同特征的规律,然后为进一步的解读提供事实基础,以免仅仅建立在个人印象上。这样,与解释学的症状性个案相反,我们可以对大量电影做出广泛的、基于经验的陈述。与根据观众的意义预先确定形式属性的传统方法相比,在模态研究[34]或定量导向的电影研究[35]背景下发展起来的概念,已经被证明是成功的。使用这一功能指南,对经常出现的电影刺激结构的评判,更多的是基于它们是否有助于增加某种观众反应的可能性,而不是基于它们是否传达了某种信息。[36]在这方面,对恐怖电影中悬念内容的评价尤其代表了一个有吸引力的研究课题:认知和神经科学研究表明,恐怖电影通过有目的地使用不同的模态,挖掘出独立于电影的预期和反应恐惧体验的基本过程,从中——正如以下研究将显示的——可以获得用于分析广泛数据的强大解释背景。黑暗、嘈杂的音乐、快速的剪辑都是在极度危险时刻评估的电影素材中可以识别的特征,但在没有危险的时刻(例如对话场景)却无法识别。

[ 12 ]本研究过程中开发的张力分析解释形式的一个关键研究目标,最终是减少结构主义模型所假设的理论受众的“解释压舱物”。在电影分析的框架和其论证结构所需的内容选择中,是否只考虑电影中多次出现的刺激的记忆,与这个概念是否需要观众的一系列社会文化影响,然后在接受中发挥作用,这是有很大区别的,例如B.如果分析是以一部影片反映了一定的社会倾向为前提的。[37]在这两种情况下,对内容和形式的理解是完全不同的:在张力分析中,问题不是观众(无意识地)根据预先确定形式和内容之间联系的外部概念模板做出特定的解释,而是电影以这样一种方式安排其舞台设备的相互作用,使某种反应比另一种反应更有可能发生——例如,当一个突出的、不祥的音效只与凶手有关时,这样就会出现一种对威胁情况的预期模式。因此,张力分析遵循了对交流的功能性理解:恐怖电影是整篇文章的分析核心,其主要作用是吓唬人。[38]

[ 13 ]这种不祥的声音效果是微观结构的效果吗? h.按照这一研究逻辑,可以从场景内部案例研究中识别出进一步的模式,这些模式可以使用清晰的模态特定刺激特征来描述,也可以应用于整个电影或电影语料库的级别。与危险相关的人物的出现或接近本身就代表了评估威胁的基本条件,这也是首先解决观众恐惧的方法。[39]因此,杀手的可识别性一方面是对其直接出现的评价标准,另一方面,他的出现代表着一种明确的、引起恐惧的刺激,其他角色会对此做出战斗或逃跑行为的反应。

图 2:TIB-AV-Analytics 中实施的面部识别算法的结果图形表示。 [朱利安·西特尔 2024]
[ 14 ]图2显示了自动人脸识别算法应用于万圣节的结果。为此,提前读取了所有角色的脸部截图,作为自动搜索的参考资料;图中用红点表示的图像与影片中识别的结构特征之间的相似性。黑线标记了一个阈值(0.3),它定义了何时可以认为算法的识别性能有意义 - 因此,线上方的点越高,出现图形的概率就越高。该图显示了对电影反派迈克尔·迈尔斯的搜寻结果:显而易见,他主要是在后来的 摩洛哥电报数据 谋杀序列中被发现的 - 即显示危险立即发生的事件结构(谋杀、追逐)。尤其以红色方框标注的决战,也就是主角与反派的最后对决,点数密度最高,也因此让麦克的可辨识度持续提升。相比之下,影片的前半部分主要采用了隐性表现(音效、人物背后等),只有在发生谋杀案时,才可以偶尔清晰地辨认身份。这种对危险存在的持续预期的间接模式最终在摊牌时让位于一个明确传达的预期阶段,这仅由犯罪者和受害者之间距离的缩短决定 ——每一个可以看到迈克尔的镜头,他都离逃跑的受害者更近一步。正如我们将看到的,这个狩猎序列没有留下任何深思熟虑的余地,而仅仅围绕着危险的紧迫性和主角的逃跑行为展开。

[ 15 ]然而,如果恐怖电影中反派的形象有时与人类面部的结构特征偏差很大,那么人脸检测算法的应用就并不总是有效的。因此,下面介绍的手动注释程序为评估使用 TIB-AV-A 收集的数据提供了重要支持。所谓的紧迫性值在构成语料库的恐怖电影中具有普遍的内容,因此可以用作评估恐怖电影中所有与悬念相关的镜头的中心分类标准。从内容角度来看,它是一种“衔接元素” [40],将不同的模态因素带入有用的情境中。在统计数据分析的背景下,这种方法论前提最终会导致定性类别,从而可以有针对性地搜索具有定量、自动确定的特征的依赖关系。

I.2 当前应力分析方法概述
Post Reply