影视作品的信息预测方法及系统与流程

发布时间:2025-08-29 06:33

食品安全追溯系统能有效追踪食品的全程流通信息。 #生活常识# #生活安全# #食品安全法规#

本公开涉及信息处理技术领域,尤其涉及一种影视作品的信息预测方法及系统。

背景技术:

目前,对于影视作品的信息,例如即将发行的影视作品传播的形象,或者传播特定形象的影视作品应具有的基本特征,通常是从理论层面进行分析与预测,缺少针对性和可靠性。

技术实现要素:

有鉴于此,本公开提出了一种影视作品的信息预测技术方案。

根据本公开的一方面,提供了一种影视作品的信息预测方法,所述方法包括:

根据待预测的第一形象信息以及预设的形象关联模型,确定所述第一形象信息与多个作品属性信息之间的第一关联指数,所述形象关联模型用于表示影视作品的多个作品属性信息与多个形象信息之间的关联性;

根据所述第一关联指数,确定与所述第一形象信息匹配的第一影视作品的第一作品属性信息。

在一种可能的实现方式中,根据所述第一关联指数,确定与所述第一形象信息匹配的第一影视作品的第一作品属性信息,包括:

在所述第一形象信息为一个时,从多个第一关联指数中确定出第二关联指数,所述第二关联指数是所述多个第一关联指数中最大的至少一个关联指数;

将与所述第二关联指数对应的作品属性信息确定为所述第一作品属性信息。

在一种可能的实现方式中,根据所述第一关联指数,确定与所述第一形象信息匹配的第一影视作品的第一作品属性信息,包括:

在所述第一形象信息为多个时,对于任一作品属性信息,根据各个第一形象信息与所述作品属性信息之间的多个第一关联指数,确定所述第一形象信息与所述作品属性信息之间的总体关联指数;

从多个作品属性信息的总体关联指数中确定出第三关联指数,所述第三关联指数是多个总体关联指数中最大的至少一个关联指数;

将与所述第三关联指数对应的作品属性信息确定为所述第一作品属性信息。

在一种可能的实现方式中,根据各个第一形象信息与所述作品属性信息之间的多个第一关联指数,确定所述第一形象信息与所述作品属性信息之间的总体关联指数,包括:

将各个第一形象信息与所述作品属性信息之间的多个第一关联指数的加权和,确定为所述第一形象信息与所述作品属性信息之间的总体关联指数。

在一种可能的实现方式中,所述方法还包括:

根据预设的多个第三形象信息、第三影视作品的评论信息,确定所述第三影视作品的各个第三形象信息的占比值,其中,所述第三影视作品是预设的影视作品库中的任意一个;

根据多个第三影视作品的多个第三作品属性信息、各个第三形象信息的占比值,确定各个第三作品属性信息与各个第三形象信息之间的第五关联指数;

根据各个第三作品属性信息与各个第三形象信息之间的第五关联指数,建立形象关联模型。

在一种可能的实现方式中,根据多个第三影视作品的多个第三作品属性信息、各个第三形象信息的占比值,确定各个第三作品属性信息与各个第三形象信息之间的第五关联指数,包括:

对于任一第三作品属性信息,确定多个第三影视作品中包括所述第三作品属性信息的第四影视作品;

将所述第四影视作品的任一第三形象信息的多个占比值的加权平均值,确定为所述第三作品属性信息与所述第三形象信息的第五关联指数。

在一种可能的实现方式中,根据预设的多个第三形象信息、第三影视作品的评论信息,确定所述第三影视作品的各个第三形象信息的占比值,包括:

根据第三影视作品的各条评论信息中各个词语的重要度,提取多个第一关键词,其中,所述重要度是根据所述词语在各条评论信息中的词频及所述词语的逆文本频率指数确定的;

根据所述多个第一关键词在各条评论信息中的重要度,建立重要度矩阵;

根据所述重要度矩阵,对所述多个第一关键词进行聚类,得到多个聚类中心;

从所述多个聚类中心中选取重要度大于或等于重要度阈值的多个第二关键词;

根据所述多个第二关键词,从所述多个第三形象信息中,确定出与所述第三影视作品有关联的多个第四形象信息;

根据所述评论信息,确定所述第三影视作品的各个第四形象信息的占比值。

在一种可能的实现方式中,根据所述多个第二关键词,从所述多个第三形象信息中,确定出与所述第三影视作品有关联的多个第四形象信息,包括:

确定各个第二关键词与各个第三形象信息之间的相似度;

将大于或等于相似度阈值的相似度对应的第三形象信息,确定为与所述第三影视作品有关联的多个第四形象信息。

在一种可能的实现方式中,所述方法还包括:

根据待预测的第二影视作品的第二作品属性信息以及所述形象关联模型,确定所述第二作品属性信息与多个形象信息之间的第四关联指数;

根据所述第四关联指数,确定所述第二影视作品的第二形象信息。

根据本公开的另一方面,提供了一种影视作品的信息预测系统,所述系统包括:

第一指数确定模块,用于根据待预测的第一形象信息以及预设的形象关联模型,确定所述第一形象信息与多个作品属性信息之间的第一关联指数,所述形象关联模型用于表示影视作品的多个作品属性信息与多个形象信息之间的关联性;

作品属性确定模块,用于根据所述第一关联指数,确定与所述第一形象信息匹配的第一影视作品的第一作品属性信息。

根据本公开的实施例,能够根据待预测的第一形象信息与多个作品属性信息之间的第一关联指数,确定与第一形象信息匹配的第一影视作品的第一作品属性信息,从而可以通过关联指数,对与第一形象信息匹配的影视作品的作品属性信息进行科学预测,提高影视作品的作品属性信息预测的针对性和可靠性,进而为影视作品的创作者提供具体的创造指导,或者为影视作品的传播策略的提供参考。

根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。

图1示出根据本公开的实施例的影视作品的信息预测方法的流程图。

图2示出根据本公开的实施例的影视作品的信息预测系统的框图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。

图1示出根据本公开的实施例的影视作品的信息预测方法的流程图。如图1所示,所述方法包括:

步骤s100,根据待预测的第一形象信息以及预设的形象关联模型,确定所述第一形象信息与多个作品属性信息之间的第一关联指数;

步骤s200,根据所述第一关联指数,确定与所述第一形象信息匹配的第一影视作品的第一作品属性信息。

根据本公开的实施例,能够根据待预测的第一形象信息与多个作品属性信息之间的第一关联指数,确定与第一形象信息匹配的第一影视作品的第一作品属性信息,从而可以通过关联指数,对与第一形象信息匹配的影视作品的作品属性信息进行科学预测,提高影视作品的作品属性信息预测的针对性和可靠性,进而为影视作品的创作者提供具体的创造指导,或者为影视作品的传播策略提供参考。

本公开的实施例所述的影视作品可以是指摄制在一定物质(例如胶片、可存储介质等)上,由一系列有伴音或者无伴音的画面组成,并且借助适当装置(例如播放器)放映、播放的作品,可包括电影作品和以类似摄制电影的方法创作的作品(例如电视剧、录像作品等)。本公开对影视作品的具体内容不作限制。

本公开的实施例的影视作品的作品属性信息可包括影视作品的基本信息,包括影视作品的题材(例如历史、国庆、都市生活等)、类型(例如科幻片、动作片、爱情片等)、传播地区(例如日本、英国、新加坡等)、时长、上映时间等;影视作品的形象信息可用于表示影视作品向观众传播的国家、社会、自然、人物等各个方面的形象,例如和平、美丽、友爱、善良、恶毒、狡猾、勇敢等。不同的影视作品的作品属性信息不同,传播的形象信息也不同。本公开对影视作品的具体的作品属性信息及形象信息不作限制。

在一种可能的实现方式中,在进行影视作品的信息预测前,可以先建立形象关联模型。形象关联模型可用于表示影视作品的多个作品属性信息与多个形象信息之间的关联性。

在一种可能的实现方式中,可从已发行的影视作品中选取出n个(n为整数,且n≥3)第三影视作品,建立影视作品库,并根据预设的多个第三形象信息以及n个第三影视作品的作品属性信息建立形象关系模型。本领域技术人员可根据实际情况选取第三影视作品,并确定第三影视作品的数量n,本公开对此不作限制。

在一种可能的实现方式中,所述影视作品的信息预测方法可包括建立形象关联模型的步骤。可通过下述方式建立形象关联模型:

根据预设的多个第三形象信息、第三影视作品的评论信息,确定所述第三影视作品的各个第三形象信息的占比值,其中,所述第三影视作品是预设的影视作品库中的任意一个;

根据多个第三影视作品的多个第三作品属性信息、各个第三形象信息的占比值,确定各个第三作品属性信息与各个第三形象信息之间的第五关联指数;

根据各个第三作品属性信息与各个第三形象信息之间的第五关联指数,建立形象关联模型。

其中,多个第三形象信息是预先设置的,本领域技术人员可综合考虑多个经典的影视作品所传播的形象来设置,或通过其他方式设置,本公开对此不作限制。

在一种可能的实现方式中,第三影视作品的评论信息可包括第三影视作品在不同国家和地区的影评信息以及用户评论(例如视频播放平台或网站的用户评论、影评网站或论坛的用户评论等)。

在一种可能的实现方式中,可根据预设的多个第三形象信息、第三影视作品的评论信息,确定第三影视作品的各个第三形象信息的占比值。例如,对于任一第三影视作品,可根据其评论信息的总数,以及与各个第三形象信息相关的评论信息的数量,确定出该第三影视作品的各个第三形象信息的占比值。

在一种可能的实现方式中,可根据多个第三影视作品的多个第三作品属性信息、各个第三形象信息的占比值,确定各个第三作品属性信息与各个第三形象信息之间的第五关联指数。对于任一第三作品属性信息而言,包括该第三作品属性信息的第三影视作品有多个,可根据包括第三作品属性信息的第三影视作品的各个第三形象信息的占比值,分别确定该第三作品属性信息与各个第三形象信息之间的第五关联指数。

在一种可能的实现方式中,可根据各个第三作品属性信息与各个第三形象信息之间的第五关联指数,建立形象关联模型。形象关联模型可以为矩阵模型、数据库模型,或其他模型,本公开对此不作限制。

表1示出了根据本公开的实施例的形象关联模型的示意图。如表1所示,该形象关联模型为数据库模型,包括6个第三形象信息(分比为:a-善良、b-朴实、c-狡诈、d-聪明、e-勤劳、f-团结)、6个第三作品属性信息(分别为a1-国庆、a2-都市生活、b1-日本、b2-英国、b3-新加坡、b4-俄罗斯),以及各个第三作品属性信息与各个第三形象信息之间的第五关联指数α。其中,a1、a2属于题材类第三作品属性信息,b1、b2、b3属于传播地区类第三作品属性信息,α(a1,a)为第三作品属性信息a1与第三形象信息a之间的第五关联指数,表1中的其他第五关联指数与此类似,此处不再赘述。

表1

在本实施例中,能够根据多个第三形象信息、影视作品库中各个第三影视作品的评论信息,确定各个第三影视作品的各个第三形象信息的占比值,并根据占比值及各个第三影视作品的作品属性信息,确定各个第三作品属性信息与各个第三形象信息的第五关联指数,进而建立形象关联模型,可以提高形象关联模型的准确性。

在一种可能的实现方式中,根据预设的多个第三形象信息、第三影视作品的评论信息,确定所述第三影视作品的各个第三形象信息的占比值,可包括:

根据第三影视作品的各条评论信息中各个词语的重要度,提取多个第一关键词,其中,所述重要度是根据所述词语在各条评论信息中的词频及所述词语的逆文本频率指数确定的;

根据所述多个第一关键词在各条评论信息中的重要度,建立重要度矩阵;

根据所述重要度矩阵,对所述多个第一关键词进行聚类,得到多个聚类中心;

从所述多个聚类中心中选取重要度大于或等于重要度阈值的多个第二关键词;

根据所述多个第二关键词,从所述多个第三形象信息中,确定出与所述第三影视作品有关联的多个第四形象信息;

根据所述评论信息,确定所述第三影视作品的各个第四形象信息的占比值。

在一种可能的实现方式中,可使用爬虫技术获取网络上关于第三影视作品的评论信息。例如,可使用八爪鱼、python等爬虫工具抓取国内外视频网站、社交平台、影评网站等网络上第三影视作品的评论信息。其中,视频网站例如优酷、爱奇艺、优兔(youtube)等,社交平台例如脸书(facebook)、推特(twitter)等,影评网站例如烂番茄、互联网电影资料库(imdb,internetmoviedatabase)等。本公开对评论信息的来源不作限制。

在一种可能的实现方式中,获取评论信息后,可确定各条评论信息中各个词语的重要度,重要度是根据词语在各条评论信息中的词频及词语的逆文本频率指数确定的。也就是说,评论信息中各个词语的重要度可通过该词语的tf-idf值来确定。其中,tf(termfrequency)为词频,是指一个词语在一条评论信息中出现的次数,idf(inversedocumentfrequency)为一个词语的逆文本频率指数。词语的tf-idf值越大,说明该词语在一条评论信息中出现的频率越高,且在其他评论信息中很少出现,可认为该词语具有很好的区分能力。

在一种可能的实现方式中,可通过下述方式来确定各条评论信息中各个词语的tf-idf值:

首先,可将各条评论信息(若为外语,需先翻译为中文)中常见的人名、地名等名词编写成自定义词典,并根据汉语语法编写停用词词典。其中,停用词可包括两类,一类是在评论信息中出现频率很高且没有什么实际意义的功能词,这类停用词包括副词、介词、连词、语气助词等,通常本身并没有明确的含义,只有将其放入一个完整的句子中才会起到一定的作用,例如“在”、“的”、“和”、“便”、“必须”、“比如说”等;另一类停用词是使用十分广泛,但无法将各评论信息进行区分的词,以及各种符号、表情等,例如“我”、“这”、“那”、“什么”、“哇”、“——”等。停用词会对评论信息中的有效信息造成干扰,降低处理效率,去除停用词能够使得从评论信息得到的词语更加集中、突出。例如,评论信息“哇——这是我最喜欢的动画电影!”中的“哇”、“——”、“这”、“我”、“的”为停用词,在分析时可以删除。

然后可使用分词工具对各条评论信息进行分词,例如,使用python的中文分词组件jieba分词工具对各条评论信息进行分词:在jieba词库中载入编写的自定义词典,使用jieba分词工具对各条评论信息进行分词,并根据停用词词典,删除各条评论信息中的停用词,得到多个词语。

在得到多个词语后,可计算各条评论信息中各个词语的tf-idf值。可使用下述公式(1)来计算第j条评论信息中第i个词语的词频tfi,j其中,i和j均为正整数,i的取值为1,…,q(q为第j条评论信息中的词语总数);可使用下述公式(2)计算第i个词语的逆文本频率指数idfi;可使用下述公式(3)来计算第j条评论信息中第i个词语的tf-idf值tfidfi,j:

tfidfi,j=tfi,j×idfi(3)

在上述公式中,ni,j表示第j条评论信息中第i个词语出现的次数,∑knk,j为第j条评论信息中所有词语的出现次数之和,nk,j表示第j条评论信息中第k个词语出现的次数,k的取值范围与i相同,|d|为第三影视作品的评论信息的总数,|{j:ti∈dj}|为包括第i个词语ti的评论信息的数量,其中,dj表示第j个评论信息中的所有词语。

在一种可能的实现方式中,在确定出第三影视作品的各条评论信息中各个词语的重要度(即tf-idf值)后,可根据各个词语的重要度,提取评论信息中的多个第一关键词。例如,可将tf-idf值大于或等于预设的tf-idf关键值的多个词语,确定为第三影视作品的评论信息中的多个第一关键词;还可将tf-idf值最大的多个词语,确定为第三影视作品的评论信息中的多个第一关键词,或使用其他方式,本公开对此不作限制。

在一种可能的实现方式中,还可使用分词工具对第三影视作品的各条评论信息中各个词语进行词性(例如名词、形容词等)标注,并在确定出各个词语的重要度(即tf-idf值)后,根据词性及各个词语的重要度,提取出评论信息中的多个第一关键词。

在一种可能的实现方式中,在确定出多个第一关键词后,可根据所述多个第一关键词在各条评论信息中的重要度,建立重要度矩阵,其中,重要度矩阵的每行可以代表一个第一关键词或一条评论信息,重要度矩阵的每列可以代表一条评论信息或一个第一关键词,重要度矩阵的元素为各个第一关键词在各条评论信息中的tf-idf值。

下面以影视作品《xx故事》的评论信息为例,说明提取第一关键词及建立重要度矩阵的过程,其中王某为该作品的男主角,李某为该作品的女主角。

假设从某影评网站上抓取到的评论信息为:

“王某的代表性作品,为打造真实效果,王某也算是拼命演出,受了不少伤,吃了不少苦,还好最终表现出来的效果很棒,很优质的一部香港电影,值得观看。”

“就爱看李某被从小绵羊上拽下来!~”

“那些搏命演出啊!”

“王某早期最经典的影片。”

“王某早期的经典之作,看评分有点低。”

“我喜欢逗笑的王某。”

“李某那时可真年轻!”

“王某动作经典系列。”

“很经典。”

可首先编写自定义词典,包括“王某”、“李某”、“香港”,并确定停用词词典,包括“的”、“为”、“也算”、“还好”等;

然后在jieba词库中载入编写的自定义词典,使用jieba分词工具对各条评论信息进行分词,并删除停用词,得到多个词语;分别计算各条评论信息中各个词语的tf-idf值,并根据各个词语的tf-idf值,提取评论信息中的第一关键词,分别为“王某”、“李某”、“经典”、“早期”;

然后根据第一关键词及第一关键词在各条评论信息中的tf-idf值,建立重要度矩阵。其中,第一关键词“王某”在各条评论信息中的tf-idf值分别为tf11,tf12,tf13,tf15,tf15,…,tf19;第一关键词“李某”在各条评论信息中的tf-idf值为tf21,tf22,tf23,tf24,tf25,…,tf29;第一关键词“经典”在各条评论信息中的tf-idf值为tf31,tf32,tf33,tf34,tf35,…,tf39;第一关键词“早期”在各条评论信息中的tf-idf值为tf41,tf42,tf43,tf44,tf45,…,tf49。该重要度矩阵如下所示,其每行代表一个第一关键词,每列代表一条评论信息:

{tf11,tf12,tf13,tf15,tf15,…,tf19;

tf21,tf22,tf23,tf24,tf25,…,tf29;

tf31,tf32,tf33,tf34,tf35,…,tf39;

tf41,tf42,tf43,tf44,tf45,…,tf49}

在一种可能的实现方式中,可根据所述重要度矩阵,对所述多个第一关键词进行聚类,得到多个聚类中心。在进行聚类时,可将重要度矩阵中代表第一关键词的每行或每列看作一个向量,确定出p(p为正整数)个向量,并从p个向量中选取m(m为正整数且m<p)个向量,将m个向量分别确定为m个类的初始聚类中心,然后使用聚类算法对其余向量进行聚类,得到多个聚类中心。其中,聚类算法可以是k均值聚类算法(k-means算法)、k中心点算法(k-mediods算法)、基于随机选择的聚类算法等。本领域技术人员可根据实际情况选择合适的聚类算法,本公开对此不作限制。

在一种可能的实现方式中,可使用k-中心点算法对多个第一关键词进行聚类,得到多个聚类中心:可将重要度矩阵中代表第一关键词的每行或每列看作一个向量,确定出p个向量;从p个向量中选取m个向量,将m个向量分别确定为m个类的初始中心点;分别计算其余任一向量到m个初始中心点的m个距离,将m个距离中的最短距离对应的中心点所属的类确定为该向量所属的类;在对p个向量都归类完成后,对于每个类,按照各个向量距离中心点从近到远的顺序,依次计算类中的各个向量到类中其它向量的距离之和,将距离之和最小的向量,确定为该类的新的中心点,从而得到m个类的新的中心点;然后使用上述方法,对m个类的新的中心点之外的其他向量重新进行聚类,直到m个类的中心点不再发生变化,将最后得到的m个类的中心点确定为对多个第一关键词进行聚类后得到的m个聚类中心。

在一种可能的实现方式中,在得到多个聚类中心后,可从多个聚类中心中选取重要度大于或等于重要度阈值的多个第二关键词。也就是说,可将m个聚类中心中,tf-idf值大于或等于tf-idf阈值的聚类中心确定为第二关键词。

在一种可能的实现方式中,可根据多个第二关键词,从多个第三形象信息中,确定出与第三影视作品有关联的多个第四形象信息。例如,可将各个第二关键词与各个第三形象信息进行匹配,确定其匹配度,并根据匹配度确定出与第三影视作品有关联的多个第四形象信息,或计算各个第二关键词与各个第三形象信息的相似度,并根据相似度,确定出与第三影视作品有关联的多个第四形象信息,或者采用其他方式确定与第三影视作品有关联的多个第四形象信息,本公开对此不作限制。

在一种可能的实现方式中,确定出第四形象信息之后,可根据评论信息,确定所述第三影视作品的各个第四形象信息的占比值。可通过与任一第四形象信息相关的评论信息的数量以及评论信息的总数来确定该第四形象信息的占比值。

在一种可能的实现方式中,可通过下述公式(4)来确定第四形象信息a的占比值θ(a):

其中,为与第四形象信息相关的评论信息的数量,q表示第三影视作品的评论信息的总数。

例如,第三影视作品的评论信息共有1000条,与第三影视作品有关联的多个第四形象信息有:善良、朴实、狡诈、聪明、勤劳、团结。计算第四形象信息“善良”的占比值时,可从1000条评论信息中确定出与“善良”相关的评论信息的数量,例如250条,那么第四形象信息“善良”在第三影视作品中的占比值为250/1000=0.25,使用类似的方式,可分别计算出各个第四形象信息在第三影视作品中的占比值。

在本实施例中,通过提取第三影视作品的评论信息中的多个第一关键词,并对多个第一关键词进行聚类,选取出多个第二关键词,然后根据第二关键词确定与第三影视作品有关联的第四形象信息,并计算各个第四形象信息的占比值,从而可以提高与第三影视作品有关联的第四形象信息的准确性。

在一种可能的实现方式中,在确定出与第三影视作品有关联的第四形象信息的占比值之后,可将多个第三形象信息中第四形象信息之外的形象信息的占比值确定为0,从而确定出第三影视作品的各个第三形象信息的占比值。

在一种可能的实现方式中,根据所述多个第二关键词,从所述多个第三形象信息中,确定出与所述第三影视作品有关联的多个第四形象信息,可包括:确定各个第二关键词与各个第三形象信息之间的相似度;将大于或等于相似度阈值的相似度对应的第三形象信息,确定为与所述第三影视作品有关联的多个第四形象信息。

在一种可能的实现方式中,各个第二关键词与各个第三形象信息之间的相似度,可通过来欧式距离确定。例如,可通过训练好的word2vector模型,分别将各个第二关键词与各个第三形象信息映射到向量空间;然后分别计算各个第二关键词的向量与各个第三形象信息的向量之间的欧式距离,并根据欧式距离,确定各个第二关键词与各个第三形象信息的相似度。其中,可使用各个第三形象信息预设的语料库(可包括各个第三形象信息的详细定义),训练word2vector模型,以提高word2vector模型的准确性。

在一种可能的实现方式中,在确定出各个第二关键词与各个第三形象信息之间的相似度之后,可判断各个相似度与预设的相似度阈值的关系,并将大于或等于相似度阈值的相似度对应的第三形象信息,确定为与第三影视作品有关联的多个第四形象信息。

在本实施例中,通过确定各个第二关键词与各个第三形象信息之间的相似度,并将大于或等于相似度阈值的相似度对应的第三形象信息,确定为与第三影视作品有关联的多个第四形象信息,从而可以通过量化方式,从多个第三形象信息中,确定出与第三影视作品有关联的第四形象信息,提高与第三影视作品有关联的第四形象信息的准确性。

在一种可能的实现方式中,根据多个第三影视作品的多个第三作品属性信息、各个第三形象信息的占比值,确定各个第三作品属性信息与各个第三形象信息之间的第五关联指数,可包括:对于任一第三作品属性信息,确定多个第三影视作品中包括所述第三作品属性信息的第四影视作品;将所述第四影视作品的任一第三形象信息的多个占比值的加权平均值,确定为所述第三作品属性信息与所述第三形象信息的第五关联指数。

在一种可能的实现方式中,在确定第五关联指数之前,可根据第三影视作品的多个第三作品属性信息、各个第三形象信息的占比值,建立形象占比模型,该模型可以为矩阵模型、数据库模型或等其他模型,本公开对形象占比模型的具体类型不作限制。

举例来说,影视作品库中包括5个第三影视作品,分别为作品1-作品5,第三作品属性信息包括a1-国庆、a2-都市生活、b1-日本、b2-英国、b3-新加坡、b4-俄罗斯,其中,a1和a2为题材信息,b1、b2、b3、b4为传播地区,第三形象信息包括a-善良、b-朴实、c-狡诈、d-聪明、e-勤劳、f-团结。根据第三影视作品的多个第三作品属性信息及各个第三形象信息的占比值,可建立如表2所示的形象占比模型,该形象占比模型为数据库模型:

表2

表2中,作品1的第三作品属性信息的取值分别为1、0、0、1、0、1,其中,1表示作品1具有该第三作品属性信息,0表示作品1不具有该第三作品属性信息,可知,作品1的第三作品属性信息为a1-国庆、b2-英国、b4-俄罗斯;作品1的各个第三形象信息的占比值分别为θ1(a)、θ1(b)、θ1(c)、θ1(d)、θ1(e)、θ1(f)。作品2-作品5的第三作品属性信息及各个第三形象信息的占比值与作品1类似,此处不再赘述。

在一种可能的实现方式中,建立形象占比模型之后,对于任一第三作品属性信息,可确定多个第三影视作品中包括所述第三作品属性信息的第四影视作品。例如,表2中,对于第三作品属性信息a1,可从5个第三影视作品中选取包括a1(即a1值为1)的作品1、作品3、作品4,作为包括a1的第四影视作品。

在一种可能的实现方式中,可将第四影视作品的任一第三形象信息的多个占比值的加权平均值,确定为所述第三作品属性信息与所述第三形象信息的第五关联指数。

举例来说,表2中,包括第三作品属性信息a1的第四影视作品为作品1、作品3、作品4,可从表2中分别选取出第四影视作品(作品1、作品3、作品4)的第三形象信息a的占比值:θ1(a)、θ3(a)、θ4(a),然后对θ1(a)、θ3(a)、θ4(a)取加权平均值,并将该加权平均值确定为第三作品属性信息a1与第三形象信息a的第五关联指数α(a1,a)。可使用类似的方式分别计算第三作品属性信息a1与第三形象信息b、c、d、e、f的第五关联指数α(a1,b)、α(a1,c)、α(a1,d)、α(a1,e)、α(a1,f),此处不再赘述。

其中,计算加权平均值时,各个占比值的权重可根据实际情况进行设置,本公开对此不作限制。

在本实施例中,通过确定多个第三影视作品中包括任一第三作品属性信息的第四影视作品,并将第四影视作品的任一第三形象信息的多个占比值的加权平均值,确定为第三作品属性信息与第三形象信息的第五关联指数,可以提高第五关联指数的准确性。

在一种可能的实现方式中,可根据影视作品库中多个第三影视作品的传播地区,建立针对各个传播地区的形象关联模型。例如,多个第三影视作品的传播地区包括新加坡、俄罗斯、英国等,以新加坡为例,可根据从新加坡的网络上获取的多个第三影视作品的评论信息、预设的多个第三形象信息,建立针对新加坡的形象关联模型,从而可以在传播地区为新加坡时,根据针对新加坡的形象关联模型,确定与待预测的形象信息匹配的影视作品的作品属性信息。

在一种可能的实现方式中,形象关联模型还可包括各个形象信息对应的第一情感指数。其中,第一情感指数可包括正面情感指数(情感指数大于0,观众情感倾向为正面)、中立情感指数(情感指数等于0,观众情感倾向为中立)及负面情感指数(情感指数小于0,观众情感倾向为负面)。

在一种可能的实现方式中,可根据影视作品库中任一第三影视作品的评论信息,确定该第三影视作品中各个第三形象信息的第二情感指数;然后根据任一第三形象信息在多个第三影视作品中的第二情感指数,确定出该第三形象信息对应的第一情感指数。

在一种可能的实现方式中,对于任一第三影视作品,可通过下述方式确定该第三影视作品中各个第三形象信息的第二情感指数:

首先,确定第三影视作品的各条评论信息的第三情感指数:对于任一评论信息,可根据预设的情感词典(包括正面情感词、负面情感词、程度副词、否定词四类),从该评论信息的分词结果中确定出多个情感词,分别为各个情感词赋值(例如为1);确定各个情感词为正面情感词或负面情感词,并确定各个情感词前面是否有程度副词、否定词,以及各个程度副词的系数、否定词的系数(例如为-1);根据各个正面情感词及其前面的程度副词、否定词,计算该评论信息的正面情感指数,根据各个负面情感词及其前面的程度副词、否定词,计算该评论信息的负面情感指数;将正面情感指数与负面情感指数的差值,确定为该评论信息的第三情感指数。

例如,评论信息“中国的武打片太帅气了,太好看了,好酷啊,我真是百看不厌,可惜稍微有点看不懂”,其分词结果为“中国/的/武打片/太/帅气/了/,/太/好看/了/,/好/酷/啊/,/我/真/是/百看不厌/,/可惜/稍微/有点/看/不/懂”;然后确定各个情感词、程度副词、否定词及各自赋值,其中,正面情感词(赋值为1)为“百看不厌”、“好看”、“懂”,程度副词为“真”(赋值为2)、“太”(赋值为3)、“稍微”(赋值为1),负面情感词(赋值为1)为“可惜”,否定词“不”(赋值为-1);该评论信息的正面情感指数为1×2+1×3+(-1)×1=4,负面情感指数为1×1=1,该评论信息的第三情感指数为4-1=3。

然后,根据第三影视作品的各条评论信息的第三情感指数,确定第三影视作品的各个第三形象信息的第二情感指数。例如,对于第三影视作品的任一第三形象信息,可将与该第三形象信息相关的多个评论信息的第三情感指数的加权平均值,确定为该第三影视作品的第三形象信息的第二情感指数。

在一种可能的实现方式中,在确定出第三影视作品的各个第三形象信息的第二情感指数后,可将任一第三形象信息在多个第三影视作品中的第二情感指数的加权平均值,确定为该第三形象信息对应的第一情感指数。

在一种可能的实现方式中,可根据各个第三形象信息对应的第一情感指数,确定形象关联模型中各个形象信息对应的第一情感指数。

在一种可能的实现方式中,在建立形象关联模型后,可在步骤s100中,根据待预测的第一形象信息以及形象关联模型,确定第一形象信息与多个作品属性信息之间的第一关联指数。例如,形象关联模型如表1所示,待预测的第一形象信息包括朴实、勤劳,可根据待预测的第一形象信息,从表1中确定出第一形象信息与多个作品属性之间的第一关联指数:第一形象信息“朴实”与多个作品属性之间的第一关联指数为:α(a1,b)、α(a2,b)、α(b1,b)、α(b2,b)、α(b3,b)、α(b4,b),第一形象信息“勤劳”与多个作品属性之间的第一关联指数为:α(a1,e)、α(a2,e)、α(b1,e)、α(b2,e)、α(b3,e)、α(b4,e)。

在一种可能的实现方式中,在确定第一关联指数后,可在步骤s200中,根据第一关联指数,确定与第一形象信息匹配的第一影视作品的第一作品属性信息。例如,可根据第一关联指数α(a1,b)、α(a2,b)、α(b1,b)、α(b2,b)、α(b3,b)、α(b4,b)、α(a1,e)、α(a2,e)、α(b1,e)、α(b2,e)、α(b3,e)、α(b4,e),通过计算、比较等处理,确定出与第一形象信息匹配的第一影视作品的第一作品属性信息。其中,与第一形象信息匹配的第一影视作品的第一作品属性信息可以是一个或多个。本领域技术人员可根据实际情况确定第一作品属性信息的数量,本公开对此不作限制。

在一种可能的实现方式中,根据所述第一关联指数,确定与所述第一形象信息匹配的第一影视作品的第一作品属性信息,可包括:在所述第一形象信息为一个时,从多个第一关联指数中确定出第二关联指数,所述第二关联指数是所述多个第一关联指数中最大的至少一个关联指数;将与所述第二关联指数对应的作品属性信息确定为所述第一作品属性信息。

在一种可能的实现方式中,在第一形象信息为一个时,可从多个第一关联指数中确定出第二关联指数。其中,第二关联指数是多个第一关联指数中最大的一个或多个关联指数,本领域技术人员可根据实际情况确定第二关联指数的数量,本公开对此不作限制。

在一种可能的实现方式中,可将与第二关联指数对应的作品属性信息确定为与第一形象信息匹配的第一影视作品的第一作品属性信息。其中,第一作品属性信息的数量与第二关联指数的数量相同。

举例来说,待预测的第一形象信息只包括“朴实”时,该第一形象信息与多个作品属性信息之间的第一关联指数为α(a1,b)、α(a2,b)、α(b1,b)、α(b2,b)、α(b3,b)、α(b4,b);可根据第二关联指数的预设数量2,从第一关联指数中确定出最大的两个关联指数α(a2,b)、α(b1,b)作为第二关联指数,并将与第二关联指数α(a2,b)、α(b1,b)对应的作品属性信息“题材:都市生活(a2)”和“传播地区:日本(b1)”,确定为与该第一形象信息匹配的第一影视作品的第一作品属性信息。

在本实施例中,在第一形象信息为一个时,将第一关联指数中最大的至少一个关联指数确定为第二关联指数,并将与第二关联指数对应的作品属性信息确定为第一作品属性信息,简单快速,可提高与第一形象信息匹配的第一影视作品的第一作品属性信息的预测效率。

在一种可能的实现方式中,根据所述第一关联指数,确定与所述第一形象信息匹配的第一影视作品的第一作品属性信息,可包括:在所述第一形象信息为多个时,对于任一作品属性信息,根据各个第一形象信息与所述作品属性信息之间的多个第一关联指数,确定所述第一形象信息与所述作品属性信息之间的总体关联指数;从多个作品属性信息的总体关联指数中确定出第三关联指数,所述第三关联指数是多个总体关联指数中最大的至少一个关联指数;将与所述第三关联指数对应的作品属性信息确定为所述第一作品属性信息。

在一种可能的实现方式中,在第一形象信息为多个时,对于任一作品属性信息,可根据各个第一形象信息与作品属性信息之间的多个第一关联指数,确定所述第一形象信息与所述作品属性信息之间的总体关联指数。例如,待预测的第一形象信息包括朴实、勤劳时,可从表1中确定出第一形象信息与多个作品属性信息之间的第一关联指数,分别为:α(a1,b)、α(a2,b)、α(b1,b)、α(b2,b)、α(b3,b)、α(b4,b)、α(a1,e)、α(a2,e)、α(b1,e)、α(b2,e)、α(b3,e)、α(b4,e),对于作品属性信息a1,可根据a1与第一形象信息之间的第一关联指数α(a1,b)、α(a1,e),确定第一形象信息与作品属性信息a1之间的总体关联指数。使用类似的方式,可分别确定出第一形象信息与作品属性信息a2、b1、b2、b3、b4之间的总体关联指数。

在一种可能的实现方式中,在确定出总体关联指数后,可从多个作品属性信息的总体关联指数中确定出第三关联指数。其中,第三关联指数是多个作品属性信息的总体关联指数中最大的一个或多个关联指数,本领域技术人员可根据实际情况确定第三关联指数的数量,本公开对此不作限制。例如,可根据第三关联指数的预设数量2,从多个作品属性信息的总体关联指数中确定出最大的两个关联指数(例如,第一形象信息与作品属性信息a1之间的总体关联指数、第一形象信息与作品属性信息b4之间的总体关联指数)作为第三关联指数。

在一种可能的实现方式中,可将与第三关联指数对应的作品属性信息确定为与第一形象信息匹配的第一影视作品的第一作品属性信息。其中,第一作品属性信息的数量与第三关联指数的数量相同。例如,第三关联指数为第一形象信息与作品属性信息a1之间的总体关联指数、第一形象信息与作品属性信息b4之间的总体关联指数时,可将与该第三关联指数对应的作品属性信息“题材:国庆(a1)”和“传播地区:俄罗斯(b4)”确定为与第一形象信息(朴实、勤劳)匹配的第一影视作品的第一作品属性信息。

在本实施例中,在第一形象信息为多个时,通过确定第一形象信息与任一作品属性信息之间的总体关联指数,将多个作品属性信息的总体关联指数中最大的至少一个关联指数确定为第三关联指数,并将与第三关联指数对应的作品属性信息确定为第一作品属性信息,从而可提高与第一形象信息匹配的第一影视作品的第一作品属性信息的预测准确性。

在一种可能的实现方式中,根据各个第一形象信息与所述作品属性信息之间的多个第一关联指数,确定所述第一形象信息与所述作品属性信息之间的总体关联指数,可包括:将各个第一形象信息与所述作品属性信息之间的多个第一关联指数的加权和,确定为所述第一形象信息与所述作品属性信息之间的总体关联指数。

在一种可能的实现方式中,计算多个第一关联指数的加权和时,各个第一关联指数的权重可根据各个第一形象信息的权重来确定,或通过其他方式确定。本公开对此不作限制。

在本实施例中,通过加权和的方式确定第一形象信息与作品属性信息之间的总体关联指数,可提高总体关联指数的准确性。

在一种可能的实现方式中,所述方法还包括:根据待预测的第二影视作品的第二作品属性信息以及所述形象关联模型,确定所述第二作品属性信息与多个形象信息之间的第四关联指数;根据所述第四关联指数,确定所述第二影视作品的第二形象信息。

在一种可能的实现方式中,可根据待预测的第二影视作品的第二作品属性信息以及形象关联模型,确定第二作品属性信息与多个形象信息之间的第四关联指数。例如,形象关联模型如表1所示,待预测的第二影视作品的第二作品属性信息包括:题材为都市生活,传播地区为英国、俄罗斯;可根据第二作品属性信息,从表1中确定出第二作品属性信息与多个形象信息之间的第四关联指数:第二作品属性信息“都市生活”与多个形象信息之间的第四关联指数为α(a2,a)、α(a2,b)、α(a2,c)、α(a2,d)、α(a2,e)、α(a2,f);第二作品属性信息“英国”与多个形象信息之间的第四关联指数为α(b2,a)、α(b2,b)、α(b2,c)、α(b2,d)、α(b2,e)、α(b2,f);第二作品属性信息“俄罗斯”与多个形象信息之间的第四关联指数为α(b4,a)、α(b4,b)、α(b4,c)、α(b4,d)、α(b4,e)、α(b4,f)。

在一种可能的实现方式中,可根据第四关联指数,确定第二影视作品的第二形象信息。其中,第二形象信息可以是一个或多个,本领域技术人员可以根据实际情况确定第二形象信息的数量,本公开对此不作限制。

在一种可能的实现方式中,在第二作品属性信息为一个时,可从多个第四关联指数中确定出第六关联指数,其中,第六关联指数是多个第四关联指数中最大的一个或多个关联指数;然后将与第六关联指数对应的形象信息确定为第二影视作品的第二形象信息。

例如,待预测的第二影视作品的第二作品属性信息只包括“都市生活”时,第二作品属性信息与多个形象信息之间的第四关联指数为α(a2,a)、α(a2,b)、α(a2,c)、α(a2,d)、α(a2,e)、α(a2,f);可根据第六关联指数的预设数量2,从第四关联指数中确定出两个最大的关联指数α(a2,d)、α(a2,e)作为第六关联指数,并将与第六关联指数α(a2,d)、α(a2,e)对应的形象信息“聪明(d)”和“勤劳(e)”确定为第二影视作品的第二形象信息。

在一种可能的实现方式中,在第二作品属性信息为多个时,对于任一形象信息,可根据各个第二作品属性信息与该形象信息之间的多个第四关联指数,确定第二作品属性信息与形象信息之间的总体关联指数。例如,第二作品属性信息与多个形象信息之间的第四关联指数为:α(a2,a)、α(a2,b)、α(a2,c)、α(a2,d)、α(a2,e)、α(a2,f)、α(a2,a)、α(a2,b)、α(a2,c)、α(a2,d)、α(a2,e)、α(a2,f)、α(b4,a)、α(b4,b)、α(b4,c)、α(b4,d)、α(b4,e)、α(b4,f),对于形象信息a,可根据各个第二作品属性信息与该形象信息之间第四关联指数α(a2,a)、α(b2,a)、α(b4,a),确定第二作品属性信息与形象信息a之间的总体关联指数(例如计算加权和);可使用类似的方式,分别确定第二作品属性信息与形象信息b、c、d、e、f之间的总体关联指数。

在一种可能的实现方式中,可从多个形象信息的总体关联指数中,确定出第七关联指数,并将与第七关联指数对应的形象信息确定为第一影视作品的形象信息。其中,第七关联指数为多个形象信息的总体关联指数中最大的一个或多个关联指数。例如,可根据第七关联指数的预设数量2,从多个形象信息的总体关联指数中确定出最大的两个关联指数(例如,第二作品属性信息与形象d之间的总体关联指数、第二作品属性信息与形象f之间的总体关联指数)作为第七关联指数,并将与第七关联指数对应的形象信息“聪明(d)”和“团结(f)”确定为第二影视作品的第二形象信息。

在本实施例中,能够根据待预测的第二影视作品的第二作品属性信息与多个形象信息之间的第四关联指数,确定第二影视作品的第二形象信息,从而可以通过关联指数,对影视作品的形象信息进行科学预测,提高影视作品的形象信息预测的针对性和可靠性。

在一种可能的实现方式中,所述形象关联模型包括各个形象信息对应的第一情感指数,所述方法还包括:确定所述第二影视作品的第二形象信息对应的第一情感指数。

也就是说,在形象关联模型包括各个形象信息对应的第一情感指数时,在确定出第二影视作品的第二形象信息后,可确定出第二形象信息对应的第一情感指数。例如,第二影视作品的第二形象信息为“聪明”和“团结”时,将形象关联模型中的“聪明”和“团结”对应的第一情感指数,确定为第二形象信息对应的第一情感指数。

在本实施例中,在形象关联模型包括各个形象信息对应的情感指数时,能够确定影视作品的形象信息对应的情感指数,从而可以根据观众对影视作品的形象信息的情感倾向,为影视作品制定符合观众情感倾向的传播策略。

在一种可能的实现方式中,第二影视作品的第二形象信息可通过可视化方式来显示。例如,第二形象信息可通过词云(即重要的文字突出显示)进行显示,各个第二形象信息的文字显示的字号大小可根据各个第二形象信息对应的关联指数的大小来确定,关联指数越大,对应的第二形象信息的字号也越大。

在一种可能的实现方式中,第二形象信息对应的第一情感指数也可在词云上显示,例如,可在第二形象信息的文字旁边通过对话框的方式显示该第二形象信息对应的第一情感指数。

根据本公开的实施例,能够根据待预测的第一形象信息与多个作品属性信息之间的第一关联指数,确定与第一形象信息匹配的第一影视作品的第一作品属性信息,从而可以通过关联指数,对与第一形象信息匹配的影视作品的作品属性信息进行科学预测,提高影视作品的作品属性信息预测的针对性和可靠性,进而为影视作品的创作者提供具体的创造指导,或者为影视作品的传播策略的提供参考。

根据本公开的实施例,还能够根据待预测的第二影视作品的第二作品属性信息与多个形象信息之间的第四关联指数,确定第二影视作品的第二形象信息,从而可以通过关联指数,对影视作品的形象信息进行科学预测,提高影视作品的形象信息预测的针对性和可靠性。此外,创作者还可根据预测的影视作品的形象信息,对该影视作品的作品属性信息进行调理,例如,对该影视作品的题材、传播地区的调整等。

图2示出根据本公开的实施例的影视作品的信息预测系统的框图。如图2所示,所述影视作品的信息预测系统包括:

第一指数确定模块21,用于根据待预测的第一形象信息以及预设的形象关联模型,确定所述第一形象信息与多个作品属性信息之间的第一关联指数,所述形象关联模型用于表示影视作品的多个作品属性信息与多个形象信息之间的关联性;

作品属性确定模块22,用于根据所述第一关联指数,确定与所述第一形象信息匹配的第一影视作品的第一作品属性信息。

在一种可能的实现方式中,所述影视作品的信息预测系统,还可包括:

第二指数确定模块,用于根据待预测的第二影视作品的第二作品属性信息以及所述形象关联模型,确定所述第二作品属性信息与多个形象信息之间的第四关联指数;

形象信息确定模块,用于根据所述第四关联指数,确定所述第二影视作品的第二形象信息。

本公开的实施例的影视作品的信息预测系统,可用于根据预设的形象关联模型、待预测的形象信息,预测与该形象信息匹配的影视作品的作品属性信息;还可用于根据预设的形象关联模型、待预测的影视作品的作品属性信息,预测该影视作品传播的形象信息。

以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

网址:影视作品的信息预测方法及系统与流程 https://klqsh.com/news/view/196272

相关内容

烹饪方法、烹饪装置及烹饪系统与流程
一种健康膳食推荐方法及系统与流程
智能自适应电子围栏系统及其控制方法与流程
一种宠物互动系统、方法及宠物娱乐终端与流程
一种基于RFID的室内电子围栏定位方法及系统与流程
基于公共电话网开展售后服务的信息家电系统及使用方法
宠物互动装置、系统及互动方法与流程
一种健身指导的实现方法、装置、系统与流程
一种地震应急处理方法及系统的制作方法
包含人与宠物互动内容的电子相册制作方法、装置及设备与流程

随便看看