實際來看 StoryFit,一間專門服務電影、戲劇的科技公司,如何利用數據分析與改善
前言
數據分析可以幫助開發部門決定:
- 故事當下的話題性如何?故事設定發生在何處接受度最高?該話題是否具週期性?
- 如何細緻改寫劇本中的老套情節
- 為特定觀眾找出對的故事,以及觸及這些觀眾的最佳途徑(對市場行銷部門也有用)
- 藉由分析瀏覽歷史、搜尋記錄、點擊、參與度等,得知什麼是觀眾正在尋求的
無論是寫作劇本或選擇劇本的過程當中,編劇和製作人都必須不斷作出重重抉擇。選擇之多,幾乎令人崩潰,而一旦犯錯,更可能造成損害。
而針對文本的預測,可使製片公司在開發階段的種種個別問題,更加清晰及脈絡化。
文本探勘技術介紹
文本探勘(*註:用自然語言處理、文本挖掘以及計算機語言學等方法來識別和提取原素材中的信息 )可以顯示故事中隱藏的架構,告訴我們這個故事在說什麼,並闡明實際說故事的機制。一個數據科學家/預測模式可以將這些機制與票房收入、影評反應、預算等聯繫起來。製片公司可以據此找出能夠引發共鳴的故事,以及很重要的--找出故事中的哪些元素能夠為他們的投資取得最大回報。
例如:若想了解討論度,製作人可以利用數據分析,解讀瀏覽歷史、網路搜尋記錄或用戶參與度等等,找出人們主動尋求的內容。
劇本中的各個元素都能與外界(如:社交媒體參與度)作比對,透過諸如文本情感分析的方法,以便測量話題的相關度及觀眾群大小。
應用 ①:協助建立綠燈程序
從這些數據,製片公司可以建立挑選劇本的常規模式,在綠燈程序中建立快速通道。若有一位導演想拍下一部《月光下的藍色男孩》,透過簡單的詞袋模型(註:偵測詞彙使用頻率)找出劇本中的主題、場景及情緒。
例如:「槍」、「血」、「打鬥」、「撞車」、「警察˙」等詞彙高頻率的出現,可能表示劇本包含一個犯罪故事,並有一連串的動作。
若想知道犯罪類型是否賣座,可以先透過找出高頻率出現——「槍」、「血」、「打鬥」、「撞車」、「警察˙」——的電影,並觀察這些電影的過去電影票房收入,我們就能知道這類型電影是否可能賣座;或進一步將各個詞彙在電影出現的比例與票房比較,判斷是否有特定詞彙出現的頻率與票房高度相關,進而從詞彙出現頻率,判斷劇本是否擁有高票房潛力。
詞袋模型也能讓製片人粗略評估是否該製作某部電影。
然而多數的數據科學家都同意,如果缺乏人的元素,分析只不過是昂貴的數字。舉個簡單的例子:「惡棍殺死超人」和「超人殺死惡棍」,兩個句子含有的詞彙及出現頻率完全一樣,但所觸動的觀眾情緒反應卻大不相同。因此在分析故事時,需要結合編劇的專業知識,才能充分發揮預測的潛力。
應用 ②:協助調整劇本
2016年,一項研究針對2010至2011年發行的170部美國電影,進行了文本網絡分析,以此預測首映周末票房。研究發現票房預測成功最重要的指標是劇本網絡的規模和複雜度,例如:個人關係、主題、概念有多少,都可以在劇本中找出來。採用迴歸模式比對票房表現及劇本複雜度(又名網絡強度)的研究,也支持了這項研究的發現:內容和類型是預測票房成功的最可靠的指標。
2014年另一項研究則發現:獲得獎項或得到提名的電影,文本網絡的規模比起其餘電影高出33%。
換言之,主題、角色、概念數量較多的電影,比簡單的電影更容易在票房、評價上獲得成功
應用 ③:了解高利潤的關鍵因素
愛荷華大學的研究者採用文本探勘的類似技術及社交網路分析,以淨利潤取代票房收入作為衡量標準。他們發現儘管明星影響力對票房收入有中等相關,但與淨利潤的相關卻明顯較弱。也就是說,明星可以衝高票房收入,卻不一定能創造高淨利潤。
他們的研究找出了製片過程與利潤的相關因素,例如類型平均專業度(全體演員在某種類型電影中有多少專業度)及導演-演員平均合作度。