Cover Photo by Viva Luna Studios on Unsplash
資料科學專家 Oleksii Kharkovyna,介紹 5 個運有新科技,影視工作可採用的改善方案
前言
① ScriptBook:運用資料科學方法分析劇本
② Cinelytic:協助組成對的卡司
③ Netflix、Amazon、Hulu:創造個人化的觀影推薦
④ 運用預測分析,改善宣傳效果
⑤ Merlin Video:預告片數據分析
結語:分析的重點在於——投資報酬率
前言
電影賣座新公式?預測分析真能為電影製作帶來革命性改變?讓我們來逐一解析。
電影工業中有太多這樣的例子:一部即將上映的電影,各方面都看起來很完美,財務及創意資源相繼投入,最後卻在市場上慘遭滑鐵盧。即使是最富才智、最資深的電影製作人都難以解釋失敗的原因,此時資料科學便可提供解答。
在今日的電影工業中,資料科學可在多個方面扮演要角:
① ScriptBook:運用資料科學方法分析劇本
一家 2015 年創建於比利時安特衛普的公司 ScriptBook,運用劇本文本分析技術,提升影片品質。營運一年後,這家新創公司吸引了 140 萬美元的投資,並於2018年夏季在卡羅維瓦利影展展示其技術。
操作很簡當:將劇本的 PDF 檔載入系統,五分鐘後便輸出一份詳細報告。系統會預估年齡分級、分析角色、指出主角及其敵手、評估每個角色的情緒表現、預測觀眾群(包括性別和種族),並分析可能達成的票房。
據開發者表示,ScriptBook 人工智慧對前景黯淡的電影之鑑別力,較人類好上三倍。ScriptBook 分析了 62 部索尼電影,當中 32 部票房表現不佳。而 ScriptBook 估測出其中 22 部的失敗,顯示大部分的財務損失其實都可以避免。而對於其他 30 部票房亮麗的電影,ScriptBook 都開出綠燈。在此之前,ScriptBook 已學習過 6500 部已上映電影的劇本,評估票房成功的準確率達 84%。
ScriptBook 演算法最準確的預測是 2016 年 12 月於美國首映的《星際過客》。人工智慧很難在財務預測上出錯:這部電影票房收入 1.1 億美元(註:美加地區),預估則為 1.18 億美元。
② Cinelytic:協助組成對的卡司
Cinelytic 公司自 2013 年建立一平台,你只要輸入不同演員的名字,它便可告訴你:如果你更換電影卡司中的一個演員,對票房會產生多少影響。 Cinelytic 使用電影票房的歷年數據,並與電影的主題、主要演員等資料配對,然後讓機器學習找出其中的模式。
例如:某部電影預定卡司為巨石強森,你可以在 Cinelytic 的平台上用布魯斯.威利取代巨石強森,然後看看電影票房將如何變化。使用者還能比較不同的設想局面。
③ Netflix、Amazon、Hulu:創造個人化的觀影推薦
知名的成功企業如 Amazon、Hulu 及 Netflix,無一不分析數據隱含的模式,據此決定製作內容的類型及進行個人化的推薦。
為了讓觀眾保持投入,Netflix 創建並持續改良自適串流演算法,使串流品質最佳化,並創造出個人化的使用經驗。Netflix 藉由調整媒體的影像及聲音品質,讓使用者得到最佳體驗。Netflix 同時採用預測快取,使影像播放得更迅速,品質更好。例如當觀眾正在觀看一部影集時,下一集會便會部分緩存。
若把營收作為指標,Netflix 演算法可說大獲成功:自 2015 年 Netflix 利潤已增長超過 30%,年營收超過 166 億美元。
④ 運用預測分析,改善宣傳效果
如果在下一部電影開始行銷之前,就能預測其效果,不是很棒嗎?如果可以知道最吸引觀眾的元素,並將它用在宣傳活動上,不是很棒嗎?有時候一部好電影就敗在宣傳上。
2018 年電影界最大的失敗之一就是迪士尼的《星際大戰外傳:韓索羅》。2.5 億美元的全球預算,最後只賺回2 .13 億美元。據說行銷是主要原因:太晚推出預告片,宣傳活動火力全開時,距離首映只剩一個月。
預測分析可以用於宣傳活動的每一個環節。美國愛荷華大學的研究指出,某些因素更能左右電影獲利。該研究建立一個資料庫,涵蓋 2000 至 2010 年在美國發行的四千部電影,並建立一預測模式從中找出在商業上獲利的電影共同的因素。 這些因素分成四個群組:
► Who-包括因導演及演員而成功的參數。
► What – 電影的類型及年齡分級。
► When-電影在一年中何時發行,以及當年電影產業有多興隆。
► 綜合屬性-如:電影中某演員是否曾經參演過某類型的電影?
迴歸分析顯示,電影收益深受關鍵因素影響。例如:導演對於電影獲利的重要性相當突出。研究將過去理論研究所建議的因素(如:演員的明星指數、團隊的專業度、團隊的多元化)加以量化,亦有助該研究找出關鍵因素,並在獲利預測中很好地發揮作用。
⑤ Merlin Video:從預告片分析觀眾群
劇本文本分析還不足以告訴我們哪些觀眾可能喜歡這部電影、最好針對哪些觀眾群宣傳。因此我們也需要分析預告片。福斯與 Google 雲端合作開發 Merlin 學習程式,藉由分析預告片,試著找出觀眾對不同類型電影的偏好之基礎模式。
Merlin 是混合型的協同過濾(註:利用某興趣相投、擁有共同經驗之群體的喜好來推薦使用者感興趣的資訊,個人透過合作的機制給予資訊相當程度的回應,如評分,並記錄下來以達到過濾的目的進而幫助他人篩選資訊)管道(註:工作流),將過去幾年數百部上映的電影、數百萬筆觀眾到場的記錄,結合不同來源的資料,且完全匿名,保障使用者隱私。
以電影《羅根》為例,它是漫威漫畫旗下的金鋼狼,作為獨立角色的第三部、也是最後一部電影。《羅根》發行於 2017 年,票房收益 6 億美元(預算不到六分之一)。哪些其他電影能吸引觀眾?大眾喜愛這位英雄的何種特點?分析《羅根》的預告片之後,類神經網路就能回答這些問題。
Merlin 發現,金鋼狼最重要的特點就是「鬍鬚」。其他特徵還有「樹木」、「面部毛髮」、「車子」和「男人」。除了重複出現的頻率外,類神經網路也考慮到這些細節在螢幕上出現的時間。預告片中出現人物的長時間特寫,可能是劇情片的特徵。但若出現快速頻繁的場景變換,則可能是動作片。
然後 Merlin 收集電影口碑、票房、在網路上觀看的次數等資訊,進行比較。在實際觀眾調查中,《羅根》的影迷也喜歡其他 20 部電影,而人工智慧猜中了一半。
猜中的並非只限《X 戰警:天啟》、《奇異博士》、《蝙蝠俠對超人:正義曙光》等超級英雄電影。Merlin沒有漏掉《捍衛任務2:殺神回歸》--一名外貌滄桑的殘暴英雄,如同《羅根》。
兩者不一致之處也具啟發性。例如:演算法認為《羅根》的觀眾也會喜歡《泰山傳奇》,顯然是因為螢幕上也出現了大量的樹木。但它卻漏掉了《蟻人》和《死侍》--兩者的預告片都不那麼戲劇性。
在 2017 年 11 月《大娛樂家》發行之後,二十世紀福斯開始持續採用演算法,除了使用 Merlin Video 分析預告片,也利用 Merlin Text 研究劇本。
對觀眾群的預測,可以應用在已發行的電影,也可用於尚在準備的製作前期。為了檢視預測與實際票房吻合的程度,也需納入應用電影院的售票記錄、影片在線上租借及付費收看的數據。
結語:分析的重點在於——投資報酬率
更多資料科學,造就更多佳片?
從決定製作成本,到企劃針對目標市場的行銷活動,資料科學家可以解答看似不可解的謎團。資料科學可以實際應用於電影製作的每個環節,因此別忽略即便是最細微的細節,它們很可能是影響最終結果的決定性因素。
預測性的分析工具可以協助製作人、製片公司及高管進行策略性決策、預測趨勢,並更了解觀眾的習慣。與此同時,許多人憂心這樣的系統會抹殺所有的獨立電影,因為它們獲利並不高,而且偏離常見的模式。但分析的重點不在於營收,而在於投資報酬率。且讓我們拭目以待。
原文連結:Lights, Camera, Data Science: Predictive Analytics for Film Industry