• <input id="emamm"></input>
  • <bdo id="emamm"></bdo>
  • Cehui8.com 測繪地理信息領域專業門戶
  • 首頁 > 測繪新聞 > 互聯網

    AI為文學角色“測”人格,看人工智能與文學如何聯合

    2018-09-21 11:30:26 來源: 《中國科學報》
    聊聊

    ▲以《平凡的世界》中的主人公孫少安、孫少平兄弟為例,分析兩位主人公的總體性格與經歷重大生活事件后的性格變化。結果如表1、2、3所示。

    在心理學中,要準確、客觀測量一個人的性格,一般通過自我報告或填寫性格測試來進行評價。可如果測量的對象是一個文學作品中的虛構人物呢?

    傳統文學分析方法只能基于定性研究,且與研究者的主觀體驗密切相關。如今,得益于生態化識別技術的人工智能分析法,科學家通過捕捉人物對話就能實現對文學角色的“人格測量”。

    近期,中科院心理所和廈門大學科研團隊的這一合作成果在線發表于《中文信息學報》和國際學術期刊Digital Scholarship in the Humanities。

    文學人物定量分析難

    1975年至1985年間,中國土地所有制改革開始實行,農村跟著進入了發展黃金期。作家路遙以一對兄弟——耿直、堅韌、質樸的孫少安和同樣堅韌又更敏銳、靈活的孫少平的生存與生活故事,展示了中國西北農村一段蕩氣回腸的變遷史。

    小說,是以刻畫人物形象為中心的。《平凡的世界》作為當代文學史上的一部巨作,它所塑造的經典人物形象是許多文學批評家、評論家、作家研究和分析的對象。

    而通過對小說人物性格的分析,可以幫助讀者更準確、深刻地理解人物的語言、行動和內心世界,以及它所反映的現實背景。

    論文通訊作者、中科院心理所研究員朱廷劭表示,單純在文學界對小說人物的性格主要是定性分析,不過,這樣的心理分析主要依靠的是研究者在研究過程中的主觀體驗和文學素養。比如,通常研究者會從微觀方面將小說中的一個或多個人物的性格概括為主要的幾個方面,然后對這幾個方面的性格特點用文本中的有關描寫進行佐證。

    另一種思路是從語言學的角度出發,通過對情態動詞和高頻詞的統計,分析小說人物性格。這是一種定量方法,但并不主流。

    說到對人的內在分析,心理學是有系統的、科學的研究方法的。只是過去心理學的研究對象都是真實存在的,而非虛構人物。但引入心理學方法研究文學人物完全是可行的。

    研究顯示,目前,小說人物的心理分析主要依據心理學家提出的人格三層次模型。其中,最基礎的是作出對人格特質最基本的描述。人格特質是個體行為的穩定的、顯著性傾向;第二層是個人關注,是描述個人奮斗、生活任務、防御機制、應對策略等大量有關人格動機和策略等方面的建構,從而了解一個人在不同情境下的動機、關切和策略;第三層是生活敘事,需要去探究一個人從出生到成年的發展歷程,也就是人生故事。

    但朱廷劭指出,相較于后兩層,通過最初的人物性格或人格特質分析對文學角色進行的討論是最少的。原因就在于,這類分析必須依據基于自我報告的心理測量,顯然,這在虛構人物身上很難實現。

    基于對話的智能分析法

    不過,在有了生態化識別技術之后,自我報告的測量方法就不再是虛構人物人格分析的障礙了。這一技術是基于生態化的行為數據,利用機器學習實現個體心理特征的自動識別的過程。

    在此之前,中科院心理所計算網絡心理實驗室基于新媒體大數據和深度學習技術,開發了一款網絡心理的研究工具——大五人格預測模型。簡單說,研究人員可以利用社交媒體內容與大五人格量表的映射關系,對社交媒體使用者的人格進行自動識別,而無須通過量表進行測量。經過檢驗,這個模型預測值和量表測量結果之間的相關性已經達到了中等程度。

    那么,小說人物能否使用大五人格預測模型進行分析?答案是肯定的。

    社交媒體的內容一般是個人較為口語化的自我表達,也就是說,如果研究人員能把小說中與該人物相關的自我表達內容提取出來,錄入模型,便可以得到預測結果。

    在小說里,最符合人物自我表達屬性的內容就是對話(“直接引語”)。以《平凡的世界》為例,研究人員首先按特定格式將小說文本中所有的對話提取出來,并以人物為分類條件拆分對話。每個人物的對話集就是系統分析的對象。

    不過,角色有主次,分配到每個角色的對話體量也是不同的,體量過小必然會影響模型預測的有效性。孫少安、 孫少平、田潤葉和田曉霞是小說的4個主要人物,不僅具有人物代表性,得到作者的筆墨也是最多的。

    接下去,研究人員需要對這4個人物各自的對話內容進行預處理。首先,他們利用中文分詞工具,將所有自然語言進行拆分;然后,通過一種量化分析軟件——中文心理分析詞典,對分詞得到的所有詞匯進行詞匯統計,得到完整的詞類分布。該心理分析詞典共有102個詞類、6547個詞,包括與盡責性相關的成就詞、情緒性相關的焦慮詞、外向性相關的朋友詞等詞類,詞類之間可相互重疊,也包括對標點符號和詞長的統計。

    最后,根據詞類統計的結果使用大五人格預測模型進行分析,得到該人物大五人格的預測分數,包括人物的宜人性、盡責性、外向性、開放性和神經質的分數。

    該研究結果顯示,從預測數值上看,開放性相對較強的孫少平和田曉霞是思想最超前的;盡責性較強的孫少平和田潤葉是受傳統道德觀念影響較深的;外向性較強的孫少安和田潤葉是年長且在社會上表現出良好交際性的;宜人性較強的是謙讓、忍耐的孫少安和活潑大方的田曉霞;情緒性較強的孫少安、孫少平是因為貧窮而在生活中充滿挫折和矛盾的。

    朱廷劭表示,在與現有的文藝學文獻對這一小說人物性格的分析研究成果進行比較之后,文學智能分析的結果是與前者相符合的,從而證明了預測是有效的。

    人工智能與文學的聯合

    這是一次客觀的、量化的科學分析方法與文學的結合,給文學人物分析提供了一種全新的思路,可以屏蔽一些文學主觀評價帶來的偏差。

    “不過,僅將這種方法用于文學作品的個案分析意義有限。”朱廷劭告訴《中國科學報》記者。

    他認為,這種具有客觀性、可重復性和處理大型語料庫優勢的技術,可以同時用于大樣本量的分析,試圖去尋找不同歷史時期、不同時代背景下的文學作品中,個體人格特質、命運與所處環境之間可能存在的獨特的關系。

    此外,文學領域存在大量的紀實作品,比如人物傳記、口述史、書信等,文學智能分析還可以為那些與我們相隔久遠的歷史人物進行一次科學的人格測試,作為史料分析的新的客觀手段,也不失為一種有價值的應用方向。(記者 胡珉琦)

       聲明:中測網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考。

    返回頂部
    山东十一选五