Don't Miss

數據與文學（郭德偉）

By EJ Tech on October 17, 2024

本文作者郭德偉（Andy Kwok），為數據素養協會資深創會會員兼 OpenCertHub 創辦人及行政總裁，為《EJTech》撰寫專欄

每當我們談及數據時，話題總離不開商業或⼯作應⽤上，不如今次換個⾓度，講解如何利⽤數據幫助我們對文學作品的深入理解。⼤家有沒有想過，文字本⾝也是⼀種數據，在⼤數據的領域中，所有文字、語⾳或圖象訊息均可歸類為「非結構化數據 (unstructured data)」。運⽤⼤數據模型進⾏分析，能夠揭⽰出新的⾒解。在文學研究中，數據的應⽤不僅增強了我們的閱讀體驗，還促進了對經典作品的理解。

文字本⾝也是⼀種數據，可⽤來作情緒分析 (sentiment analysis)。(作者提供圖片)

由於我從⼩就熱愛東洋文化，中學時期對⽇本文學作品特別情有獨鍾，尤以夏⽬漱⽯為我最喜愛的作家。或許有些讀者對這位作家的名字不甚熟悉，但我相信如果你是⽇本旅遊的常客的話，你對他的肖像可能感覺並不陌⽣。何解？這是因為⽇本政府為紀念夏⽬漱⽯這位文學巨匠，⾃ 1984 年（昭和 59 年）11 ⽉ 1 ⽇⾄ 2007 年（平成 19年）4 ⽉ 2 ⽇期間，將其肖像印刷於⼀千⽇圓的鈔票上。⽽我作為他的粉絲，當然也收藏了⼀張以作紀念。

就以夏⽬漱⽯的其中⼀部經典⼩說《我是貓》（⽇語：吾輩は猫である）為例，借助有趣的數據和分析⾓度，嘗試深入理解這部文學作品。⾸先我為⼤家簡單介紹⼀下，《我是貓》是夏⽬老師於 1905 年出版的⼩說，這部作品被認為是⽇本文學中的經典之⼀。故事以透過⼀隻貓的視⾓為題，觀察⼈類的⽣活與社會的各種現象，展現了豐富的⼈性和社會批判。

透過⼤數據模型去研究文學作品，可以從以下幾⽅⾯分析找出新亮點：

詞頻分析

利⽤關鍵詞作統計，分析文中經常出現的詞彙，例如「貓」、「⼈」、「孤獨」、「觀察」等。這些詞的出現頻率可以反映出作品的核⼼主題。⾼比例的「⼈」詞彙可能表明夏⽬對⼈類社會的批評或反思，⽽「貓」的頻繁出現則強調了貓的獨特視⾓和思維。另外透過詞彙變化，隨著故事情節的發展，特定詞彙的出現頻率是否有所變化，這可以揭⽰⾓⾊⼼理的變化或情節的轉折。

⾓⾊分析

利⽤⾓⾊出現的頻率，統計各個⾓⾊在⼩說中的出現次數，了解哪些⾓⾊的重要性，以及他們的互動模式。透過分析⾓⾊在不同情況下表達的情感，了解他們的情感傾向。例如貓對⼈類的看法是積極還是消極，這樣可以幫助讀者對⾓⾊的理解。

文本結構分析

利⽤章節⻑度統計，分析各章節的字數，了解作者在不同情節中所花費的篇幅，有助反映出重要情節的強調。透過分析語句⻑度，測量句⼦的⻑度和結構，了解漱⽯的寫作風格和語⾔特點。掌握這些數據不僅能夠幫助讀者更深入地理解《我是貓》這部作品，還能增加閱讀文學的趣味性，讓作品的分析變得更為豐富和立體，促進讀者之間的交流。

數據在我們⽇常⽣活中已廣泛地應⽤，掌握數據素養有助提⾼我們的⽣活質素及⼯作效率。下次我會尋找⼀些有趣的數據主題，再與⼤家分享和學習。

更多郭德偉文章：

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

unstructured data 夏目漱石

Tweet

Pin It

Latest News

從「AI之亂」看宮崎駿傳承（黃岳永）
我們從20多歲到60歲左右，人生中大約有40年是在工作，到了退休年齡，或許還有20年、30年時間，讓我們回望並享受自己的人生。

Posted July 8, 2025

0

Dyson溫室｜Dyson英建溫室巨輪種草莓
英國家電巨頭Dyson在當地林肯郡卡靈頓，建造了一座佔地26英畝的全新溫室。這個巨型溫室長760米，最大特色是裝有多個5.5米高的巨輪，上面種了122.5萬株士多啤梨，每年可生產1250噸優質水果。

Posted July 8, 2025

0

AI恐增病毒風險？｜大模型助合成病毒風險增
美國非牟利組織預測研究院（FRI）近日發表研究報告，指出大型語言模型（LLM）在生物學領域知識表現進展快速，可能增加人為引發大規模傳染病風險。

Posted July 8, 2025

0

融資趨勢｜歐美初創融資 AI佔近四成
研究機構Pitchbook資料顯示，人工智能（AI）及機器學習（ML）初創，在風險債務融資佔了更大份額。

Posted July 8, 2025

0

CEO思維｜OpenAI高層促開發員學CEO思考
美國人工智能（AI）科企OpenAI工程副總裁納拉亞南（Srinivas Narayanan）【圖】，日前出席印度理工學院（IIT）馬德拉斯分校一場座談會。

Posted July 8, 2025

0

印裔工程師狂「秘撈」｜求職平台反讚：最佳面試官
帕雷克（Soham Parekh）身兼多間公司不同職位，不少行政總裁被蒙在鼓裏，得悉真相後在社交平台上直言：「你被炒了，立即生效」；也有人佩服其辦事能力，誇獎「他簡直就是老闆中的老闆」。

Posted July 8, 2025

0

一人身兼34職？｜印裔工程師狂「秘撈」獲聘10企被揭學歷造假淪矽谷公敵
最近一名印度裔軟件工程師帕雷克在網絡爆紅，事緣至少有10位科企高層公開表示，他們不約而同地聘請了帕雷克，更有指他高峰期「一人身兼34職」。

Posted July 8, 2025

0

POPULAR POSTS

Meta黃金陣容｜設超級智能實驗室汪滔與GitHub前總裁領軍挖角潮未完

 記憶提取｜冷凍大腦存取記憶百年後實現

 電擊提升數學能力｜微電刺激大腦或增數學能力

 虛擬男團｜The Velvet Sundown爆紅收穫55萬聽眾

 AI外賣車｜武漢試運AI外賣車送餐更快

 論文亂象｜檢測論文AI內容準確度成疑

 AI扼殺流量｜「零點擊」搜尋重創新聞網流量

 CEO思維｜OpenAI高層促開發員學CEO思考

 融資趨勢｜歐美初創融資 AI佔近四成

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe