枯燥的數字也能作詩賦詞?一位突發奇想的網友「yixuan」利用統計知識計算出了《全宋詞》中的高頻詞語,並依據其頻率高低製作出了一張頗具新意的「宋詞詞頻統計表」;其中,「東風」一詞以出現1382次高居榜首,排行第二、三名的詞分別是「何處」和「人間」……網友根據詞表上對應的頻率序號,將數字以生日、手機號碼等無釐頭的方式組合在一起,變成一首詩詞,這使得眾多網友詩意大發,在網絡掀起一股一秒鐘變詞人的熱潮。
用無序數字創造一首美妙宋詞,一位叫「yixuan」的理科生做到了。他統計出了《全宋詞》使用頻率最高的前100個詞語,並製成表格以便使用,在網上掀起人人作詩的浪潮。表中排在前面的詞彙分別是:東風、何處、人間、風流、歸去、春風等,例如圓周率π=3.1415926……小數點後的數字可生成三句詞:回首明月(1415),悠悠心事(9265),故人誰知寂寞(358979)……
這不禁引來不少網友「詩興大發」,紛紛以生日日期、電話作詩,如:(139)千裡歸來、(715)春風明月、(100180)往事空無情、(107181)江南斷腸西風;再如12、92,7、4、49,3、73,可組成:「梅花悠悠,春風人間無
限,何處鴛鴦。」
「宋詞密碼錶」的火速流傳,令人人都能填詞的浪潮遍及網絡,而記者也對照這份數字密碼錶,利用隨機數字「破解」成詞得出「年年誰知空,天涯醉東風,千裡歸去,黃花當年夢,而今少年,天涯匆匆。」這些拼湊而成的詩詞讀起似乎通順,也讓人感覺蘊含一定的意境,但數位化的詩詞到底能否讓人一秒變詩人呢?
隨著密碼錶的走紅,這位宋詞密碼的破譯者「yixu-an」 似乎也引來了不少關注。據媒體報導,網友「Yixu-an」 是中國人民大學統計學院學生,因專業學習需要常常跟各種類型的數據打交道,他表示,這其實不是一件技術含量很高的事,只是需要一些編程經驗,而主要的時間則是在文本整理上,大概花費他一個晚上的時間。
「Yixuan」在個人博客裡寫道,想看看宋詞裡什麼意象最常見,所以做了個頻率分析,而文本挖掘需要分詞,於是想出了一個土辦法。比如「猶解嫁東風」這句話,可能的二字組合是「猶解」 「東風」,三字組合是「猶解嫁」「解嫁」「嫁東」
「解嫁東」「嫁東風」,詞的字數越多,可能的組合就越少。如果把每句話可能的字組合都列舉出來,就可以整體統計高頻詞頻率。
其實諸如此類的,不僅僅局限在詩詞方面,早前就有網友統計的「汪峰體」,他在汪峰發行的9張專輯共117首歌曲中發現「孤獨」「生命」 「愛」「自由」等詞彙在歌曲中出現頻率極高,如「生命」出現了50次,「孤獨」出現了34次(同一首歌中重複出現算一次),根據這張「汪峰歌詞表」任何人都可創作出如同汪峰式的歌詞,如圓周率3.1415926對應的是:「堅強的孩子,依然前行在路上,張開翅膀飛向自由,讓雨水埋葬他的迷惘。」
北京師範大學文學院講師、碩士研究生導師謝琰:「古詩有一種詩體叫『迴文詩』,整首詩可以從頭念到尾,也可以從尾讀到頭,是漢語特有的一種使用詞序迴環往復的修辭方法,清代長篇小說《鏡花緣》出現的《璇璣圖》,就是織成一塊八寸見方的五色錦緞,用文字織成迴文詩。因此以拼貼的形式創作出一首宋詞,是有這種可能性的。」
西南交大人文學院教授、博士生導師汪啟明:「文學創作講究神和形,從神來看,宋詞是適應當時的人、社會的文學產物,形成於詞人的生活積澱、人生感悟,有濃厚的情感內涵;從形來看,宋詞創作對韻律、平仄都有要求,主要是中古時期的音律。而用公式寫出的詩詞,難免缺乏結構,內容略微空洞。」
成都詩人何小竹:「大數據思維可以幫助宋詞研究,對分析詩歌結構、句子成分有一定裨益。機器人創作是基於語言數據的輸入和輸出,對認知提供了一種新的路徑,但無法代替真正的寫作。」
成都詩人翟永明:「機器人可以創作出一首完美的詩,但這首詩是一個結果,沒有過程,無法取代詩人充溢在字裡行間的感情、熱度和溫暖。」
快報記者金多倫 楊心璐