朋友圈似乎被趙雷刷了屏,“成都”這個詞仿佛當年的“安河橋”。很少聽民謠,印象最深的民謠歌手是李健,因為家庭聚會時小姨總是一臉花癡地看著電視夸他多么帥。
有點好奇這群流浪的現代游吟詩人到底在吟什么,所以嘗試從數據分析的角度來看看。
參考了網易云音樂和蝦米網的「熱門民謠歌曲」和「熱門民謠歌手」,咨詢了朋友圈的幾位民謠青年,選出10位分析對象:李健、趙雷、李志、好妹妹樂隊、宋冬野、陳粒、左小祖咒、堯十三、郝云、周云蓬。
寫了個爬蟲,抓取了QQ音樂上這個歌手的所有歌曲。這里其實犯了個小錯誤,本來想抓前十首熱門歌曲,可是錯設成了全部歌曲,但其實工作量沒差多少,就將錯就錯了。
就這樣,采集了568首歌曲,共計30多萬字歌詞。掃一眼已經能感覺到淡淡的憂郁,為了能保持理智地敲鍵盤,我點開了周杰倫。
好,開扒>>>
正能量滿滿時,聽好妹妹、郝云;憂郁憤懣時,聽陳粒、左小祖咒。
情緒通常通過形容詞來渲染,通過自然語言分析比對詞庫,綜合“正面/負面”標簽和詞頻權重,給每位歌手的情緒風格打分,正數∝正面情緒,負數∝負面情緒,條形長度為情緒強烈程度。
好妹妹樂隊和郝云簡直打了雞血,抑揚激昂的唱腔唱著正能量滿滿的內容,顛覆了我以為民謠就是慘兮兮的偏見。
最近很火的趙雷算是平平淡淡不疾不徐的一掛,不鼓動你也不替你說出心中郁結,而是悄然無聲地感染你。
聽陳粒、好妹妹樂隊的歌,就像看電影。
有些文字特別有畫面感、既視感,眼睛在讀文字,腦中已浮現出電影般的畫面,仿佛已置身其中,進一步加深情緒氛圍、產生共鳴。
馬伯庸在知乎的課上,道出了增加小說畫面感的寫作秘密:多寫動詞。
由于每首歌的字數不一,所以按動詞在個人高頻詞里的占比來排序。對比前一張圖來看,陳粒和好妹妹樂隊都是利用畫面感來煽動情緒的高手。
民謠青年對北京最扎心,你認識的民謠范兒朋友30%漂在長三角。
北京在民謠的世界里占有絕對的地位,隨其后的是上海和南京。北漂嘛,比較容易理解。長三角作為抽血重點區域,交織著無數人的青春與理想,人前上進拼搏,人后憂郁寂寞。
老實說,把“成都”換成別的北方城市,唱起來其實差別不大。但要是換成廣州,把“走到玉林路的盡頭,坐在小酒館的門口”變成“走到上下九的盡頭,坐在茶樓的門口”,頓生一股安逸退休生活的feel,一點都憂郁不起來了。
換句話說,民謠放在哪個城市都可以,但只要簡單的A/B測試,即可得知放在北京、上海這些城市,最有代入感、最受歡迎。
“我會背上吉他離開北方——宋冬野《斑馬,斑馬》”,我女神寶刀shishi也說過“南方是我的經驗”。
對于民謠青年來說,南方或是出身的地方,或是想逃往的地方,在那里,有虧欠過的人,有不說是結、說了是疤的回憶。
身在寒冬,心向春夏。奮斗雖苦,但含著淚水,也滿懷希望。
民謠青年對春夏這個意象的向往,可以延伸解讀為他們寄望于明天。驟眼看來,他們似乎是無病呻吟故作姿態。
但自舔傷口之余,他們憂傷但不消沉,或是有強烈的信仰支撐、或是轉身已無后退之路,原因不一。無論是哪個原因,未來并不灰暗,反而充滿可能。
用戶畫像
假如把一首民謠比作一部電影,那電影主角會是什么形象呢?綜合透視30萬字歌詞,洗出140個關鍵詞,選前20個高頻詞,大膽猜測出——
男,活躍在北京或長三角,對青春和理想有情懷,外表樂觀陽光,內心孤獨憂傷,重朋友,單身狗,有幾個糾纏不清的前女友,處于職場奮斗上升期。
「望著夜空概嘆時光飛逝,我回憶起曾經的青春和奮斗的理想,心中堆滿憂郁和孤獨,此刻你能否給我一個擁抱?」
ps
自然語言分析情緒做得比較粗糙,舉個栗子,“失去”>>負面(負值),“希望”>>正面(正值),“失去希望”>>負面,但分詞自動求和的結果視各詞的權重可正可負,導致誤差。
各音樂網站上,每首歌曲的作詞作曲、樂隊成員姓名基本都有詳細列明,體現了對版權和音樂人的尊重,值得一贊。
順便對比了幾大音樂網站的搜索算法和用戶體驗,有機會再寫吧。網易云音樂確實是做得最好的,是我技術問題沒抓取好。
不要糾結工具,能玩溜excel已經能做很多東西了。