用爬蟲分析了全網(wǎng)年夜飯菜譜后 找到了最有年味的一道菜
- 來源:大數(shù)據(jù)文摘
- 作者:3DM整理
- 編輯:newtype2001
說起過年,最有儀式感的一道程序可能就是年夜飯了。
從遠(yuǎn)方風(fēng)塵仆仆趕回來的一家人,圍坐一起,觥籌交錯(cuò),是每個(gè)中國人心中對(duì)“年”最深的印象。
但不同地區(qū)、不同的人對(duì)吃也有千百種看法。千滋百味是中國菜的特色,但中國的“年味”到底是怎樣的?
回答這個(gè)問題似乎可以從數(shù)據(jù)分析上入手。
在咽了無數(shù)次口水后,文摘菌選取了幾個(gè)美食網(wǎng)站,獲取了所有帶有“年夜飯”這一關(guān)鍵詞的菜譜。在這些網(wǎng)站上,爬下的菜譜除了系統(tǒng)推薦,相當(dāng)大的一部分內(nèi)容是活生生的用戶大廚們主動(dòng)上傳。
簡單來說,爬取這些“年夜飯”菜譜的過程,就像走進(jìn)了千萬家的除夕夜一樣。文摘菌看著這一桌桌“年夜飯”備好出鍋,關(guān)于中國“年味”的印象也就大致成形了。
分析過程
首先,當(dāng)然是寫爬蟲,為了保證年夜飯分析的多樣性,文摘菌踩點(diǎn)挑選了幾個(gè)常用的美食網(wǎng)站:豆果美食、天天美食、美食天下、香哈網(wǎng)、心食譜等等,爬下了相關(guān)數(shù)據(jù)。
爬蟲腳本使用Python的requests+BeautifulSoup+selenium三大庫來完成。
由于手比較生,沒實(shí)現(xiàn)全自動(dòng)化,采用的是簡單粗暴地按頁爬方式。主要鎖定了幾個(gè)維度:菜名、用料、食材+數(shù)量搭配、其他(包含口味|工藝|耗時(shí))、制作步驟、Tips、url。
requests和BeautifulSoup 用來提取頁面上的美食信息,selenium 用來自動(dòng)觸發(fā)ajax刷新下一頁。
因?yàn)閿?shù)據(jù)量不多,所以這一次直接存在了txt文件里面,說實(shí)話,暫時(shí)用不到MySQL、Hadoop一類的東西了。
分析結(jié)果
大吉大利,除夕吃雞!
先來看看,人們最喜歡吃的肉是什么呢?我們把食材中的肉類又做一次聚類,發(fā)現(xiàn)了如下事實(shí):
可以看得出,雞肉是除夕餐桌上不可撼動(dòng)的存在,第二名豬肉的份額也不錯(cuò),達(dá)到了18%,其次是魚肉和蝦。
似乎在多數(shù)中國人的印象里,豬肉才是除夕餐桌上的霸王,畢竟是豬年嘛。但是,就算加上其他類的中的排骨,五花肉等等,豬肉也打不贏雞肉。
果然,大吉大利,還是得吃雞!
蘿卜香菜,各有所愛!
肉類看完了,那么除夕夜,中國人對(duì)于蔬菜的選擇又是怎樣的呢?
第一名,蘿卜,小人參的稱呼不是白得的。白蘿卜、胡蘿卜,好存放又百搭,必須是冬天中國人餐桌上常見菜式,而且領(lǐng)先優(yōu)勢明顯,比第二名玉米高了13個(gè)百分點(diǎn)。
玉米排名第二,畢竟像玉米地瓜球這樣的甜點(diǎn)也逐漸走向了餐桌。
讓很多人又愛又恨的“香菜”也名列前茅,不吃香菜的同學(xué)們可能要大跌眼鏡了。
鹽、蔥、姜是中國人最愛
再來看看調(diào)味料。
雖然對(duì)于豆腐腦的南北咸甜之爭一直沒有答案,但是到了大菜上,顯然,中國人還是好咸口。
通過對(duì)調(diào)味料的聚類分析,我們可以看出,最受歡迎的調(diào)味品還是鹽。其次是蔥,姜。中國人對(duì)于提“味”的執(zhí)念真的很深了。
(PS:同類詞已經(jīng)合并,例如糖和白糖,都算做糖。)
而其他材料,包括八角、香葉、桂皮這些比較小眾了一些,用的也比較少,加起來一共占比10%。
一切“適量”
中國文化的“中庸之道”在年夜飯的菜譜中也體現(xiàn)的淋漓盡致。在描述調(diào)味料用量的時(shí)候,“適量”以超出第二名7倍的提及量,妥妥兒的排名第一。
雖然這個(gè)描述每次我看到都很頭疼,適量到底是多少?這可能是困擾萬千家庭的大難題。
“炒”它!
另一個(gè)比較好玩的數(shù)據(jù)是年夜飯最常用的烹飪技法。
文摘菌統(tǒng)計(jì)發(fā)現(xiàn),年夜飯菜譜里接近20%的菜,都是用炒的方式烹飪的,而炒相對(duì)于燉和煮來說,所用的時(shí)間還是比較少的。
現(xiàn)在快節(jié)奏的生活方式,最直接的反映在了做飯上面。
排名第二的分別是拌和煮。嗯,這個(gè)統(tǒng)計(jì)結(jié)果也還算合理,畢竟一桌豐盛的年夜飯,怎么能少的了涼拌黃瓜、拌土豆絲、拌三絲這些涼菜。
中國菜的技藝復(fù)雜,煎炒炸蒸燜煮燒,“千奇百怪”。還有許多叫不上名字的做法已經(jīng)占比達(dá)到了16%。
最有年味的菜原來是它!
好了,分析完食材原料烹飪技法,現(xiàn)在是時(shí)候完全按照分析結(jié)果,來杜撰一道最富有年味的菜了:
嫩雞半只,適量胡蘿卜,香菜和蔥和蒜,生姜以及適量的醬油,鹽和醋。然后少量的八角,花椒,桂皮。
雞冼凈切塊,加料酒腌制備用。將蘿卜切好,鍋中放油,倒入腌好的雞塊,加八角,花椒,桂皮炒至雞肉變色后,有香味出來時(shí),加醬油調(diào)色,盛出備用。
鍋中留油,放蔥、姜、紅辣椒爆香,再放入蘿卜片翻炒片刻,倒入炒好的雞塊,再加入鹽。
最后放入蒜再倒放調(diào)好的水淀粉,再略炒幾分鐘,加點(diǎn)醬油調(diào)色,加味精調(diào)味裝盤即可。
炒出來可能是這個(gè)樣子:
準(zhǔn)備上桌。


-
傳奇歲月
-
原始傳奇
-
斗羅大陸(我唐三認(rèn)可0.1折)
-
妖神記之巔峰對(duì)決
-
無雙戰(zhàn)車(悟空沉默)
-
深淵契約
-
貓狩紀(jì)0.1折
-
靈劍仙師(斗破蒼穹)
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論