這一周,學習時間有點少,擠了10個小時出來,并且學習效果還不怎么好,主要在周六和周天完成。
學習的內容有:
- P4的數據集探索項目
- P3的線性代數項目修改
P4的數據集探索項目
P4的項目是選擇泰坦尼克號的數據集,然后直接分析了性別、年齡和船艙等級對生存率的影響。
分析之前,我以為男性、青年(20到30歲)的生存率更高,而船艙等級則沒有什么概率。在經過一波數據分析之后,很是意料之外,發現原來兒童、女性、頭等艙才是生存率更高的一類。這是為什么?
然后查了資料才知道,這是因為在泰坦尼克號要沉沒的時候,船上的口號是先讓婦孺坐上救生艇,這才造成兒童、女性的生存率更高(汗,原諒我看泰坦尼克號的時候還是個小孩,啥都不記得了)。又因為,頭等艙相對來說救生艇更多,所以生存率更高。
在做這個項目的時候,發現自己Pandas很多功能還是不太會用,連知道的groupby和圖形顯示都沒用好。還有在分析的時候不全面,導致最終項目被打回來了,然后重新花了兩個小時改了一遍,重新提交了項目。
P3的線性代數項目
這個項目應該是上上周就打回來了,因為我拖著,然后一直沒鳥它。最終,這周六不得不面對它了,重新再做題的時候,發現有些知識又不太記得了。不過,好在有項目打回來的反饋,照著上面的弄就行了。
其中,花時間最久的是最后一道線性回歸的代碼,當時我是直接用前面的結論來作為條件,然后使用解二元一次方程組搞定了。但是,打回來說不行,需要使用前面造好的輪子做,好吧,那我就照著這個思路來做。代碼一刪,改起來,OMG,為啥報錯?稍微一改,發現整個代碼報了很多錯,最后,代碼看來看起,測來測去,然后發現是數據結構不對,我是產生了一維數組,而需要的是二維數組?為什么要二維數組?好吧,看了許久許久,得三個小時吧,折騰來折騰去,然后看看題目,模擬前面題目中的數據結構放進去,嗨,居然通了,為何?再仔細一看,原來前面的題目條件如下:
這個X和Y都是二維數組,原來是題目沒看懂,后來再一想,唐曉陽前面也碰到過這個問題。
總結與計劃
總結:這一周一直在整抓數據,然后學習時間比較少,學習進度緩慢。本來是打算直接把P5搞定,然后直接學習吳恩達的深度學習課程。還有,上周說12點前睡覺的,然后沒有一天做得到;然后,這一周說要寫篇博客,看著時間,現在也不行了。
計劃:
- 吳恩達深度學習課程
- P5的課程
- 博客兩篇(補上這一周的)