期末雜感 & 生物資訊學之統計方法




        這學期的課程與事情終於都告一段落了,碩士班生活的1/3就這樣結束了,速度快得很不真實,不過或許這也是大多數人普遍的感覺吧? 記得剛進來時有學長跟我說碩士班的課程不像大學,不能有興趣的都去嘗試,不然會把自己搞得太累也會沒時間做研究。
我相當不以為意XD 到底甚麼叫做嘗試有興趣的課程啊?都是碩士班了,如果不能在進來之前學會過半所需的能力,那會來得及在時間期限前完成研究嗎? 如果還沒學齊,那不是就應該在有限時間內趕快去學習相關學識嗎?這時候有興趣的課程當然就會是你所需要的? 那怎麼還會有亂修課的問題,就算真的選了一堂八竿子打不著的課,自己把時間規畫好,能做完該做的事的話,為何要限制或建議別人不要選太多課?實在是太奇怪了,尤其是說話的人自己的課程表也沒讓我看出甚麼安排......學校居然還規定修課明細要給指導老師簽名,其道理著實令人想不透,難道真有老師會阻止學生去上他有興趣的課程?


        話說回來,這學期讓我最感到充實的莫過於「生物資訊統計法」這門課了。自從上上學期R語言入門後,透過資料查詢逐漸知道R語言在生物資訊與生態學領域早已是人人皆備的基本技能,看到的好的研究也有很多以此為工具。我原本認知的生物資訊學其實也主要是著重在DNA序列的比對與分析,當初看到在學校基資所的課程規劃中,有一部分還加入了蛋白質序列的分析,但那門課用的是Perl語言,跟我覺得R可以打天下的初衷稍微不符XD。這時剛好看到高老師開了這堂課~說是生物資訊學,其實更像是在上一堂資料科學的課。大數據趨勢與如何分析,再加上R語言的實作練習及各項程式邏輯的訓練,共同構成了第一次開設的這堂課。除了序列分析,生物資訊學還包含了很大一部分序列資料與性狀的關聯,難怪會被稱為「統計法」。找出性狀的頻率與發生是否跟序列的變異呈現顯著關係,透過這樣的基本原理去解析序列資料,並進一步統合到gene層級、pathway層級或整個基因網路。我把這堂課定義為「程式語言與分析邏輯訓練」,所以老師其實是在教你當個資料科學家,是門好課!當然老師也是個奇人吧我想。



留言