發表文章

目前顯示的是 2019的文章

Pandas 的 groupby 語法

圖片
簡介 Groupby 是 Pandas 中的一個很強大的操作方法。 它可以將資料「分組」,之後在分組的資料上做運算,然後再將運算的結果組合起來。 舉例而言,老師想看一年級中,不同班級的「數學」以及「英文」成績的平均值 (依班級分組,在分組中做平均值運算)。 國家想統計不同都市中收入的中位數 (依都市分組,在分組中取中位數),都可以使用 groupby 運算達成。 一般來說,如果資料中有「類別變數」出現,那通常就會有 groupby 的需求。 類別變數例如:性別 (男/女),班級 (1A/1B/1C),等級 (A/B/C),洲 (亞洲/非洲/美洲),膚色 (黑/白/黃)…等。

Pandas 的學習資源整理

圖片
這篇文章收集了一些我學習 Pandas 中所參考到的學習資源,會不定時的更新。 2019/9/6 更新 data school 的 Learn a new pandas trick every day 文章 (見網站一節)。

Pandas 的 value_counts 方法

圖片
簡介 value_counts() 是 Pandas series 中很有用的方法。 它可以取得 series 中每個唯一值的出現頻率,而且還可後讓頻率以百分比的方式展示。 這篇文章說明了 value_counts() 函式的使用方式。

如何使用 Kaggle 的教學

圖片
簡介 Kaggle 是一個資料科學的相關網站,依 維基百科 的說明,它在 2011 年成立,並在 2017 年被 Google 收購 。 如果想要學習資料分析/AI 的相關實務技巧,Kaggle 絕對是我們要常常來拜訪的網站。Kaggle 提供了許多資料集讓我們分析,還有眾多資料分析家所提供的教學文件,省下許多摸索的時間。 另外,Kaggle 也時常舉辦資料分析的競賽 (相關文章,見 這兒 ,及 這兒 ),參與競賽的成績也有助於日後的求職,另外,競賽過程中對實務技術的磨練,也是有大大的幫助的。 既然是一個提供資料分析,人工智慧應用相關的網站,那麼上面有教學資源也就不足為齊了。 這篇文章著重說明如何使用 Kaggle 網站所提供的課程,幫助我們提升資料分析的實務技巧。