發表文章

Blogger 中使用 $\LaTeX$ 來排版

簡介 $\LaTeX$ 向來的數學式子的排版上十分的強悍。 如果文章中有許多數學式子的話,那麼用 $\LaTeX$ 排版的結果可說是賞心悅目。 即使現在 Word 已經針對數學式子的排版做了許多的改善,我還是覺得 $\LaTeX$ 的排版結果略勝一籌。 如果要在 Blogger 上使用 $\LaTeX$ 來排數學式的話,那就要使用 MathJax 這個套件了。 底下是一個複雜數學式呈現的例子。 $$ \begin{equation}     \label{equ:ema}     \mbox{EMA}(k)_t = \left\{     \begin{array}{ll}          p_t  &  \mbox{if } k=1, \\          \frac{2}{k+1} \times p_t + \frac{k-1}{k+1} \times \mbox{EMA}(k-1)_{t-1} &\mbox{if } k>1.     \end{array}     \right. \end{equation} $$ 使用方式 如果想要在行內呈現數學式的話,就用 \$...\$ 將數學符號包住即可。 例如 $\frac{x^2}{e^{-x}}$。 如果想要將數學式子以單行的方式展示,如上面的 Equ (1) 的話,請用 \$\$...\$\$ 將數學式包住。 安裝方式 安裝方式網路上很多,列三個網址讓大家參考。 我是參考 [1] 來安裝的。而 [3] 是解釋得最完整的文章。 [1]  用 MathJax 顯示數學符號-以 Blogger 為例 [2]  Blogger 使用 MathJax 函式庫顯示 Latex 語法 [3]  使用 MathJax 把 LaTeX 或 MathML 數學式子放進網頁

Pandas 的 groupby 語法

圖片
簡介 Groupby 是 Pandas 中的一個很強大的操作方法。 它可以將資料「分組」,之後在分組的資料上做運算,然後再將運算的結果組合起來。 舉例而言,老師想看一年級中,不同班級的「數學」以及「英文」成績的平均值 (依班級分組,在分組中做平均值運算)。 國家想統計不同都市中收入的中位數 (依都市分組,在分組中取中位數),都可以使用 groupby 運算達成。 一般來說,如果資料中有「類別變數」出現,那通常就會有 groupby 的需求。 類別變數例如:性別 (男/女),班級 (1A/1B/1C),等級 (A/B/C),洲 (亞洲/非洲/美洲),膚色 (黑/白/黃)…等。

Pandas 的學習資源整理

圖片
這篇文章收集了一些我學習 Pandas 中所參考到的學習資源,會不定時的更新。 2019/9/6 更新 data school 的 Learn a new pandas trick every day 文章 (見網站一節)。

Pandas 的 value_counts 方法

圖片
簡介 value_counts() 是 Pandas series 中很有用的方法。 它可以取得 series 中每個唯一值的出現頻率,而且還可後讓頻率以百分比的方式展示。 這篇文章說明了 value_counts() 函式的使用方式。

如何使用 Kaggle 的教學

圖片
簡介 Kaggle 是一個資料科學的相關網站,依 維基百科 的說明,它在 2011 年成立,並在 2017 年被 Google 收購 。 如果想要學習資料分析/AI 的相關實務技巧,Kaggle 絕對是我們要常常來拜訪的網站。Kaggle 提供了許多資料集讓我們分析,還有眾多資料分析家所提供的教學文件,省下許多摸索的時間。 另外,Kaggle 也時常舉辦資料分析的競賽 (相關文章,見 這兒 ,及 這兒 ),參與競賽的成績也有助於日後的求職,另外,競賽過程中對實務技術的磨練,也是有大大的幫助的。 既然是一個提供資料分析,人工智慧應用相關的網站,那麼上面有教學資源也就不足為齊了。 這篇文章著重說明如何使用 Kaggle 網站所提供的課程,幫助我們提升資料分析的實務技巧。

由 Pandas 的 DataFrame 中取得資料

由 Pandas 的 DataFrame 中取得資料 ¶ 這篇文章參考了 Pandas 的官方教學文件 「10分鐘短教學」 ,由其中截取 data selection 的部分的內容。 DataFrame 是 Pandas 中儲存 2 維表格的資料結構。我們可以將它視為類似 Excel 的試算表,或是關聯式資料庫中的一個表格。 底下我使用 Pandas 將這個 csv 讀入。 這個表格的 csv 可以由 這兒 下載。 In [2]: import pandas as pd student = pd . read_csv ( 'student.csv' , index_col = 0 ) student Out[2]: Name height weight sex bdate city major s1234567 Peter 175.0 70.45 1 1980/4/30 Tainan CSIE e1234567 Mary 163.0 55.00 2 1981/12/21 Taipei EE f1357689 John 180.4 80.30 1 1980/5/30 Tainan Stat e1374659 Keven 182.5 77.60 1 1980/11/19 Taipei EE s7758347