【優良課程】「社群媒體分析」不藏私!讓你透過文字內容看懂每個人!

想知道Dcard和PTT的鄉民對於奧運賽事的關注議題嗎? 想知道不同媒體對於台灣疫苗取得的立場嗎? 由中山管院資管系黃三益老師所開設的「社群媒體分析」課程,將教你如何擷取、處理和分析文字資料,並讓你學會分析社群網路資料,並且顧及到資料分析的倫理和應用效益。

如今是社群媒體當道的時代,人人至少擁有一個社群媒體帳號,且每日在社群媒體上瀏覽資訊與互動的頻率高,進而出現大量社群媒體資料,例如社群貼文內容或是留言等,因此培養會使用人工智慧技術,以分析社群媒體資料的數位創新人才,將是未來趨勢。本課程主要講授文字和網絡分析的技術,並鼓勵同學們應用其來探討社會、政治和商業運作等議題,藉此洞察出生活中的特定現象,同時增進公民意識。

黃三益老師詢問同學們的課堂近況

課程特色之一是介紹「中山文字分析平台」,透過平台,同學們可自行上傳數據資料集,也能對聯合時報、蘋果日報、中國時報、東森、PTT討論板、Dcard看板等新聞來源進行篩選,而針對蒐集到的內容,平台亦提供斷詞斷句、標注與資料視覺化等功能。另外,該課程也帶大家認識「文字分析工作流程系統(TMWS)」,此工具不僅減少重複開發的時間,其模組化介面也降低文字分析的技術門檻,讓尚不會coding的同學能輕鬆上手,藉此達到輔助學習的效果。當然要做比較細緻的分析,寫程式還是免不了的,本課程深入的教導使用R語言(將來也會有Python)來進行文字和網路資料的處理和分析。

黃三益老師初步介紹「文字分析工作流程系統(TMWS)」

關於期中報告,各組可自訂主題,並善用所學,進行情緒分析、詞彙相關性分析與文字雲製作等,嘗試從中發現insight。其中有組別研究PTT板上「警察」相關文章之詞彙關係,觀察到特定事件(黑衣人闖入派出所、女師控告不當盤查等)發生時,相關字詞的討論熱度會急速上升;另一組則探討核電議題,鎖定含有「核電」、「核能」、「反核」與「核廢料」等詞彙的文章進行剖析,提出不同主題的PTT討論板有著截然不同的現象,例如同樣針對核電議題,相較於政黑板,八卦版易出現反諷、辱罵用詞;亦有組別探究「菜桃貴主題車站」事件,欲知曉此活動初衷明明是回饋粉絲,卻引發不少民眾的負面評價的原因。

人人一台筆電,賣力學習資料分析技術

最後,有組別認為奧斯卡典禮上往往存在兩種聲音,分別是「眾望所歸」與「眾矢之的」的獲獎人,故從Twitter蒐集資料,經由分析民眾對於不同得獎人的正負面情緒,得知普遍看法偏向何者。報告過程中,老師會提問題,同學們皆能對答如流,十分熟悉程式撰寫的各個環節,而值得一提的是,報告形式並非是一般的PPT簡報,而是運用線上發表系統RPubs,讓聽的人可清楚知道資料處理流程背後的程式碼。想要知道跟多修課同學的作品嗎? 請點擊這裡

報告組別依據特定主題所製作的文字雲

修習此堂課的林幸佳同學表示,大數據時代中擁有coding能力非常重要,然而這能力的養成並不輕鬆。新手往往在讀code的時候打退堂鼓,甚至還沒到了解整個資料處理流程就已經放棄。而這堂課主要是將自然語言處理流程到文件分類的各個處理模組化,利用圖形化(GUI) 取代寫Code,不但降低新手的門檻,且簡易操作更能快速了解整個處理流程。

報告組別介紹選擇此主題的動機與分析目的

此外,陳冠如同學也提到,在這日新月異的時代,隨著網路科技的進步,社群媒體逐漸興起。如今,我們不僅能從新聞上得到資訊,社群媒體的發達使我們多了一個管道可以接收消息、收集次級資料從而觀察民眾對於一件事情的看法。然而,以往想要視覺化圖像,就得先學會寫程式碼或是學習excel,但「文字分析工作流程系統(TMWS)」,顛覆了這樣的傳統。只要你學會文字探勘的基礎知識,動手操作workflow,即可產生所想要的視覺化圖像,簡直是不會coding的人的一大福音。