最新消息‎ > ‎

<教學課程>文字資料探勘實作班

張貼者:2015年3月16日 上午2:22學會 中華R軟體
本會受財團法人資訊工業策進會數位教育研究所科技化服務中心邀請,於經濟部工業局主辦之104年度工業技術人才培訓計劃中,合作辦理 文字資料探勘實作班 課程

文字資料探勘(Text Mining)是從非結構化的文字中,萃取出有用的重要資訊或知識。它是一個相對年輕的學科,涉及資訊擷取(Information Retrieval)、資料探勘(Data Mining)、機器學習(Machine Learning)、統計學(Statistics)與電腦語言學(Computer Linguistics)等領域,也可以說是自然語言處理(Natural Language Processing)的應用。一般說來,自然語言處理的階段涵蓋:文件語料庫(Corpus)的建構、文件記號化(Tokenization)、語法分析(Lexical Analysis)、語意分析(Semantic Analysis)與相關概念的提取(Concept Extraction)等。傳統媒體與網路新媒體中大部分的資訊都是以文字儲存,因此,文字探勘技術被認為是有高度的潛在商業價值。

   資策會特別規劃「文字資料探勘實作」課程,本課程採用R或Python語言實作文字資料探勘案例,課程內容著重自然語言處理的統計分析基礎,以及資料探勘/機器學習方法的運用,以整合式開發環境RStudio/Spyder進行實機操作,幫助學員掌握開放源碼的文字資料探勘語言,有效完成企業文字資料的處理與分析工作,提昇個人與企業競爭優勢。


日期 : 104年03月28日、29日舉行
時間 : 09:30~16:30
Comments