實驗設計
本研究以投資者經驗為基礎,結合文字探勘技術,透過支援向量機建立航運類股漲跌趨勢預測模型,希望藉此改進過去傳統以新聞消息面預測股價趨勢的準確率。
- 研究假設
在過去以新聞消息面預測股價漲跌的相關研究中,各種可能影響股價走勢的因素,皆透過文字探勘技術建立股價趨勢模型。本研究假設在原始消息面模型中加入人為主觀的投資者經驗,能提昇原始模型的預測準確率。
- 評估方式
本實驗有一份訓練集和一份測試集以驗證模型的正確率,以傳統消息面所建立的原始模型為對照組,加入投資者經驗所建立之類股漲跌趨勢模型為實驗組,預期有投資者主觀因子結合傳統消息面所建立之模型,預測準確度較高。
- 資料處理
本研究針對96年7月1日~97年6月30日此期間所有航運類股之新聞進行篩選,針對重複之新聞、過短之新聞、不相關之新聞,進行剔除。
- 實驗說明
為驗證前面所述之研究問題與假設,本研究將具有投資者經驗的紙本問卷資料轉換成調整權重的依據,經過各種權重測試後,選出以回答選項極正面、正面、無法判定、負面、極負面,分別乘上9、7、5、3、1的調整權重值。而職業分類為金融相關領域工作者、上班族、非上班族三類別,分別乘上1.1、1、0.9之權重值,作為實驗的模型。
本研究在不同的新聞反應漲跌幅度下,預測類股股價漲跌趨勢模型之效果,過去研究股價趨勢的學者,對於漲跌幅度的定義不盡相同,每位投資者對於漲跌幅度的認定不一致,故本研究進行下列四個實驗,以挑選出漲跌幅度最佳的定義。並驗證不同新聞漲跌幅度對於分類結果之影響。
|