課題研究

株価の時系列データの解析

  • まず下のsampleコードをダウンロード(ファイル名をクリックしてスクリプトを表示→右上のダウンロードボタンで右クリック→対象をファイルに保存)してください.
  • このsampleコードでは,Yahoo Financeのwebサーバーから指定した株価のデータを自動的に読み込みます.しかし,京大内部のネットワーク(kuins3)からだとproxy経由でしか外部のwebサーバーにアクセス出来ないため,そのままでは正しく動作しません.以下の回避策をとってください.
  • メディアセンター演習室のPCを用いる場合
  • jupyter.batをダウンロード(右クリック→対象をファイルに保存)し,Stock_Analysis1.ipynbと同じフォルダに保存する.
  • コマンドプロンプトで上記のフォルダに移動し、
    jupyter.bat
    を実行してjupyterを起動,FilesメニューからStock_Analysis1.ipynbを開く.
  • インターネットに接続した個人のPC(Windows/Mac/Linux)を用いる場合
  • これまでどおりの方法でOKです.
  • Yahooのwebサーバーの仕様変更などにより,webサーバーにアクセス出来る場合でも自動での読み込みに失敗することがあります.そのような時は, yahoo_finance.zipをダウンロード(右クリック→対象をファイルに保存)し,解凍することでサンプルで使用している株価データをローカルファイルから読み込むことが可能です.解凍したファイルにない銘柄の株価データも,以下の手順で入手できます.
  • https://finance.yahoo.com/lookup にアクセス
  • Quote Lookup で目的の銘柄を検索し,その銘柄のページに移動する
  • "Historical Data"タブを開き,"Time Period"を"MAX"にして"Downloaded Data"をクリック

宿題 #7

  • sampleコードを改変し,自分が選んだ銘柄の株価について,以下の図を作成して提出せよ.また,それらの図からわかることを説明せよ.(多くの物理プロセスでは,変動する時系列データの分布は正規分布に従う.しかし,株価など人為的な要素の反映される時系列データでは必ずしも正規分布にはならない.そのような例は,例えばここで見ることが出来る.)
  • その株価の1日の変化量の分布(ヒストグラム)と,同じ平均・分散を持つガウス分布との比較
  • その株価の1日の変化量の自己相関関数
  • なじみのない内容に最後まで取り組んでもらい,負担に感じたところがあると思います.今回のILASセミナーでは,「プログラミング初学者に最少の時間でプログラミングのいろはを習得してもらう」ための模索として,IPython Notebook (Jupyter)という対話型のプログラミング環境の導入を試みました.世界的にユーザーが増加している原則無料のプログラミング環境で,2016年度後期からはメディアセンター演習室のPCにも標準でインストールされています.今後の参考のために,よりよい授業にするための改善点など,意見や感想を提出してください.(この部分は採点に用いない)

参考資料

  • 今回のILASの内容を含んだ英語のオンライン講義"Stochastic Processes: Data Analysis and Computer Simulation"が以下で公開されています. https://www.edx.org/school/kyotoux