統計科学と現象の分析 -ビッグデータの活用法-

単位数 ナンバリングコード
2 DIF319
教員名 甫喜本 司
専門 統計科学、データ科学、統計数理
出身校等 東京工業大学 大学院 理工学研究科 修士課程修了
現職 北海道情報大学 情報メディア学部 教授
授業形態
前期インターネットメディア授業・後期インターネットメディア授業・後期IPメディア授業
授業範囲
メディア授業内容すべて
試験範囲
授業範囲すべて
(持ち込み許可物)IM授業は一切自由。IPメディア授業は、自筆ノート(印刷物の添付不可)、電卓(機能制限なし)
(試験に関する注意事項)IM授業の科目試験は、インターネット試験で実施します。          
科目の概要
本格的な「ビッグデータ」の時代である現代では、現象の特性やリスクを分析するために様々なデジタル情報を積極的に活用することが多くなりました。一見すると数値や文字の集合にしかみえないデータも、適切な方法を実践することで様々なメッセージを我々に伝えてくれます。本科目では、データから新たな知識を得るための方法を体系化したデータサイエンスの考え方について、計算機による実習を通して学びます。
授業における学修の到達目標
1. データの構造に応じて適切な処理や分析を計算機で実践できる
2. データ分析の方法について説明することができる
3. 現実の問題をデータに基づいて客観的に評価することができる
講義の方針・計画
データ解析系言語であるRを用いて、データから新しい知識を得る方法について学びます。実際のデータを分析する方法や評価する際の思考の過程を学んでノートを作成して下さい。試験ではノートの持ち込みを認めます。

第1回 :「ビッグデータ」時代におけるデータ科学
第2回 : R言語入門
第3回 : データの概観(1) 1次元データの可視化
第4回 : データの概観(2) 多次元データの可視化
第5回 : 確率的な分析 確率分布の推定と応用
第6回 : 関係性のモデル化(1) 散布図と相関
第7回 : 関係性のモデル化(2) 統計モデルとは何か
第8回 : 関係性のモデル化(3) 統計モデルの推定と予測
第9回 : 関係性のモデル化(4) 統計モデルの選択とAIC
第10回 : 関係性のモデル化(5) 2値データのモデル
第11回 : 時間変動の解析(1) 時系列データの相関
第12回 : 時間変動の解析(2) 周期の推定とスペクトル
第13回 : 時間変動の解析(3) 定常な時系列データのモデル化
第14回 : 時間変動の解析(4) 非定常な時系列データのモデル化
第15回 : 時間変動の解析(5) 周期性の強い非定常時系列データのモデル化
準備学習
(予習)R言語に関する文献やウェブサイトは国内外に多数あります。各回のタイトルを基に、内容を下調べして下さい。2時間
(復習)授業後に、ノートに従ってデータ解析の方法や考え方をまとめて下さい。2時間

R言語はフリーソフトであり、自宅のパソコンでも作業環境を容易に準備して
学習することが可能です。関心のある受講者は積極的に取り組んで下さい。
課題(試験やレポート等)に対するフィードバック方法
IM授業は、練習問題を解答すると、解答に応じたコメントを画面に表示する。
IPメディア授業は、授業中に課題を出す場合は、授業中に回答する。
成績評価の方法およびその基準
試験:100%
教科書
書 名: データサイエンス演習
著者名: 甫喜本 司
発行所: 学術図書出版社
ISBN:978-4-7806-0937-0
参考書
CRAN (The Comprehensive R Archive Network)
https://cran.r-project.org/index.html (日本国内にミラーサイトあり)

書 名: データサイエンス演習(ISBN978-4-7806-0937-0)
著者名: 甫喜本 司
発行所: 学術図書出版社
その他
なし
試験期間
シラバス検索画面トップページ(https://syllabus-tsushin.do-johodai.ac.jp/)下部の「2022科目試験時間割」を参照
学習プリント
教職科目
関連受講科目
なし
担当教員の実務経験
企業の研究所において, データに基づく投資技術の開発に携わりました。本講義では, データサイエンスの基本的な枠組みについて紹介します。データ分析に関する方法を紹介することとあわせて, 企業のデータ分析の現場ではどのようなことが行われているかという実際面についても紹介できれば,と考えています。
レポート課題
過年度のレポート課題は表示できません。