少しでも参考になれば、スターして頂けると嬉しいです〜!
リンク: https://gci.t.u-tokyo.ac.jp/gci-2020-summer/
- 東京大学の松尾研究室が主催する東京大学グローバル消費インテリジェンス寄附講座(GCI2020Summer)というデータサイエンティストを育成する講座になります。
- 期間としては2020年4月下旬〜2020年8月下旬の約4ヶ月間
- 無料(神講座かよっっ!)
- 総勢500名
- 上位5%程度が優秀者として選ばれる( 優秀者はもれなく海外へ研修旅行付き>< )
- ネタバレ: 結局修了できたのは120名程度。つまり単位取得率はたったの25%。
この講座を通して、僕が学んできたことや思ったこと、コンペでの取り組みをまとめていきます。
- 参加する前はKaggleのチュートリアル的存在であるTitanicを提出したことがある(書いてるコードを理解したとは言ってない笑)
- 一度Qiitaにアヤメの分類について記事を書いた(リンクはコチラ)
- 初心者向けの講座(ではなかった。)ですが、数学的要素も多く、終始膨大な内容の講義やコンペにとても苦戦しました。
- Python,Numpy,Pandas,Matplotlibなどの基礎的な部分から、予測モデル作成、チューニング、特徴量エンジニアリングまで幅広く網羅していた。
- 一部の演習問題で発展的な問題も出てきていた。
- そんな発展的な問題を解くための使い方や知識を短期間で求められたので、時間を確保できない/そこそこの事前知識がないと、とても困難な講座であったと思う。
- Kaggleで一度開催されいたコンペや独自ルート(?)のデータが用いられた。
- 実力が拮抗している中でのクローズドなコンペだったので、とても闘争心メラメラで挑んでいた。
- つまり楽しかった!笑
- ニートに劣らないくらいの時間があったので、鬼のようなcommitが実って、すべてのコンペで入賞を果たすことが出来ました!!
- 本当に膨大な時間をこの講座対価に費やしました!この講座で1、2を争うんじゃないかってくらい時間を費やすくらい本気でやってました。生活 < GCI みたいな。笑
- そして優秀者に選ばれた時に、【目標を設定し、やりきるという一連の行動を本気でやりきれた】という実感が湧いてきて、生涯忘れられない期間になったんじゃないかと思います。
以下リンクにてそれぞれのコンペの解法や、過程などを詳しく掲載しております。
- コースの概要
- 大量のデータを自由自在に解析・分析し、隠れた関係性を発見する。そんなスキルを身につけた「データサイエンティスト」に対する需要は、工学分野だけならず、医療・経済・経営・ライフサイエンスなど非常に多くの分野で高まる一方。
- あらゆる分野で武器になるデータの解析・分析スキルのコアとなる機械学習およびビッグデータを扱う技術、分析結果を効果的に可視化する技術の基盤を網羅的に身につけ、一人前のデータサイエンティストとして活躍する入り口に立つことを目指す。
- 特徴
- コンペ(期間中にKaggle形式のコンペを3回実施)
- 講義はオンラインによって行われる。基本的に録画したものを公開する予定。回によっては18:30ごろから2時間程度ライブ配信を行う可能性がある。
- 東京大学に所属する学生のみに限らず、学生の方を広く募集。 -本講座での単位認定はない。
- 受講の仕組み
- 講義
- 1~2Chapterずつオンライン講義を行い、簡易な宿題を出題します
- データ分析コンペを開催します
- 講義の資料は事前に公開されます
- 修了証
- 全Chapterでの課題と最終課題をクリアされた方には講座修了証を発行します
- 修了者へのベネフィット
- 修了者にクローズドなコミュニティを作り、様々な機会をご案内していきます
- データサイエンス関連のイベント・勉強会や研究プロジェクトへの参加