データサイエンティストの学習に行ってきました。
実施内容はRapidMinerを用いた需要予測でした。
RapidMiner以外にも、以下のデータサイエンティスト用のシステムがあるようです。
システム名 | 会社 |
RapidMiner | 株式会社KSKアナリティクス |
MATLAB | MathWorks |
Amazon SageMaker | アマゾン ウェブ サービス ジャパン株式会社 |
DataRobot | DateRobot株式会社 |
Cloud AutoML | グーグル合同会社 |
Google Cloud machine Learning Engine | グーグル合同会社 |
Amzon Macine Lerarning | アマゾン ウェブ サービス ジャパン株式会社 |
Azuru Machine Learning | 日本マイクロソフト株式会社 |
AI-Plant Bomboo | 株式会社アビスト |
IBM Watson Machine Learning | 日本アイ・ビー・エム株式会社 |
今回、利用したのはRapidMinerで、講師によると試用版を含め、コスト的に感がえると、試すレベルではRapidMinerが良いとのお話でした。機能的には、他の製品が優れている点も多いとのお話でした。
課題は2つ。
①成果物の過去の需要が分かっていて、12か月先までの卸売数量の予測を行う。
②ベルギーの家屋の住居の家電製品において、気象データと住居内に設置されたセンサーの値から電力使用量を予測する。
以下のもモデルで、予測検討を行いました。
①は、ARIMA(時系列モデル)
②は、CRISP-DM(相関行列)
正直な感想としては、需要予測はなかなか難しいという印象です。特に、様々なパラメーターに影響を与えるモデルでは、その相関を見つけ出すのも大変だし、複数のパラメータが絡んでいる場合にパラメータ等の設定は困難であるという印象です。
これをベースにデータサイエンティストが頑張っているとすると、とても大変な仕事だという印象です。
①の簡単な需要モデルでも、明確にトレンド減少しており、季節変動のある需要のピーク値を言い当てるのは、パラメータを複雑に操作せざるを得なく、困難な印象を受けました、
②はデータが多すぎて、ども数値と相関関係があるのかも判断せねばならないので、とても大変な印象を受けました。(研修ではストリーが出来ているので、上手くいきますが。)
【活用場面】
活用場面としては、ある管内(〇〇電力ブロック)の年間で最も需要が上昇する時間を言い当て、そこの需要を蓄電池などで下げ、電力契約料金を減らすというオペレーションを考えましたが、簡単にはいかないだろと思いましたが、やってみると面白いという感想を持ちました。
いずれにしても、皆がデータに基づき、施策を行っていく時代が来ると思うので、理解を深めていこうと思います。
マンツーマンなので確実に英語力アップ!オンライン英会話の【GLOBAL CROWN】