はじめに
はじめまして。社会人になってからデータ分析系の仕事をやっており、データ分析を10年近くやっています。職種名は「データサイエンティスト」「アナリスト」「コンサルタント」など、職種名が微妙に変わりつつもずっとデータ分析の仕事をしています。
私が今取得している資格は以下のようなものです。他にもいくつかありますが、主要なものだけ記載します。たまに機械学習のコンペに参加しており、世界的なコンペサイトKaggle、および日本コンペサイトSIGNATEでExpertランクです。なんだかんだで結構勉強したっぽいです。
- Kaggle Expert
- SIGNATE Expert
- 統計検定準1級(2級、3級も以前取得)
- 応用情報技術者
- AWS SAA、AWS CLF
- TOEIC800超
データサイエンティストの面白み
まず、データサイエンティストの仕事は非常に面白いと思います。数学的なことを考えたり、処理の高速化を考える必要があるため、頭をたくさん使いますが、その分難しさと解決した時の面白さがあります。
データサイエンティストの難しさ
一方で難しい面も多いです。分析の専門性を持っているので「とりあえず分析してよ的なふわっとした依頼」や「クラウド等を活用したシステム/自動化環境の構築」を任せられることも多いです。そのためコンサルタントのように業務を整理する能力やエンジニアのような能力も必要です。
もちろん何でもできることが良いとは思いませんが、非データサイエンティスト/エンジニア等からは「何でも屋」のように見えてしまうようです。
そのため、統計やAIの知識だけでは足りないことも多く、システム・クラウド・BIの知識も合わせて補完していく必要が常にあります。
必要なスキル①ビジネス力
私が思うにこちらが最も重要な能力だと思われます。分析は必ずビジネスに沿ったものを行う必要があり、どんな分析をすると利益を上げられるか、コストを下げられるかということを常に頭に入れておく必要があります。
しかしデータサイエンスの界隈にいると、データサイエンス力やエンジニアリング力に特化している方も多く、顧客や協業者のビジネスを理解し分析することにつなげることが苦手な方も多くいらっしゃいます。
データサイエンス界隈で上に行きたい方はビジネス力をつけることを常に頭に入れておく必要があるんじゃないかなと思います。
必要なスキル②データサイエンス力
私は最初にプログラミングスクールに通い、python等の言語を習得した後、様々な書籍を読み、その後実務や機械学習コンペサイトで力をつけていきました。流れは以下のような感じです。
- プログラミングスクールに通いpython、VBAなどを習得
- 書籍を読みながら資格などを取得し知識を広げる
- 実務で使用する(私は幸いにも新卒で入った部署にて統計・機械学習を実装する機会があったため、)
- KaggleやSIGNATEを実施しながら能力向上
必要なスキル③エンジニアリング力
プログラミングも重要なのですが、データ分析にはデータベースやクラウドの知識も必要となってきます。
実際に使った技術は下記の通りです。
- プログラム
- python
- R
- SQL
- HTML/CSS(スクレイピングでよく使用する)
- VBA
- JavaScript(趣味の範囲)
- クラウド
- AWS
- Azure
- GCP
- Databricks(趣味の範囲)
- ノーコードソフト
- DataRobot
- Dataiku
- BIツール
- POWER BI
- Tableau
- Looker
- 管理ツール関連
- GitHub
- Backlog
- Redmine
- Jira
- Notion
他にも色々ある気もしますがこんなところです。こう見ると、データサイエンティストはエンジニアに近いレベルで様々なツールを使いこなす必要があります。実際に現場に入るとこのようなツールを使う機会が来ると思いますが、プログラムおよびクラウドは近年ではほぼ必須だと思います。
どうやってデータサイエンティストになっていくか
じゃあ、実際どうやってデータサイエンティストになっていくか、これは非常に難しい課題だと思います。ただ、一つ言えることとしては、どの会社も実務レベルで通用する人材を欲しているということです。
pythonができる、統計ができるではなく、ビジネス実装することが常に求められています。じゃあそのためにどんなことをするといいかというと私は下記のようなことが必要だと考えます。
メンター等をつけながらも実際に通用するスキルを学習する
実際に学習する際、書籍でも学習はできるのですが、実際その程度だと実務に適用するレベルの方法を学ぶことができない可能性が高いです。
- 線形分析は知っているけど、多重共線性を知らない
- LightGBMという高精度を出す機械学習モデルを知っているけど、中身でどう動いているか知らない
- 当たり前のように過学習モデルを作ってしまう
このような間違いを起こす可能性があります。モチベーションを保つという意味でもメンターを持ったりプログラミングスクールに通うのもおススメです。現在はAIに特化したプログラミングスクールもあります。
AIを学ぶならアイデミープレミアム![](https://www18.a8.net/0.gif?a8mat=3YYISO+E2NWKY+4HUE+5YJRM)
どうにかして実務でAIなどを取り入れる
実際に実務でAIを使ったことあるかどうかはデータサイエンティストになるには非常に重要な部分となります。異動でも新規プロジェクトを立ち上げるでもなんでもいいですが、どうにかしてAIを実務で活用し、社内社外にアピールできる実績を作りましょう。
Kaggleなどの機械学習コンペサイトでスキルアップをする
Kaggleは実際にデータ分析をするのには非常に有用なサイトです。データ量も多く、複雑なことも多いため、実務に近い知識を得ることができます。もしこれらで入賞することができたら、データサイエンティストとしてのチャンスも大いに広がります。
まとめ
データサイエンティストは非常に幅広いスキルが必要です。一方で多くの企業がAI時代に向けて求めており、将来的には明るい職だと思います。もしデータサイエンティストになりたい方はこちらの記事が参考になれば幸いです。
コメント