100day’s blog

思いついた事や、プログラミングの毎日の作業工程を短めにまとめてます。

データサイエンティストの仕事。 実データと法則と未来予想。 Cousera Julia Scientific Programming Chapter3の締めくくり

www.coursera.org

チャプター3を無事終了です。データの型や、実データからの各値の調整などなど、ここまで一通りやればJupyter Note Bookを使ってのデータ分析の触り部分が理解できます。

 

ここまで来て、改めてデータサイエンティストって何だろうなーって考えてしまいました。

 

データサイエンティストって何?

www.sas.com

  • - 統一性のない大量のデータの収集と、より利用しやすいフォーマットへの変換
  • - ビジネス課題をデータ主導型の手法を用いて解決
  • - SAS、R、Pythonを含む幅広いプログラミング言語による作業- 
  • - 統計情報の的確な理解(統計的検定と統計的分布を含む)
  • - 分析手法に関する最新動向の把握(機械学習、ディープ・ラーニング、テキスト・アナリティクスなど)
  • - IT部門および業務部門とのコミュニケーションとコラボレーション
  • - データに潜む秩序やパターンの発見と、ビジネスの最終利益に寄与する傾向の特定

 

 非常に的確に色々書いてありますが、データというリソースを料理する人間というポイントは一貫してます。

 

要はデータという塊から意味のある価値を探し出す事ができるという事です。

 

競馬予想する人もある意味データサイエンティストって言えますね。

 

ある特定の法則を見つけ出す作業は後々の人工知能系の技術(機械学習、深層学習)のベースにもなりますよ。

 

ここまで来て、データサイエンティストになりたいかと自問自答したら活用する人間にはなりたいが、そこに収まりたくないなってのはあります。

この分野将来的には100%人工知能にとられてしまいますからね・・・・