- 統一性のない大量のデータの収集と、より利用しやすいフォーマットへの変換

- ビジネス課題をデータ主導型の手法を用いて解決

- SAS、R、Pythonを含む幅広いプログラミング言語による作業-

- 統計情報の的確な理解（統計的検定と統計的分布を含む）

- 分析手法に関する最新動向の把握（機械学習、ディープ・ラーニング、テキスト・アナリティクスなど）

- IT部門および業務部門とのコミュニケーションとコラボレーション

- データに潜む秩序やパターンの発見と、ビジネスの最終利益に寄与する傾向の特定

非常に的確に色々書いてありますが、データというリソースを料理する人間というポイントは一貫してます。

要はデータという塊から意味のある価値を探し出す事ができるという事です。

競馬予想する人もある意味データサイエンティストって言えますね。

ある特定の法則を見つけ出す作業は後々の人工知能系の技術（機械学習、深層学習）のベースにもなりますよ。

ここまで来て、データサイエンティストになりたいかと自問自答したら活用する人間にはなりたいが、そこに収まりたくないなってのはあります。

この分野将来的には１００％人工知能にとられてしまいますからね・・・・

2018-09-28

Cousera Julia Scientific Programing コースのJulia コードは0.6　これを1.0.0に対応させる

julia

CouseraのJulia Scientific Programmingコースを受講中です。

www.coursera.org

前回に続きChapter 3を受講していますが、前回まで使ってたJuliaBoxをやめてデスクトップにJupyter Note Book を入れて学習開始です。

Julia v0.6.1のインストールとJupyter Notebookで使うまで

上記はバージョン0.6.1用ですが、現行の1.0でもバージョン指定を変えればOKです。

今回はplotting=作図という事で簡単なグラフ作成です。

サンプルを開いて、簡単な作業をしようとした所

f:id:gpstandard:20180927223312p:plain

となり、そもそもPkg importとPlotsが無いという事でaddする事に

f:id:gpstandard:20180927223237p:plain

無事色々インストールして課題をと思ったら・・・・

ここで初めて、このCouseraのコースがJulia 0.6時代の物ということに気づく。

# Setting up a custom stylesheet in IJulia
# New in 0.6
file = open("style.css") # A .css file in the same folder as this notebook file
styl = readstring(file) # Read the file
HTML("$styl") # Output as HTML

この中のreadstringが無いと言われ、検索するとdeprecatedという結果に

f:id:gpstandard:20180928021601p:plain

今の１．０系ではこういう書き方。

# Setting up a custom stylesheet in IJulia
# New in 1.0.0
file = open("style.css") # A .css file in the same folder as this notebook file
styl = read(file,String) # Read the file
HTML("$styl") # Output as HTML

無事これでスタイルがあたった。

ほう・・・・・・・

という事は・・・・・

冒頭で使わない予定の JuliaBoxにログインしてみると

f:id:gpstandard:20180928021848p:plain

やっぱり・・・・２つバージョンが使えるようになってる。

残念ながら、自分のデスクトップには1.0.0しか入ってません。

そして続けて

# New in 0.6
tempvar = Array{Any}(4)
fill!(tempvar, "hello ... word")

ここも

# New in 1.0.0
tempvar = Array{Any}(undef,4)
fill!(tempvar, "hello ... word")

こういう書き方、ほう・・・・undef・・・・

これは軽く学習に障害がありますな・・・

Julia 1.0.0のリリースが２０１８年の８月なので、これはいたしかたがないですね・・・

それこそPythonの２系と３系ぐらいの言語仕様の変更があるのかぁ・・・・

0.6で学習を進めてもいいですが、まだ初めたばかりだし1.0で進めて細かな違いに気づくのも面白くはありますが・・・・

一旦ここは考えます。

2018-09-25

JuriaでJupyter Note bookを利用する現実的なデータ分析の学習初め、 SIRモデル&Plotsでグラフ作成

julia cousera

CouseraのJulia Scientific Programmingコースを受講中です。

www.coursera.org

今日はChapter 3からスタートです。

Week3_1-SIRmodels

今回のNote bookの利用にはSIRモデルが使用されます。

SIRモデル - Wikipedia

SIRモデルは、感染症の流行過程を記述するモデル方程式らしいです。

コースの説明を英語で見ていってもいいですが、wikiで理解するでもいいでしょう。

微分の理解があればそれぞれ表を元に描かれたのS,I,Rの関係を数式にしている意味合いも理解できました。

また、

βは感染率 = lambda

γは回復（隔離）= gam

で定義され、dtも設定されている事を見れば、今回のグラフの関数の理解は大体できました。

今回利用されているPlotsというパッケージについては下記が参考になりました。

Plots/GR: グラフ package のおすすめ · julia について

今回登場してませんが、３次元グラフとかソソりますねｗ

次回は3-2の部分を取り組む予定です。

2018-09-24

Julia Boxの　Jupyter Note book にCousera教材をuploadする

julia

前回、第１章でJulia BoxやJupyter Note bookについて準備をしましたが、第２章からはデータ、統計に基づく基本操作などを習得する事ができるようです。

Julia Scientific Programming | Coursera

で、実際のコース内容を眺めるのもいいですが、同時にうごかせる教材が付属しています。

f:id:gpstandard:20180924221002p:plain

　　↑　こちらのResources部分から、今回使われている教材部分をダウンロードできます。

正直ビデオを見続けるより、下手したら教材触った方が早いかも・・・

Julia Boxへのアップロードはわかりやすいのですぐできると思います。

f:id:gpstandard:20180924221416p:plain

↑Uploadから適当に・・・・

と考えてしまいますが、まあ英語の勉強をしながらという意味もあるのでザッと眺めるにとどめました。

第２章ではCSVの読み込みやグラフ作成の為のデータ処理の定義、Loopなどの使い方が見てとれました。

Juliaもそうですが、改めてJupyter Note bookはわかりやすいツールだなと関心しますね。

2018-09-24

Julia Box と Jupyter Note book を使えるようにする。REPL環境で色々な式を試す。

julia

続けて

Julia Scientific Programming | Coursera

をやってるわけですが、最初の段階で Julia Boxの利用法の説明に入ります。

Julia Boxとは？

f:id:gpstandard:20180924193730p:plain

JuliaBox

簡単に言うとオンラインでJulia が利用できるサービスです。一応Freeプランもあります。

JuliaBox上でJupyter noteを使えます。

Jupyter noteとは？

f:id:gpstandard:20180924194320p:plain

ノートブックと呼ばれる形式で作成したプログラムを実行し、実行結果を記録しながら、データの分析作業を進めるためのツールです。

Pythonで利用した事はありますが、Juliaでもいけるんですね。

Julia v0.6.1のインストールとJupyter Notebookで使うまで

こちらを見るとローカルでのJupyter Note book利用もいけそうですね。

どうも今回の講座の第１章はこのJpyter Note bookの使い方のさわりで終わりのようです。

章の終わりもJulia REPLで終了ですし・・・・

このまま終わればJuliaも単なる計算機で終わってしまいます。

続きはまた後ほど

100day’s blog

思いついた事や、プログラミングの毎日の作業工程を短めにまとめてます。

とりあえず実行環境だけ準備　Erlang,Elixir,Scala,Goのインストールと各CLIツール等の確認

# Erlangの install

# Elixir install

# Sala

結論

coursera Julia Scientific Programming第４章で全てを一旦終了。　良かった点、反省点、今後。

１　（反省）言語バージョンをちゃんと確認しましょう。

２　（良かった）学習しながらツイートやブログを活用しましょう。

３　（反省点）これから何をしたいかも考えておいた方がいいかも

データサイエンティストの仕事。　実データと法則と未来予想。 Cousera Julia Scientific Programming Chapter3の締めくくり

データサイエンティストって何？

Cousera Julia Scientific Programing コースのJulia コードは0.6　これを1.0.0に対応させる

JuriaでJupyter Note bookを利用する現実的なデータ分析の学習初め、 SIRモデル&Plotsでグラフ作成

Week3_1-SIRmodels

Julia Boxの　Jupyter Note book にCousera教材をuploadする

Julia Box と Jupyter Note book を使えるようにする。REPL環境で色々な式を試す。

Julia Boxとは？

Jupyter noteとは？

# Erlangの install

# Elixir install

# Sala

結論

１ （反省）言語バージョンをちゃんと確認しましょう。

２ （良かった）学習しながらツイートやブログを活用しましょう。

３ （反省点）これから何をしたいかも考えておいた方がいいかも

データサイエンティストって何？

Week3_1-SIRmodels

Julia Boxとは？

Jupyter noteとは？

１　（反省）言語バージョンをちゃんと確認しましょう。

２　（良かった）学習しながらツイートやブログを活用しましょう。

３　（反省点）これから何をしたいかも考えておいた方がいいかも