100day’s blog

思いついた事や、プログラミングの毎日の作業工程を短めにまとめてます。

Julia Box と Jupyter Note book を使えるようにする。REPL環境で色々な式を試す。

続けて

Julia Scientific Programming | Coursera

をやってるわけですが、最初の段階で Julia Boxの利用法の説明に入ります。

 

Julia Boxとは?

f:id:gpstandard:20180924193730p:plain

JuliaBox

簡単に言うとオンラインでJulia が利用できるサービスです。一応Freeプランもあります。

 

JuliaBox上でJupyter noteを使えます。

 

Jupyter noteとは?

f:id:gpstandard:20180924194320p:plain

ノートブックと呼ばれる形式で作成したプログラムを実行し、実行結果を記録しながら、データの分析作業を進めるためのツールです。

 

Pythonで利用した事はありますが、Juliaでもいけるんですね。

Julia v0.6.1のインストールとJupyter Notebookで使うまで

こちらを見るとローカルでのJupyter Note book利用もいけそうですね。

 

どうも今回の講座の第1章はこのJpyter Note bookの使い方のさわりで終わりのようです。

 

章の終わりもJulia REPLで終了ですし・・・・

 

このまま終わればJuliaも単なる計算機で終わってしまいます。

続きはまた後ほど

 

coursera Julia Scientific Programming 話題のJuliaをオンラインで学ぶ 準備の準備。講師の先生らを確認

Couseraで発見したコースを受講

www.coursera.org

 

さっそく始めればいいわけですが、講師の先生方の略歴が気になる。

 

一人はJuan h Klopperさん。

www.coursera.org

お医者さんらしく、githubでもデータサイエンス系のリポジトリ多数。

github.com

 

そしてもう一人は数学者のHenri Laurieさん

www.coursera.org

 

昔の日本の数学の先生とかお医者さんがプログラミングするイメージはないんですが、最近では当たり前なんですかね?

大学の教授あたりならやるんでしょうが。

 

 

 

macにjuliaをインストール。PATHを通す。

juliaを煽る記事を最近見かける為、とりあえず自分のmacで動くようにしておく。

 

f:id:gpstandard:20180924145314p:plain

キータの記事も17ページほどあり、ボリュームも増えてきたな・・・と

 

とりあえずインストール

下記からdmgをダウンロード

Julia Downloads

 

パスが通ってないのでターミナルから

export PATH=$PATH:/Applications/Julia-1.0.app/Contents/Resources/julia/bin

 

f:id:gpstandard:20180924145129p:plain

です。

 

The Julia Language

 

ドキュメントを見ながら軽くCLI上で確認。

当たり前ですが、最初はどの言語も印象は同じだな・・・・

使い込んでいくかはこれからですね。

 

「はじめてのHadoop」その1 意味をわからずともwordcountをmacでやってみる。

ビッグデータと向き合わずに小さなシステム開発を幸せにおくりましたとさ・・・・

ちゃんんちゃん・・・

 

とは、いかない現実を突きつけられそう。

 

Apache Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークであり、Javaで書かれている。 Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。

 

- ビッグデータを扱える分散処理技術

- Apache HadoopOSS

- googleの検索などをモチーフにしてる

 

とも他で見た記憶がある。

 

qiita.com

 

この中で

分散ファイルシステムHDFSは複数のコンピュータのローカルディスクを、一つのストレージのように扱います。ローカルディスクを扱うのと同じ方法で分散ストレージを使えるので、特にユーザーが意識する事はありません。

の部分はwordcountのチュートリアルをやってみれば実感できる。

MapReduceとか気になる言葉はあるが、とりあえず手元のPCで実行して確認してみたい。

 

macでwordcount

qiita.com

 

基本こちらを参考にしてみたが、若干わかりにくい部分もあるので

qiita.com

こちらも参考にした。

 

疑似分散まではやらなかった。以下メモ

 

下記にインストールされた状況、特にパスを設定せずそのディレクトリで作業してみた。

 

/usr/local/cellar/hadoop/3.1.0

 

cd /usr/local/cellar/hadoop/3.1.0

 

bin/hadoop fs -mkdir input

 

vi sample.txt

red blue yellow red <- これ入力

 

viを抜けたあとでコピー

 

bin/hadoop -fs -put sample.txt input/

 

wordcount 実施

bin/hadoop jar libexec/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.0.jar wordcount input/ output/

 

出力の確認

 

bin/hadoop fs -cat output/part-r-0000

 

 ローカルディスクを、一つのストレージのように扱いますの意味がなんとなくわかった。

 

 

 

 

 

 

AWS EC2,Docker,VMで利用可能な Amazon Linux 2がリリース

 AWS EC2,Dockerで利用可能な Amazon Linux 2がリリースされました。

f:id:gpstandard:20180704064805p:plain

Amazon Linux 2

基本はAWSのドキュメントを見ると良いですね。 

 

ざっくり概要を掴むならこの記事

www.atmarkit.co.jp

 Amazon Linux 2は、Amazon EC2で使用する「Amazonマシンイメージ」(AMI)と、Docker環境で使用するコンテナイメージとして提供される。また、「KVM」(Kernel-based Virtual Machine)、「Oracle VM VirtualBox」「Hyper-V」「VMware ESXi」のオンプレミス開発とテスト用の仮想マシンVM)イメージとしても提供される。

 

 

Mac+Dockerで動かすdev.classmethod.jp

 

有償のLinuxといえばRedHatですが、同じくオンプレにインストールできるパッケージで出てもおかしくないんじゃないかと思ってしまいますね。。。

 Amazon Linux 2は、Amazon EC2で使用する「Amazonマシンイメージ」(AMI)と、Docker環境で使用するコンテナイメージとして提供される。また、「KVM」(Kernel-based Virtual Machine)、「Oracle VM VirtualBox」「Hyper-V」「VMware ESXi」のオンプレミス開発とテスト用の仮想マシンVM)イメージとしても提供される。

 

 

 

 

ウィンドウズでapt-getのようなパッケージマネージャー? chocolatey(チョコレティ)でどんなソフトを管理するの?

シンプルにchromeacrobat readerなどのウィンドウズソフトをパッケージ管理できます。

 

ウィンドウズだとGUIでのインストールが多いですもんね。

 

qiita.com

 

インストール管理できるパッケージ

Chocolatey Gallery | Packages

 

 

 

javascriptライブラリで簡単に利用できるAI機能って? 機械学習をブラウザ上で可能でビギナーにオススメ。

AIに興味を持ち、これでもかというほどドキュメントを読んで、未だに自サイトには活用できていない、仕事にも活かせていない・・・・

 

そんな状況をもしかしたら打破してくれるかもしれない、javascriptライブラリがあるみたいです。

 

ferret-plus.com

 

今まで難しそうに思えた「機械学習」も、JavaScriptで書いてみると「意外とシンプルだった」というケースもあるでしょう。これらのライブラリを使えば、Pythonを学ばずとも機械学習を取り入れられ、なおかつフロントエンドで開発も行えます。

 

実際のところ、それぞれウェブ上で確認できるDEMOも含まれていたりするので、今スグ取り組むにはいいかもしれません。