チュートリアル:データの可視化を始めてみよう ~ データ準備・ロード編 ~



サンプル

基盤ソリューション事業本部 オラクル事業部
サービス推進担当 サービス・イノベーション・グループ

N. A

前回のおさらい

前回は DVD で可視化する前段階として ADWC を構築し、ツールを使用して ADWC に接続するところまで進みましたね。
今回は、ADWC へ手元のデータをロードするところまで行います。

分析したいデータの確認と整形、アップロード

1 .分析したいファイルを開いて、どういった形でデータが入っているか、確認してみましょう。
ブラジリアの気象データのようですね。実際のデータではない部分(最初の 9 行程度)があるので削除します。
10 行目が情報の種類、11 行目が時間でしょうか。なかなかステキな整理をされているデータを開いてしまいましたね。
10 行目と 11 行目は併せて一つの列とした方が一意になって使い勝手がよさそうなので、結合しましょう。
文字列で "NULL" と記載されているところも全て削除して、Database に取り込みやすいように CSV 形式で保存(ファイル > 名前を付けて保存 から)します。
個人情報や機密情報が含まれていた場合は、このタイミングで適宜匿名化やマスキングなど実施しておきましょう。

2 .作成した CSV ファイルを ADWC にとりこむために、ステージング領域となる Object Storage にアップロードします。
用意した Bucket(Bucket の作成は今回は割愛します。ADWC_Staging にするつもりでしたが、つづりを間違えてしまいました。。この後もずっと間違ってますが、無視してください・・・)の画面から、「Upload Objects」をクリックして CSV ファイルをアップロードします。赤い点枠線内に CSV ファイルをドラッグ&ドロップするか、「select files」をクリックしてファイルを選択してください。

3 . アップロードした CSV ファイルの URI を確認します。
オブジェクトの右端にあるメニューから、「View Object Details」をクリックし、「URL Path (URI):」に記載されているURI をコピーしておきます(コピーしたら、テキストに保存しておきましょう)。

OCI ユーザの Auth Token の発行と ADWC 認証の作成

4 . 次に、先ほど CSV ファイルをアップロードした Object Storage にアクセスする権限を持つ OCI ユーザー(ユーザーの作成及び Group への追加は今回は割愛します。)の Auth Token を生成します。
ADWC から、Object Storage 上の CSV へアクセスするための設定に使います。
OCI コンソールのハンバーガーメニュー > Identity > Users とたどり、使用するユーザーを選択します。ユーザーの画面の左下の「Auth Tokens」をクリックし、Auth Tokens の画面から「Generate Token」をクリックします。
DESCTIPTION のところに Token の名前を任意で入力し、「Generate Token」をクリックします。
Token が表示されますので、ユーザー名と合わせて忘れずに保存しておきましょう。(Token は作成時しか表示されません。忘れたら、再作成することになります。涙)

5 . 次に、SQL Developer Web というツールで、DB にアクセスします。
Autonomous のインスタンスの画面から、「Service Console」をクリックし、左のメニューから「Development」をクリックします。
表示された中から、「SQL Developer Web」を選択します。SQL Developer Web のサインイン画面になります。
ユーザー名に 「ADMIN」、パスワードにインスタンス構築時に設定したパスワード(前回と同じパスワードですが、覚えてますか?)を入力し、サインインをクリックします。

6 .下記のマニュアルを参考に、先ほど登録した Auth Token を利用して ADW に資格証明(Credential)を作成します。
[参考] データのロード - 資格証明の作成と既存の表へのデータのコピー
https://docs.oracle.com/cd/E83857_01/paas/autonomous-data-warehouse-cloud/user/load-data.html#GUID-76FC5A15-7ACC-4B59-87C0-20D4778E522D
コマンドを入力して、緑のアイコンをクリックします。
「PL/SQL procedure successfully completed.」と表示されることを確認しましょう。(credential_name 部分は正しく「ADWC」と書けてますね。)

OCI ユーザの Auth Token の発行と ADWC 認証の作成

7 .データのロードの準備として、先ほどアップロードした CSV ファイルを参照するための外部表を作成します。
[参考] 外部データの問合せ
https://docs.oracle.com/cd/E83857_01/paas/autonomous-data-warehouse-cloud/user/query-external.html#GUID-72DC8BB6-5245-4262-A100-C35A2E553F70
外部表の作成時に、先ほど作成した資格証明(Credential)と、CSV ファイルの URI が必要になります。
コマンドを入力して、緑のアイコンをクリックします。(column_list に記載する列名は、大文字にしましょう。DVD の仕様で、列数分カラム名を定義する必要があるので、列数が多いと大変です。(今回は、216 列もありました…)
「PL/SQL procedure successfully completed.」と表示されることを確認しましょう。

8 .作成した外部表を Select して、CSV ファイルの中の情報が参照できていることを確認しましょう。
コマンド(SQL文)を入力して、緑のアイコンをクリックします。
想定したデータが表示されることを確認しましょう。今回の例ではちゃんと表示されましたね。

9 .先ほど作成した外部表は外部ファイルに対して、まるでテーブルが存在するかのようにアクセスすることができる機能です。
この時点では、ADWC にはデータは格納されていません。データベースにデータをロードするために今度は表を作成しましょう。
SQL 文を入力して、緑のアイコンをクリックします。
「Table <指定した表の名前> created.」と表示されることを確認しましょう。

10 .作成したテーブルに外部表からデータをロードするため、insert .. select 文を発行します。
SQL文を入力して、緑のアイコンをクリックします。
rows inserted.」と表示されることを確認し、commit を発行して確定させましょう。(忘れると、何もなかったことになっちゃいます。)
「Commit complete.」と表示されることを確認しましょう。

11 .ADWC へのデータのロードが完了しました。Select 文を発行して データを確認しましょう。
コマンドを入力して、緑のアイコンをクリックします。
想定したデータが表示されることを確認しましょう。ちゃんと表示されましたね。

12 .最後に、データのロードのために作成した外部表はもう不要なので削除します。(なお、削除は必須ではありません。CSV ファイルも Object Storage から削除できます。ここでは割愛します。)
SQL 文を入力して、緑のアイコンをクリックします。
「Table <外部表の名前> rows dropped.」と表示されることを確認しましょう。

以上で、ADWC へのサンプルデータのロードは完了です。
次回は、DVD で ADWC にアクセスして、今回ロードしたデータの可視化・分析を行います。
DVD を使ったデータの可視化・分析の方法について、実際に触ってみながら、わかり易くお伝えしていきます。お楽しみに!



チュートリアル:データの可視化を始めてみよう ~ データ準備・ロード編 ~