概要
お盆休みは暇なので「データサイエンス100本ノック(構造化データ加工編)」に取り組んだ。
環境はDockerで整備されていてすぐ取り組めるが、せっかくなので自分でAzureにSQL Database作ってから取り組む(Azureの無料枠の範囲でやる)
本記事の流れ
- 環境構築
- 問題を解く!
1.1 環境構築(Azure Database接続まで)
Microsoftのドキュメント1に沿って、Azure Databaseを作成した(Standard S0 10 DTU, 250GB)。無料期間を活用するので、料金が出ているが課金はされない。
SQL Server Management Studioで接続できるか確認。接続できなければ、パブリックエンドポイントの設定が怪しい(一敗)
1.2 環境構築(テーブル準備)
テーブル作成のために一工夫必要。CSVファイルをBULK INSERTなりして初期データを入れたいが、Azure DatabaseにローカルのCSVをBULK INSERTしたりできないので、Blob Strage上におく必要がある。
仕方がないのでコンテナをつくって、適当な場所にCSVをアップロードした。また、SAS(Shared Access Signature )を発行して、指定のファイルに時間制限付きのアクセス権を許可する URI取得しておいた。2
テーブルをCREATEした後に、下記SQLを実行した。BULK INSERTの引数はかなり厄介だった…。3
|
|
これで環境の準備ができた!
2.問題を解く!
まだ途中だが、以下にまとめていく。
3.完走した感想
そのうち書きたい!!!
4.参考
Microsoftのドキュメントに大体乗っている。Azure SQL Databaseを無料で試すには、Azureの無料アカウントをご利用ください ↩︎
「コード ページ 65001 (UTF-8 エンコード) がサポートされません。」に対処しないといけない。UTF-8 形式のテキストファイルを BULK INSERT で一括取り込みする( SQL Server )
↩︎