照明制御のチャットサービスをつくる3

前回はAzureポータルからログインしてAzure AI Searchというサービスを立ち上げました。

次のステップはここにデータを用意することです。

Image from Gyazo

データのインポート方法としていくつかあるのですが、この中の「Azure BLOBストレージ」を使うことにします。

Azure BLOBストレージとは?

Azure BLOBストレージについては下記のサイトで解説されています。

Blob (オブジェクト) Storage の概要 – Azure Storage | Microsoft Learn

こちらもChatGPTに確認したところ

Azure BLOBストレージは、Microsoft Azureクラウドプラットフォーム上で提供されるストレージサービスの一種です。”BLOB”は”Binary Large Object”の略で、様々な種類の非構造化データを保存するためのストレージタイプです。これには画像、ビデオ、オーディオファイル、ドキュメントなどのバイナリデータが含まれます。

BLOBストレージは、3つの主要な種類に分かれています:

1. **ブロック BLOB**:大きなデータを複数のブロックに分割して保存する方式で、大容量のファイルを効率的に扱えます。例えば、大きな動画ファイルなどがこれに該当します。

2. **ページ BLOB**:仮想ハードディスクのようなもので、ランダムアクセスが可能なファイルを格納するために使われます。仮想マシンの OS ディスクなどがこれに属します。

3. **アペンド BLOB**:ファイルの末尾にのみデータを追加できるストリーム データを扱う際に使用されます。ログファイルなどの連続したデータの保存に使われます。

これらのBLOBストレージは、Azureの他のサービスやアプリケーションからアクセスされ、データの格納、管理、共有、配信などの用途に利用されます。

と出ましたが、わかったようなわからないような感じなので、

Image from Gyazo

簡単に言うとAzure上にデータを置いておくフォルダみたいなものですね。

Azure BLOBの価格は?

Image from Gyazo

リソースの追加からBLOB Storageを検索したところ、いくつもでてきました。

いったいどれを選べばよいのでしょう?

ストレージアカウント

いろいろ調べたら、「くらう道」というサイトを運営している牛上 貴司さんの記事を見つけました。

Azure BLOB ストレージ とは?

ストレージアカウントの作成

単純にストレージアカウントを作成すればよさげです。

Image from Gyazo

Image from Gyazo

チェック状態はデフォルトのままで作成します。

Image from Gyazo

リソースに移動

Image from Gyazo

コンテナを新しく追加します。

Image from Gyazo

docという名前にしました。

Image from Gyazo

このdocに照明制御エキスパートのWordファイルをアップ。

データのインポート

Image from Gyazo

データのインポートを押した後、データソースをAzure BLOBストレージにして、接続文字列で”既存の接続を選択します”にして、先ほど作成した”doc”を選んで次へ。

Image from Gyazo

AI Search インデックスの追加

Image from Gyazo

AI Searchの検索サービスにインデックスの追加をします。

Image from Gyazo

なにもせず、次へ

Image from Gyazo

こちらも、何もせずに次へ

Image from Gyazo

これで送信。

データの検索

Image from Gyazo

インデックスが作成されたようなので、データの探索に移動。

Image from Gyazo

検索に”照明”と入力して検索した結果がこちら。

search.scoreという値があるので、検索した内容に対する値のようだ。

ただ、現在はあまり内容の無い1つのWordファイルしかアップロードしていないので、ここのデータを厚くしないと検証はできなさそう。

まとめ

今回はAzureでストレージサービスを追加して、AI Searchのデータ接続とインデックスの追加を行った。

正直、Azureはどんなことをしたらどれぐらいの請求になるのかの知見がないので不安しかないのだが、今後自分が学習しなければならないことは、

1.Azureを使った経験値を上げること
まずは、Azureを使ったWebサービスを立ち上げるまでの方法について学ぶといった経験値を上げる必要がある。

2.照明制御のチャットサービスに役立つデータの準備
先ほどは自分の中で構想中の”DX照明制御エキスパート”の資料をサンプルデータにしたが、今後は照明制御についての質問に答えられる内容がかかれているデータを準備する必要がある。
これまでは、YouTubeやパワーポイントでそういった資料をつくってきたが、過去動画やパワーポイントをストレージにアーカイブできるような方法を考えてみることにする。

また、下記のページがまさに自分がやりたいと思っていること。

Azure OpenAI Service リファレンスアーキテクチャ

また、

企業IT向け:Azure OpenAIでChatGPTを閉域で安全に展開 / HCCJP(ハイブリッドクラウド研究会) 44回勉強会 – YouTube

この動画に紹介されていた

jp-azureopenai-samples/5.internal-document-search at main · Azure-Samples/jp-azureopenai-samples

こちらも参考になりそう。

ということで、まだまだ第一目標までの道のりは長そうですが、千里の道も1歩から、2024年の年末には「AIと照明制御」について今よりも多くの知見を習得するべく、今後も学習を継続していきます。