前回はAzureポータルからログインしてAzure AI Searchというサービスを立ち上げました。
次のステップはここにデータを用意することです。
データのインポート方法としていくつかあるのですが、この中の「Azure BLOBストレージ」を使うことにします。
Azure BLOBストレージとは?
Azure BLOBストレージについては下記のサイトで解説されています。
Blob (オブジェクト) Storage の概要 – Azure Storage | Microsoft Learn
こちらもChatGPTに確認したところ
BLOBストレージは、3つの主要な種類に分かれています:
1. **ブロック BLOB**:大きなデータを複数のブロックに分割して保存する方式で、大容量のファイルを効率的に扱えます。例えば、大きな動画ファイルなどがこれに該当します。
2. **ページ BLOB**:仮想ハードディスクのようなもので、ランダムアクセスが可能なファイルを格納するために使われます。仮想マシンの OS ディスクなどがこれに属します。
3. **アペンド BLOB**:ファイルの末尾にのみデータを追加できるストリーム データを扱う際に使用されます。ログファイルなどの連続したデータの保存に使われます。
これらのBLOBストレージは、Azureの他のサービスやアプリケーションからアクセスされ、データの格納、管理、共有、配信などの用途に利用されます。
と出ましたが、わかったようなわからないような感じなので、
簡単に言うとAzure上にデータを置いておくフォルダみたいなものですね。
Azure BLOBの価格は?
リソースの追加からBLOB Storageを検索したところ、いくつもでてきました。
いったいどれを選べばよいのでしょう?
ストレージアカウント
いろいろ調べたら、「くらう道」というサイトを運営している牛上 貴司さんの記事を見つけました。
単純にストレージアカウントを作成すればよさげです。
チェック状態はデフォルトのままで作成します。
リソースに移動
コンテナを新しく追加します。
docという名前にしました。
このdocに照明制御エキスパートのWordファイルをアップ。
データのインポート
データのインポートを押した後、データソースをAzure BLOBストレージにして、接続文字列で”既存の接続を選択します”にして、先ほど作成した”doc”を選んで次へ。
AI Search インデックスの追加
AI Searchの検索サービスにインデックスの追加をします。
なにもせず、次へ
こちらも、何もせずに次へ
これで送信。
データの検索
インデックスが作成されたようなので、データの探索に移動。
検索に”照明”と入力して検索した結果がこちら。
search.scoreという値があるので、検索した内容に対する値のようだ。
ただ、現在はあまり内容の無い1つのWordファイルしかアップロードしていないので、ここのデータを厚くしないと検証はできなさそう。
まとめ
今回はAzureでストレージサービスを追加して、AI Searchのデータ接続とインデックスの追加を行った。
正直、Azureはどんなことをしたらどれぐらいの請求になるのかの知見がないので不安しかないのだが、今後自分が学習しなければならないことは、
1.Azureを使った経験値を上げること
まずは、Azureを使ったWebサービスを立ち上げるまでの方法について学ぶといった経験値を上げる必要がある。
2.照明制御のチャットサービスに役立つデータの準備
先ほどは自分の中で構想中の”DX照明制御エキスパート”の資料をサンプルデータにしたが、今後は照明制御についての質問に答えられる内容がかかれているデータを準備する必要がある。
これまでは、YouTubeやパワーポイントでそういった資料をつくってきたが、過去動画やパワーポイントをストレージにアーカイブできるような方法を考えてみることにする。
また、下記のページがまさに自分がやりたいと思っていること。
Azure OpenAI Service リファレンスアーキテクチャ
また、
企業IT向け:Azure OpenAIでChatGPTを閉域で安全に展開 / HCCJP(ハイブリッドクラウド研究会) 44回勉強会 – YouTube
この動画に紹介されていた
jp-azureopenai-samples/5.internal-document-search at main · Azure-Samples/jp-azureopenai-samples
こちらも参考になりそう。
ということで、まだまだ第一目標までの道のりは長そうですが、千里の道も1歩から、2024年の年末には「AIと照明制御」について今よりも多くの知見を習得するべく、今後も学習を継続していきます。