AWSのコンピューティングサービスはよく知っている。 しかし、AIやML系のサービスは全く知らないので、調べてみることにした。
Amazon Rekognition
- 画像と動画を分析するサービス
Demoがあったので、実際に写真をアップロードしてみた。 靴やらカバンやら人やらが認識されている事がわかる。 自分でデータセットを用意して、ラベルづけしてモデリングすることもできるようだ。
サービスのコンテンツモデレーション機能として使用するといった用途がある。
参考:https://dev.classmethod.jp/articles/amazon-rekognition-moderating-content-2023/
Amazon Comprehend
- 文章を分析するサービス
これもDemoがあった。 名詞の種類(人、モノ、場所)、キーフレーズ、言語判定、個人情報、感情、品詞などの抽出、判定ができる。
Amazon Polly
- Text to Voice
これもDemoがある。簡単に試せていいね。 日本語でやってみたら、Siriよりは流暢に喋ってくれる感じだった。 結構良い。「3曲目」を「さんきょくもく」と読んでしまう間違いが発生したが、 そういうときはPLSフォーマットで特定の語の読み方を修正することもできる。
Amazon Transcribe
- Voice to Text
自動字幕や自動議事録を作ることができる。 おそらく、Comprehendと連携して個人情報などを自動で隠すことも可能のようだ。
Amazon Translate
- 言語翻訳
- 翻訳前の言語はTranslateがComprehendを呼び出し判定する
Amazon Textract
- OCR
- 手書き文字からテキストを抽出する
Amazon Lex
- 会話ボットを作成できる
- Alexaと同じエンジンらしい
Amazon Kendra
- 蓄積データから情報を検索する
- 自然言語で検索できる
結構いろいろな形式のデータを扱う事ができるみたい。
参考:https://aws.amazon.com/jp/builders-flash/202302/kendra-search-system/
Amazon Bedrock
- AWS以外の生成AIサービスを呼び出せる
- AnthropicのClaudeとかMetaのLlamaとか
AWSで統合的に管理できるのが良い。
Amazon Q
- AWSのサービスについての質問に答えてくれる
AWS SageMaker
- 機械学習プラットフォーム
- AWSの既存サービスで機能不足な場合に使うと良い
こういったサービスってなんとなく料金が高いイメージを持っていた。 しかし、調べてみるとRekognition imageは1万枚の画像から物体検出すると2~3000円といったところなので、 個人で使う分には意外と料金を気にしなくてもよいのかもしれない。 それともS3の方で料金を取るタイプかな? なんか一個くらい深入りしてみるか。
コンソール見てて気付いたのは、AI/ML系のサービスのアイコンは緑色らしいということだ。