Upgrade to Pro — share decks privately, control downloads, hide ads and more …

対話型音声AIアプリケーションの信頼性向上の取り組み

 対話型音声AIアプリケーションの信頼性向上の取り組み

2025/07/11に開催された「SRE NEXT 2025」に、IVRyの森谷と渡部が登壇しました。

■リンク集
・IVRyコーポレートサイト:https://ivry.jp/company/
・IVRy採用ページ:https://ivry-jp.notion.site/
・IVRyイベント一覧:https://ivry.connpass.com/event/
・IVRy Tech Xアカウント:https://x.com/IVRy_tech

More Decks by 株式会社IVRy(社員登壇資料)

Other Decks in Technology

Transcript

  1. confidential 会社紹介 9 会社名 代表取締役 事業内容 住所 資本⾦等 設⽴年⽉ 株式会社IVRy(アイブリー)

    奥⻄ 亮賀(Ryoga Okunishi) クラウド型AI電話SaaS(アイブリー)の運営 〒108-0073東京都港区三⽥三丁⽬5-19 住友不動産東京三⽥ガーデンタワー10F 46.1億円(準備⾦含む) 2019年3⽉
  2. 26

  3. 27

  4. 28

  5. 29 Merge code Deploy latest code Execute automated phone E2E

    tests Monitor on Datadog LLM Observability 電話 e2e testをコードマージ時に 実⾏させる
  6. 35 Fast, stable, and cheap Slower, more $$$ Stability &

    performance > latest models 自分たちのユースケースに合っ たモデル選定をする。
  7. WebSocketの特徴 • RFC6445 で定義されている • 双⽅向通信‧全⼆重通信 ◦ クライアントとサーバーの両⽅が同時にデータを送受信可能 ◦ HTTPとは異なり、リクエスト‧レスポンスの概念がない

    • 接続を⼀度確⽴したあとは、明⽰的に切断されるまで維持される ◦ HTTPのように毎回接続を確⽴するオーバーヘッドがない • GitHub Actionsのログをリアルタイムでみれたり 47
  8. 50

  9. ⾳声対話システムでSLI/SLOを扱う難しさ • ユーザー体験が定量化しづらい ◦ ユーザーの体験は「ちゃんと会話できたか」という主観的なもの ◦ HTTPレスポンスのように明確な成功/失敗が定義しづらい • 会話失敗の原因が複雑 ◦

    インフラ、LLMの応答ミス、⾳声認識の精度低下 • Webと異なりセッションベースでの設計が必要 ◦ Webのように1リクエスト=1トランザクションではない 64