音声処理技術のパイオニアがAIボイスボットのローンチ後に直面した、「高性能だからこその現場とのギャップ」を乗り越え、コールセンターのための機能を開発するまで【開発ストーリー後編】
ソフトフロントジャパンは、音声処理とリアルタイム処理技術に強みを持ち、リアルタイムコミュニケーションを実現する製品やサービスを開発・販売している企業です。その強みを活かし、2018年には人との“自然な会話”を実現するクラウド型ロボットシステム(=ボイスボット)の「commubo(コミュボ)」を開発・リリースし、これまでに70社を超えるお客様にご利用いただいてきました。
前編では「企画からローンチして反響を得るまで」をお伝えしてきましたが、後編では「ローンチ後から導入したお客様に使い続けられるプロダクトとして成長した今に至るまで」をテーマに、前回に引き続き取締役の佐藤和紀に話を聞きました。
前編はこちら:人の代わりに音声ロボットが対応。自然会話AIボイスボット『commubo(コミュボ)』開発のきっかけと、約1年半でローンチに至るまで【開発ストーリー前編】
お客様の課題にボイスボットをどうあてはめていくか。様々な可能性がある中で、市場の方向性を絞り切れず葛藤するジレンマ
――前編で「怒涛のスピードで開発を進め、ローンチ直後は多くの反響をいただいた」と話がありました。ローンチ後は順風満帆だったのでは?
有難いことに様々な業界から沢山の引き合いをいただきました。教育、語学研修、通信販売、コールセンター、介護・・・。commuboを導入することによる様々な可能性を期待いただいていたと思います。
一方、お客様と話を進めていくにつれ、色んな期待値とのギャップに直面していきました。
当時、僕たちは「人間のように自然に話せるロボット」としてcommuboを開発して、あとはお客様が導入し業務に自由に組み込んでいく流れになるのかと思っていました。お客様側も、「これだけ話せるならば色んな業務に活用できるのでは?」と夢が広がっていたと思います。
ただ、当時はボイスボットという単語すら存在していない時代。お客様自身でも、ボイスボットを業務にどうあてはめていくかが明確に見えておらず、僕たちも当時はお客様理解が浅く解決策を提案できずと、課題感がもやもやしたまま両者で模索する日々が続きました。知識がない中で様々な業界に対応し、お客様と長期間真剣に課題に向き合った結果、ボイスボットという製品自体が合わず、見送りとなった案件も多くありました。
さらに、社員数が多い会社ではないので、すべての業界に一つひとつ向き合っていくにはリソースが足りない。効率の悪さを感じながらも、「選択と集中」をどうするべきかの正解が見えず、非常に苦しく、悩ましい時代を過ごしていました。
――少数精鋭の企業ならではですね……。それを踏まえ、プロダクト開発という視点でどんな改善がされてきたのでしょうか?
苦しみの結果、リリース当初から下記ビジネスモデル含め、実は色んなことが変わっています。いくつか例を挙げるとこんな感じです。
●サービス提供方法:
クラウドAPIサービス*→コールセンター向けサービス へ
元々commuboは、お客様自身が業務に自由に組み込んでいくものを想定していたため、APIの形で提供を始めましたが、自社で開発して組み込むことが難しいお客様が多かった。またUIが見えないと製品イメージがつかないというお客様の要望を受け、後日コールセンター向けのアプリとして「commubo for コールセンター」をリリースし、いまではこちらが主流となっています。
*APIサービス自体は、現在でも「commubo connect」として販売
●課金システム:
commubo 1オペレータごとの貸し出し・課金→時間による従量課金制 へ
電話業務の繁忙期/閑散期の波がある中で、commuboオペレータは人の採用と同じ考え方で 1台ごとの課金形態としていて、柔軟な台数の増減に対応しにくかった。 企業ニーズに合わせオペレータ数が増えることで運用コストもかさんだため、お客様が利用した分だけ加算する、クラウドサービスならではの 従量課金に変更しました。
ロボットだけで業務は完結しない、オペレータのノウハウをcommuboで実現する
――こういった試行錯誤の末、コールセンターに導入できるサービスに育ったということですね。苦しい時代から脱却できたと感じたのは、いつでしたか?
色んな案件に取り組む中で徐々に業界が絞れてきて、コールセンター業務を担う企業とのやり取りが増えてきました。そうすると、どこも同じような悩み・課題を持っているのがわかり、少しずつ共通解が見えてきたんです。
commuboをリリースした時は、僕たちもお客様もオペレータの業務をまるごと代替できると思っていましたが、ロボットだけでは仕事が完結しない、有人オペレータとも協業して全体の業務を完結する必要があると気づきました。
みんながほしかったのは「会話ができるロボット」ではなく、「仕事ができるロボット」だったとわかったんです。ただ話せるだけではだめで、どう仕事に組みこむかを考えるようになってきたときに、活路が見えました。
そうすると、コールセンターを持つ企業だけでなく、コールセンター業務を引き受けるBPO事業者とも協業し、彼らが持つノウハウをcommuboで実現する、というスキームも見えてきました。
――この経験が機能開発に活きた例を教えてください。
電話応対の前後にある業務に目をあてた例を紹介しましょうか。
例えば注文受付の業務、オペレータが電話で注文を受けたらその内容ですぐに発注、というわけにはいかなくて、必ず管理者が注文内容をダブルチェックする必要があります。
そうした時に、せっかく業務効率化のためにボイスボットを導入しても、管理者は管理画面で各会話の画面を毎回覗きに行って、全体の会話音声から該当の音声を探して聞いて確認して・・・というような労力がかかってしまうと本末転送ですよね。まさに、ロボットだけでは業務は完結しない、いい例です。
そこでオプション機能としてリリースしたのが、会話データ管理支援ツールです。
大量の会話データから、注文に必要な文字情報と音声部分のみを抽出して一覧化(下図参照)、さらに一覧上で確認・編集・承認作業までできるワークフロー機能を付与することで、作業者と管理者の業務をつなぎ、全体の効率化をすることができました。
――機能開発つながりでもう1点質問です。前編では「自社のリアルタイム・メディア処理技術を活かした、なめらかな会話」の話がありましたが、ローンチ後にも自社の強みを活かして実現した、機能開発の例はありますか?
ボイスボットだけでなく、AIやロボットの開発・活用はまだまだ夢があり、可能性を秘めていますが、一方で、実際の業務に組み込んでいくには「現実世界とのつながり」も必要だと思っていて、僕たちはそこに自社技術を活かしています。
例えば、ボイスボットを電話業務で導入する際は、「回線は元々お客様が持っていたものを使うのか?」「オペレータへの転送の仕組みは?」「その時かかる通話料は?」など、技術的な問題が発生しますが、僕たちはそれに対し今まで培ってきた「つなげる」技術をもって、お客様ごとに最適なソリューションを提供しています。
また機能開発の例でいうと、昨年2023年8月にCTI/CRM連携ソリューションをリリースしています。
お客様との電話でヒアリングした内容(例:顧客番号)を基に情報を顧客データベースから引っ張ってきたり、着信内容を社員に通知で飛ばしたり、一つのシステムだけで業務を完結することには限界があるので、他のシステムとスムーズにつなげることで業務の可能性を広げることができています。
僕たちはこの「つなげる」技術も得意としているので、他社が踏みあぐねているところに切り込んでいる自負がありますし、前述にもある、前後の業務との連携にも大きく貢献できていると感じています。
子どもの頃にあこがれた未来のロボットに近づけているか?機能開発時は、いつも原点に立ち返る
――開発をしていくうえで、佐藤さん個人として大事している想いはありますか?
子どもの頃アニメで見た「未来のロボット」のイメージがあって・・・、いま自分がその未来に来てみて、そのロボット像に追い付けていないことで感じた、失望感が根源にある気がします。あの時僕が見たキャラクターは、今くらいの時代から来ていたのに、今の時代のロボットはまだカクカク動いていたり、会話もたどたどしかったりするのに、『すごいすごい』ともてはやされている・・・そんなのがっかりだなと。
だから僕たちがつくるcommuboは、人間と聞き間違うような、自然でストレスなく会話できるロボットでありたい。開発もそこからスタートして今に至っています。まだまだ課題はありますが、チームのみんなも同じ気持ちでいると感じていて、打合せをする時も「僕たち、これが本当にやりたかったんだっけ?」と原点に立ち帰る会話は度々出ています。
――最後に、commuboの今後の展望について教えてください。
今お話した「自然な会話ができるロボット」を目指す気持ちに変わりはありません。
そのためには大きく分けて、「脳」と「耳」、どちらもボイスボット業界全体にも言えることですが、この2つの性能を今後上げていく必要があると思っています。
脳の性能とは、応対内容のこと。いまcommuboはシナリオ型といって、シナリオ(設定したスクリプト)に沿って応対をしていますが、FAQから情報を参照して近しい答えを回答するようなパターンもあり、現在のボイスボットはこの2種類が主です。
後者はチャットGPTを想像するとわかると思いますが、便利な一方、確実性がないことを話してしまうので(ハルシネーション問題とも言われています)、なかなか業務に組み込むことが難しい。
今後はどちらの良さも持った、より柔軟性かつ確実性の高い会話ができるロボットが求められると考えています。
もう一つの耳の性能とは、音声認識のこと。例えば人名や住所など、聞き取りが難しい項目があり、シナリオの工夫や前述のシステム連携などを活用しその弱みをカバーしていますが、音声認識の精度自体を高められれば、よりかゆいところに手が届くものになると考えています。
――開発当初からの想いと自社が持つ技術力でお客様に向き合った結果、お客様に使い続けていただけるプロダクトとなったcommubo。今後も成長を続け、「自然な会話ができるロボット」として、電話業務で課題を抱えるみなさんとともに課題を解決していくのがとても楽しみです。
行動者ストーリー詳細へ
PR TIMES STORYトップへ