音声認識AIで福祉を変える!支援現場の面談DXアプリ『AI支援さん』開発秘話【ispec×パパゲーノ】
株式会社ispecは、医療DXの領域にてソフトウェア開発支援を行うヘルスケアテック企業です。
この度、精神障害・発達障害のある方が働くIT系の就労継続支援B型事業所を運営する株式会社パパゲーノ様とタッグを組み、音声解析AIを活用した支援現場向けのDXアプリ『AI支援さん』を開発しました。AI支援さんは、面談記録やケース会議の記録をスマホの録音ボタンを押すだけで作成できる支援記録アプリです。
【AI支援さんの主な機能】
- PC不要!スマホで誰でも支援記録ができる(テキスト・音声)
- 音声を録音すれば自動で文字起こしして、要約を他のスタッフに共有できる
- スタッフ会議の録音・記録にも活用できる
- 記録データに「タグ」をつけて検索しやすくできる
今回は株式会社ispecから開発に参加した山田と堀の2人にインタビューを行いました。互いの事業への強い共感から始まったプロジェクト。機能の根幹を揺るがすトラブル、制約……次々と想定外が襲い掛かる開発。その道を照らしたものは?業界を変えるためリリースされた『AI支援さん』の開発秘話をお届けします。
---------------------------------------------
山田 佑亮:取締役CTO。慶應義塾大学政策・メディア研究科にて機械学習の研究を行い、ACM Multimediaや情報処理学会論文誌で研究が採択される。複数のスタートアップでプロダクトの立ち上げを行った後、ispecにCTOとしてジョイン。複数の開発チームを支える技術基盤の設計・開発や、アジャイルな組織づくりに携わる。今回のプロダクトではAIを活用した機能を担当。
堀 雅晴:デザインエンジニア。フロントエンド開発とUIデザインを二刀流で専門にしている。Webアプリの開発にとどまらず、FlutterやUnityを用いたモバイルアプリ開発やノーコード開発など幅広い開発プロジェクトのリードを担当。開発とデザインの知見を両方活かしたクオリティの高い実装を強みとする。今回のプロダクトでは音声技術に関わる機能を担当。
---------------------------------------------
忙しい福祉の現場。利用者に寄り添うために現状を変えたかった
——開発が決まった時の心境を聞かせてください。
山田:パパゲーノ様とは弊社が参加している医療のプロジェクトでご一緒させていただいたり、メンバー同士の交流があったりと、以前から接点がありました。お話する度に企業同士のシンパシーのようなものが通じ合っているな…と感じていたので、ご相談をいただいた時はシンプルに嬉しかったです。パパゲーノ様が掲げる「生きててよかったと誰もが実感できる社会」に共感していましたし、「誰もがメンタルの問題で悩まない世の中に」を掲げる私たちとしては、ご一緒に走らせていただくことでお互いの目指すところにたどり着けそうだとワクワクしました。
——今回のプロダクトで解決したい課題はどんなものでしたか?
山田:パパゲーノ様は就労継続支援B型事業所を運営されていて、働くことが難しい方に対し、働くための知識や能力を身につける職業訓練や、その方に合った業務や職場環境を探す就職活動のサポートを行う障害福祉サービスを提供しています。その運営や他の事業所の状況を知る中で感じられたのが、利用者の方々のお話を伺う面談の課題でした。
事業所で行われる面談は、スタッフが利用者の悩みを聞いたり、生活面や就労の課題を整理し支援方針を考える重要な場です。しかし、傾聴しながらPCで議事録作成をすることは難しく、記録に課題を抱えていました。また、他の事業所に話を聞くと、「紙では記録しているが、記憶頼りでスタッフ同士の連携や支援への活用につながらない」「そもそもスタッフ側が激務に追われ、面談が定期開催できない」などの状況があることがわかってきました。福祉現場は紙を用いた記録、電話・FAXを通じたやりとり、ハンコ文化や現金文化などが当たり前で生産性向上のためのIT化が進んでおらず、面談の時間が確保できないほど現場はひっ迫しています。
「面談を実施し記録をとる」という作業の向こう側にある「利用者が抱える課題を共に解決する」といった本来の意義にたどり着くために、新たな仕組みを導入することが今回の構想として挙げられました。
——具体的にはどんな方法でアプローチしたのでしょうか?
堀:「面談記録と共有のDX」です。スキルレスに日常記録を可能にする仕組みを導入することで、定期的な面談実施を叶えるだけでなく、スタッフ同士の共有や議論を促進できる状態を目指しました。
福祉現場でDXできるものはたくさんありますが、第一歩として面談記録と共有にフォーカスしたのは、パパゲーノ様が自社で事業所を運営される中で、利用者ご本人の言葉で語られるエピソードを支援の要としており、面談を重要なものとして捉えていらっしゃったからです。利用者の方々は業務が滞ったり人間関係に困ったりと、様々な問題にぶつかりながら仕事と向き合っています。面談は日々の不安に寄り添う重要な支援であり、その軌跡を記録し、解決のために事業所内スタッフや家族・事業所外の専門家で連携ができることの必要性を強く感じておられました。
そしてこれはパパゲーノ様の事業所に限った話ではなく、業界共通で必要なことだと。業界全体の変革に挑むパパゲーノ様の意志を実現しようと、将来的に多くの現場で使われることを想定してプロダクト開発が進みました。
——開発における制約はありましたか?
山田:これはパートナー様の多くが抱えるご都合でもあるのですが…限られた予算の中で開発をしなくてはならないといったご状況がありました。今回のタイミングでご依頼された背景として「ものづくり補助金」の採択が大きく、補助金の範囲内で構想の初期フェーズを実現したいご意向でした。また、まずは一刻も早く自社の事業所の現状から改善したいというお気持ちもありましたので、タイトな開発期間であることも、考慮すべき課題でした。
制約をふまえ、ノーコードをベースにしながら、「ChatGPT」や「Whisper」など直近目覚ましく進化を遂げているツールをコードを書いて活用する開発方法のご提案に至りました。
根幹の機能を揺るがすトラブル発生。解決のカギは“プロダクトの未来像”
——ノーコードでの開発…近年よく耳にしますよね。詳しく教えてください。
堀:開発といえば、コードを1から書いて実装を行う「フルスクラッチ」と呼ばれる手法をまずイメージすると思います。フルスクラッチは柔軟に機能開発ができる点が強みですが、工数が多く費用がかさんでしまう傾向にあります。一方でノーコード開発は、プログラミングをせずにソフトウェアを開発できるノーコードツールを用いて、コーディングの工数を省く手法です。コストを抑えてスピーディーに開発できるため、機能単位で需要を確かめたい場合や、最小機能を備えたMVPをお求めの場合に効果的な手法のひとつです。
今回は、ものづくり補助金の範囲内かつスピード感が求められるMVP開発ということで、ノーコードがマッチするとの判断になりました。初期フェーズの開発コストを抑えながら、いち早くユーザーに使ってもらうことで本質的な改善点を捉え、将来的な機能の拡張やアップデートに活かそうという狙いもあります。実際に、録音・文字起こし・要約の機能開発の試行錯誤で得た知見は、今後フルスクラッチで作り直すことになっても使えるものでしたね。
——先を見据えた選択が功を奏したのですね。
山田:MVP開発はプロダクトのスタート地点であり、ネクストステージに活かせる知見をどれだけ見つけられるかが肝だと考えています。パパゲーノ様は支援現場の課題解決のために新しい仕組みを導入することを目指されていて、今回のAI支援さんではその第一歩として「面談記録・共有機能を実用できるレベルにすること」が最優先。それが共有できていたので今解決すべき課題の取捨選択ができましたし、次に活かせるものを取りにいけました。
提供することでユーザーにどんな価値を手渡したいか。どんな順番で機能を増やしていけばそれが叶うか。ご依頼いただいている機能を作ることだけを考えるのではなくて、その先までご一緒したいからこそ、プロダクトの目的と未来について共通認識を持つことが大事だと思っています。
——お聞きしているとかなりスムーズに開発が進んだように思いますが…?
堀:いえ、結果的に今は良かったと言える状態になりましたが、録音と音声認識で壁にぶつかりまして…。まず録音についてですが、AI支援さんでは30分~1時間の面談をすべて記録するための「長時間録音機能」が必要です。当初はプラグインを利用して録音する想定でした。プラグインとは、ノーコードツールの機能を拡張するために公開されているプログラムです。しかし実装を進める中で、この方法での録音は数分が限界であることがわかったんです。1回の面談の中で何度も操作をしなければならないとなると、面談記録がスムーズになったとは言えませんから、どうにかして長時間録音を可能にする必要がありました。
もうひとつの壁は音声認識です。面談内容の文字起こしのために録音データを音声認識させる必要がありますが、データが容量制限に引っかかってしまうケースがあることがわかりました。Google Chrome、Safariなど、AI支援さんを使用するブラウザのデータ保存フォーマットの違いや録音時間などが影響して、容量が大きくなってしまうんです。録音の壁をクリアしても共有ができないと意味がないですから、頭を抱えましたね…。
——どちらもAI支援さんの根幹となる部分ですよね。どうやってクリアしたのでしょうか?
堀:録音は、長時間録音ができなかったプラグインのコードを分析し、原因を取り除けるコードを自分たちで書くことでクリアしました。ネックとなっている部分を突き止められるか、それを解消できるコードを書けるか…ヒヤヒヤしましたが、仮説と検証を繰り返して、最終的には面談が長引いても対応可能な1時間半の録音を実現できました。
音声認識は、様々なブラウザのフォーマットで保存されたデータを一律に認識可能にすることは難しく、ブラウザごとに対応を模索しました。録音精度を維持したまま圧縮できるか、コードを書いては検証し、なんとかすべてのデータを音声認識可能にできました。
——完成まではどんなお気持ちでしたか?
堀:不可能という言葉が頭をよぎる瞬間も正直ありました。開発前に「これは起こってほしくないね」と談笑していた内容が次々と襲い掛かってきましたからね…(笑)
でも開発って想定外の連続なんですよね。だからこそ対応するためのバッファを確保しておくことが大事です。そしてなにより、プロダクトにとってベストな優先順位をつけられるかが明暗を分ける。今回はパパゲーノ様と事前にプロダクトの未来像を共有できていたのが大きかったですね。録音と音声認識でつまづいた時に「ここは工数をかけてもしっかり検証しきろう」という目線合わせもスムーズにできました。
未知でも、不確実でも、進むために挑戦したい。領域を越えたタッグで新しい流れを生む
——「目線を合わせる」「目的を共有する」という意識が、プロダクトを前進させるんですね。
山田:受注したものを開発すれば、開発サービスとしては成り立ちますよね。でもispecはそれでは足りないという思想が強くあります。私たちがほしいものはプロダクトを作った先にありますし、ユーザーに使われて価値を生んでこそ作る意味があると思っています。「一緒に作りたい」とお声をかけてくださった方々が、プロダクトを通して何を叶えたいと思っているか。それに共感して一緒に走れることが大事だと思います。
もし共感したプロダクトを作るために未知の技術を探索することが必要だったとしても、私たちは挑戦すると思います。AI支援さんで使った技術の中にも経験の浅いものがありましたが、実現できるかの見立てをしっかりとした上で、最後は「パパゲーノ様が描くものを一緒に作りたい!」という強い気持ちから挑戦することを選びました。結果、これまでの近しい経験を応用して実際に完成に至ることができたんです。
——不確実性のある挑戦、怖さはないですか?
堀:不確実性やリスクはどんなときもあると思いますし、怖さが伴うのは仕方ないと思います。それよりも「やりがいがある」って感じですね。他のメンバーも、難易度が高かったり、これまでお受けしたお仕事と異なったりするほどやりがいを感じられる人が多い気がします。「難しいけどやってみたほうがよさそう」「ご要望があったわけではないけど改善ができそう」など、各々自分ができることを見出すのが楽しいんだと思いますね。
今後も「できないかもしれない」と思う場面にはたくさん遭遇すると思います。特に今私たちが主軸としている医療領域は抜本的に変えていく取り組みが多いですし。でもどんなときも可能性を信じて、パートナーの皆様と挑戦していきたいです。
——今後どんなものが生まれていくのか楽しみです。パパゲーノ様との今後の取り組みや、ispecの動きについて思い描いていることはありますか?
山田:まずはAI支援さんを着実に進化させて、使っていただける事業所を拡大していく動きに貢献できればと考えています。パパゲーノ様は福祉、ispecは医療を主軸としていて、重なる部分が多い領域なので、直接ご一緒している案件ではないところでも活かせる知見を得られることがあります。得た知見を交換し合って、AI支援さんや他の事業展開の可能性を高めていければと思います。
それぞれの努力を重ね合わせて、領域を越えた大きな流れを作っていきたい。お互いが描く未来に存在して与え合う関係になれたら、それ以上嬉しいことはないですね。
――――――――――――
『AI支援さん』プレスリリース(株式会社パパゲーノ様)はこちら
株式会社ispec コーポレートサイトはこちら
【開発に関するお問い合わせ】
メールでのお問い合わせ
担当者:株式会社ispec Partner success team
E-mail:sales@ispec.tech
フォームでのお問い合わせ
株式会社ispec:https://ispec.world/#contact
行動者ストーリー詳細へ
PR TIMES STORYトップへ