製品紹介
(株)HIRO ICT 研究所の製品紹介を行います。
(株)HIRO ICT 研究所の製品の概要
アンビエントコンピューティングを実現する「トークA愛」
アンビエントコンピューティングとは
アンビエントコンピューティング(Ambient computing)とは、IoT(モノのインターネット)を通じて情報の収集と操作を行いながら私達人間の指示に従うのはもちろん、 指示を行わなくてもこれまでの行動パターンや予測機能により、デバイスやシステムを人間の代わりに操作する「コンピュータ」を指します。
- アンビエント(ambient)という言葉は、「周囲の・環境の」という意味を持ちます。 つまり、デバイスの場所はあまり関係ありません。実際、アンビエントコンピューティングでは、ユーザーが対象のデバイスについて何も知らなくても使うことがでます。
- アンビエントコンピューティングの正体は、さまざまな技術の組み合わせと進化である。 すなわち、音声インタフェース、エアジェスチャーインタフェース、音声認識、IoT、クラウドコンピューティング、ウエアラブルコンピューティング、クオンティファイドセルフ(QS)、 拡張現実(AR)、ハプティクス、そして何より、AIと機械学習である。
- このように並べると、あらゆる技術の集大成のように思えます。しかし、アンビエントコンピューティングを特徴づけるのは、ユーザーに及ぼす効果です。
- アンビエントコンピューティングがアンビエントたるゆえんは、使う人が行動や意識を明示的に切り替える必要がなく、「ユーザー」としてふるまわなくてよい点にあります。 どこかその辺にあるデバイスの助けや後押しを受けながら、日々の物事をこなしていくことができます。
- アンビエントコンピューティングのデバイスは、バックグラウンドでひそかに動作します。 我々を識別し、様子を把握し、声を聞き、こちらのニーズや習慣を認識し、それに合わせてくれます。
- したがって、アンビエントコンピューティングの実際的な定義としては、「ユーザーの能動的な関与なしにバックグラウンドで行われるコンピューティング」というあたりが適切かも知れません。
アンビエントコンピューティングを実現する「トークA愛」
タブレット(Android)アプリの「トークA愛」は、以下のような機能を搭載することでアンビエントコンピューティングを実現します。
- 音声によるインターフェース機能(VUI: Voice User Interface)
介護現場におけるニーズを満たす「トークA愛」
グル-プホームで働いていた介護二級の資格を持つある女性(67歳)のご意見を以下に紹介します。
- 音声で薬などの促しをしてくれ、またそれに対して音声で返してくれるのは嬉しい。
- 電子機器は、なかなか老人の操作は難しいので、音声でやりとりできたら素晴らしい。
- グル-プホームでは、薬を忘れないように、カレンダー式のポケットに薬が置いてあった。
- テレビ機能は不要。なぜならテレビを見るのはリビングルームであることが多いから。
- 年寄は目が悪い人が多くタブレットのような画面が小さいものより大画面で見たい人が多い。
- カラオケマイクを使うような発想がいいと思う。
- タブレットの写真やイラストは色鮮やかな綺麗なものを見たい。
- 写真やイラストは、趣味に合わせたものや季節を感じさせるものが定期的に変化したらいい。
(株)HIRO ICT 研究所では、上記のようなご要望を満たすために、タブレット(Android 5.0以上)上のアプリケーションである「トークA愛」と言う製品を開発しました。
(株)HIRO ICT 研究所が考える「トークA愛」の概要
-
音声で薬などの促しをしてくれ、またそれに対して音声で返してくれるのは嬉しい。
→「トークA愛」は、音声で薬などの促しをしてくれます。 また、利用者は、それに対して音声で返事することができます。
-
電子機器は、なかなか老人の操作は難しいので、音声でやりとりできたら素晴らしい。
→「トークA愛」は、扇風機のような家電品の電源のオンオフ制御を音声で行うことができます。
-
グル-プホームでは、薬を忘れないように、カレンダー式のポケットに薬が置いてあった。
→「トークA愛」は、オプションで服薬支援機器と連動できます。
-
テレビ機能は不要。なぜならテレビを見るのはリビングルームであることが多いから。
→「トークA愛」は、テレビ機能はありませんが、無料の「Abema TV」を使用してニュースなどを見ることができます。
-
年寄は目が悪い人が多くタブレットのような画面が小さいものより大画面で見たい人が多い。
→「トークA愛」をタブレットの代わりにAndroid TV(Nexus Playerなど)上で動かすことで、大画面に出力できます。 また、HDMI出力を持つタブレットも大画面に出力できます。
-
カラオケマイクを使うような発想がいいと思う。
→「トークA愛」は、カラオケマイクを使うような感覚で使用できます。 カラオケマイクが利用者の歌に対して励みとして評価点を出すように、評価点を出すこともできます。
-
タブレットの写真やイラストは色鮮やかな綺麗なものを見たい。
→タブレットの画面は、FHD仕様(1920×1080以上)のものを使用していますので、写真やイラストを色鮮やかに綺麗に見ることができます。
- 写真やイラストは、趣味に合わせたものや季節を感じさせるものが定期的に変化したらいい。
→「トークA愛」は、写真やイラストを趣味に合わせたり、季節を感じさせるものを定期的に変化させることができます。
住宅のスマートホーム化
住宅のスマートホーム化の目標
住宅におけるスマートホーム化とは、以下のようなプロセスで、住宅に生活する人の 快適な生活を実現し、安心・安全を守ることを目指しています。
- 空間に分散して配置されたセンサー(DIND)を用いて空間内の様子を観測する
- 有用な情報を抽出して必要とするものへ提供する
- 観測結果に応じてロボットなどを適切に制御し、人に対して作用をもたらす
- これら、一連のプロセスをスマートホーム化と呼ぶ
遠隔見守り支援ツール「トークA愛」
(株)HIRO ICT 研究所では、スマートホーム化を実現するために、Dialogflow技術を使用して、 以下のような機器でスマートホーム化システムを構築します。
-
Androidスマホ・タブレット(Android6.0以上)
- Androidスマホ・タブレットで「トークA愛」を呼び出すことができます。
-
ロボット(PaPeRo i):オプション
- 「トークA愛」にWiFi接続のロボット(PaPeRo i)を接続すると、受付業務などに使用することができます。
-
学習リモコン(Nature Remo):オプション
- 「トークA愛」にWiFi接続の学習リモコンを接続すると、家電製品などの各種のリモコンを持つ機器を音声で制御できます。
「トークA愛」のチャット電話画面の例:エーデルワイズ(Youtube動画)を表示する
遠隔見守り支援ツール「トークA愛」
遠隔見守り支援ツール「トークA愛」とは
「トークA愛」は、タブレット(Android)で動く遠隔見守りアプリケーションです。
- チャット電話機能をサポートして、被介護者(見守られ側)と介護者(見守り側)の音声による遠隔見守りを可能にする新しい形態のコミュミケーション・ツールです。
- 学習リモコン(Nature Remo)を使用して、家電機器等の制御ができます(開発中)。
- GoogleのSmart Home通信プロコル(OpenThread/OpenWeave)を使用して、Smart Homeを実現できます(開発中)。
チャット電話とは
チャット電話は、「問いかけ型:被介護者→システム(介護者の代行)」「呼びかけ型:システム(介護者の代行)→被介護者」「電話型:介護者⇔被介護者」の三種類のコミュケーションをサポートします。
-
問いかけ型チャット電話機能:
音声による被介護者の質問や要求に答えます(下図① )。 -
呼びかけ型チャット電話機能:
音声によるアドバイスで、被介護者を見守り、認知症や病気を予防します(下図②)。 -
電話型チャット電話機能:
介護と被介護者の間のリアルタイムなチャット電話機能をサポートします(下図③)。
「トークA愛」のチャット電話機能
「トークA愛」が接続するチャット電話交換サーバ
「トークA愛」 は、インターネット上にあるチャット電話交換サーバに接続されています。
チャット電話交換サーバは、WebSocketサーバの機能を使用して、IP電話のSIPサーバ(電話交換機)と同じ働きをします。
「トークA愛」 は、チャット電話交換サーバを介して、他の「トークA愛」 とチャット電話を行うことができます。
「トークA愛」が接続するチャット電話交換サーバ
「トークA愛」によるSmart Home機能(開発中)
GoogleのSmart Home通信プロコル(OpenThread/OpenWeave)を使用して、Smart Homeを実現できます。
Googleの自然言語解析エンジン「Dilogflow」を利用
「トークA愛」は、自然言語解析エンジンとしてGoogleが提供する「Dilogflow」を使用しています。
自然言語解析エンジン「Dilogflow」とは
- 自然言語処理を提供しているサービス
- チャットボットを簡単に作成することが出来るサービス
- 「OK Google...」なアプリが実装可能
- Facebook, LINEなどにすぐ連携可能
自然言語解析エンジン「Dilogflow」の凄いところ
- コードを書かずに自然言語処理の実装ができる
- 対応言語が豊富!
- 英語や日本語を始め、中国語、ロシア語、イタリア語など対応
- チャットボットサービスに簡単に連携することができる
- Facebook, LINE, Slack...
- SDKが豊富
- Android, iOS, Python, NodeJS...
- アナリティクス機能
- Dialogflowを通じた会話は全てログに残る
「Dialogflow」で出来ること
- 発言からユーザーが何をしたいのかを分析
- ユーザーは挨拶をしたいのか
- ユーザーは航空券を検索したいのか
- ユーザーは音楽を聞きたいのか
- ユーザーの発言にどんなパラメータが入っているか分析
- ダンス音楽の種類、ダンス音楽の曲名、...
- BOTに必須パラメータがあれば発言するまで聞き返す
- Youtube画面で表示したダンス音楽を指定する場合、ダンス音楽の種類やダンス音楽の曲名を言うまで聞き返す
- 答えが決まっている会話
- 「こんにちは」ときたら「こんにちは」と返す
「Dialogflow」で出来ないこと
「トークA愛」では、以下のような「Dilogflow」で出来ないことは、別のWebサーバで処理をします。
「Dilogflow」から別のWebサーバのAPIを呼び出す処理は「Fulfillment処理」と呼ばれます。
- 高度な判断や、計算などの動的な処理(別のWebサーバで実装する)
- 指定されたダンス音楽の種類やダンス音楽の曲名に対応するYoutube動画のビデオIDがあるかどうかの判断
- ダンス音楽の曲名に対応するYoutube動画のビデオIDの取得
「Go言語」を使用した「Fulfillment処理」
高度な会話処理は「Go言語」を使用した「WebSocketサーバ」で行う
「Dilogflow」から別のWebサーバのAPIを呼び出す処理は「Fulfillment処理」と呼ばれます。
「トークA愛」では、「Dilogflow」では処理できない「Fulfillment処理」を「Go言語」を使用した「WebSocketサーバ」で行います。
「Go言語」を使用した「WebSocketサーバ」には、以下のような特徴があります。
- 非常に高速に処理できる
- 「Go言語」はC言語と同じコンパイラ言語ですから、インタプリター言語の「Java」や「Python」「PHP」などに較べると 10倍以上は高速に処理できます。
- 「Go言語」はインフラである「WebSocketサーバ」機能をシングル・プロセスで実装しますから「Apache」のように クライアント単位にプロセスを割り当てる方式と比べると、オーバヘッドが小さく「同時10万アクセス問題」も解決します。
- 検索のためのデータベース・エンジンが不要
- 「Go言語」を使用した「WebSocketサーバ」を起動時に、あらかじめ作成されたJSONファイルを読み込み、 「Go言語」の言語仕様である構造体としてメモリ上に読み込むことができます。
- 「Go言語」の言語仕様である構造体としてメモリ上に読み込んだデータは、「Dilogflow」から呼び出された時に高速に処理できます。
- 「Apache」や「AWS Lambda」では、このような各アプリケーションに共通なデータは、 「MySQL」や「AWS DynamoDB」のようなデータベース・エンジンに格納して、「Dilogflow」から呼び出される都度、 データベース・エンジンにアクセスする必要がありますが別プロセス処理になるのでオーバーヘッドが大きいです。
SIPサーバのような電話交換機能を持つ「Go言語」を使用した「WebSocketサーバ」
「Go言語」を使用した「WebSocketサーバ」は、SIPサーバのような電話交換機能を持つことができます。
「WebSocketサーバ」機能が、SIPサーバのような双方向通信機能を持っているからです。
「Go言語」を使用した「WebSocketサーバ」の電話交換機能には以下のような特徴があります。
- テキストベースの交換処理
- SIPサーバと異なり、音声データの交換は不要であり、サーバ負荷が非常に軽い
- メールのように宛先を複数指定できる
- 宅配便のように配達時間を指定できる
- チャットBOT処理
- 一般的な電話と異なり、相手が人間である必要がない「チャットBOT」処理が可能である
会話ロボット「PaPeRo-i」
ロボット(PaPeRo-i)と会話する
人間(ホモサピエンス)は会話する動物です。 なぜ、人間(ホモサピエンス)はネアンデルタ-ル人に勝てたのでしょうか。 以下のような理由が考えられます。
- 喉の上気道や喉仏が人間と違いあまり発声に適していない構造だった。
- 脳の前頭葉も人間と異なっていた。
- よく喋れたとしても数個の単語からなる短文程度のものだった。
- 音域も狭く喋れる音も限られて50音も喋れなかった
従って、ネアンデルタール人のコミュニケーション能力は限定的でした。 このコミュニケーション能力の差が、人間(ホモサピエンス)はネアンデルタ-ル人に勝てた理由と考えられます。
ロボット(PaPeRo-i)と会話する
ロボット(PaPeRo-i)とは
PaPeRo-iは、ルータ機能を内蔵したオープンゲートウェイロボットです。
- カメラ×2: VGAカメラ×2 (顔認識用)、SVGAカメラ×2 (静止画用)
- マイク×2: 指向性(音声認識用)、無指向性(ノイズキャンセラー用)
- スピーカ: 音声合成用、音楽演奏など
- 赤外線センサー: 人検知用(1m以内、±40°)
- 温度センサー: 0℃~40℃・湿度センサー: 20%RH~ 90%RH
- 加速度センサー: 地震や床音の検知などの応用可能
- ボリューム: ソフトでも音量の変更が可能
Pythonによるロボット(PaPeRo-i)の制御
Pythonによるロボット(PaPeRo-i)の制御は、「ソフィアプランニング株式会社」がサポートしています。
PaPeRo-i Developer Forum(ソフィアプランニング株式会社)Google Blocklyによるロボット(PaPeRo-i)の制御
Google Blocklyによるロボット(PaPeRo-i)の制御は、「ソフィアプランニング株式会社」がサポートしています。
Google for Education > Blockly
お花畑4