2019年10月 日本経済新聞・記事掲載「複数分野の技術を融合」

自然言語処理技術、音声認識技術、画像解析技術は、人工知能AIの3大技術要素であるが、お客様が抱えているビジネス課題を怪k接するためには、それらの技術の「融合化」が必要である。

音声認識技術単体では、発話した音声を話者分離してリアルタイムにテキスト化はできるが、話せば話すほど蓄積される大量のテキストデータを処理するためには自然言語処理技術が必要である。

また、静止画や動画に潜む文字データはそのままだと人間が読めるがコンピューターが処理できない「非構造化」データであるため「文字起こし」をしなくてはならないとしてAI-OCRjという概念が生まれたが、文字起こしされた大量データはやはり自然言語処理技術が必要なのである。

したがって、音声や画像をビジネス課題解決のために最終的に必要とするのは自然言語処理技術であり、各AI技術を「融合」できてこそ初めてお客様のビジネス課題が解決できるのである。