NTTの技術で “光が創る未来” を提案「NTT R&D FORUM 2024 IOWN INTEGRAL」開催
面倒な発注作業もAIがやってくれるようになる(筆者撮影)
業務マニュアルをAIが自分で理解して遂行
NTT独自の生成AI「tsuzumi」の展示では、直近1年の研究成果として「視覚読解能力」と「エージェント能力」を紹介。
視覚読解能力とは写真や表を読み取る能力、エージェント能力とは人間と同じように検索エンジンを利用したり業務マニュアルを理解したりできる能力のこと。これらが優れていることで「指示された商品の検索と業務マニュアルに沿った発注」ができるという。
デモンストレーションでは、商品の写真を読み取った「tsuzumi」が、瞬時に検索ワードに変換し、インターネット上で商品を検索。型番など必要な情報を取得し、さらに業務マニュアルに沿って購買システムに商品を発注してみせた。色違いの複数の型番が載ったリスト(画像データ)をtsuzumiに見せて、特定の色を指定しても同じことができた。
「tsuzumi」が一般的な生成AIと大きく異なるのは「AIコンステレーション」という概念である。これは異なる専門知識を持った複数のtsuzumi同士が会話をして答えを導くというものだ。参照資料によると、AI同士の会話は人間同士のそれよりはるかに速く、タイミングを合わせるために、遅延のない通信が必要なのだという。