データセクション株式会社 取締役CTO 池上 俊介(いけがみ しゅんすけ)氏
今のところ、ビジネスの現場で人工知能を身近に感じることはまだ少ないかもしれません。しかし、人工知能はいつのまにか私たちの生活に溶け込んで、想像する以上に社会を変えていくものになろうとしています。人類が直面している膨大なビッグデータの解析処理に日々挑んでいるデータセクション株式会社取締役CTOの池上俊介氏に伺いました。
――池上さんと人工知能とのかかわりについて教えてください。
98年に卒業した慶應義塾大学SFCキャンパスではインターネットと自然言語処理に関心がありました。自然言語処理は大量のテキストデータをコンピュータに処理をさせ、統計的に知恵を取り出すための学問です。2000年に当時流行していたメールマガジンとして書かれた内容を再活用するベンチャーをつくろうと知人から誘われて、データセクションの創業メンバーになりました。今年で18年目になります。
――当時はまだ人工知能はブームになる前ですね。
人工知能がブームになったのはここ2、3年ほどのことです。2006年に深層学習(ディープラーニング)が登場する前から、ある文章がポジティブな表現なのか、ネガティブな表現なのかを判定するような機械学習の手法を日常的に使っていました。
――当時は大量なテキストというもの自体、入手することが難しかったのでは。
当時はメールマガジンやブログなど1日数千記事のデータを解析対象としていました。今ではTwitterのデータだけで1日数百万ツイートほどありますから、当時とはくらべものにならないほどの大量のテキストを解析することが可能になっています。
およそ人類がこれまでの歴史で蓄積したのと同じくらい巨大なデータが、ここ直近2年ほどで新たに生成されていると言われますが、当社では、そういったビッグデータを解析処理するために、深層学習などの人工知能技術を用いています。
――人類が扱うデータは今後もどんどん増えていきますね。
今後はIoTセンサーや生体データなどあらゆるデバイスからデータが生成されていきます。大量の流れゆくデータを一瞬のうちに自動で読み込んで、人間が理解できるような文章で解説するような仕組みが必要になってくると考えています。スポーツデータから試合を解説したり、直近5分の市況をリアルタイムで解説したり、生体データから体調を分析して、飲みすぎを注意してくれるようなものもできるのではないかと思います。
――データセクションではどのようなサービスを提供されているのですか。
Twitterやブログなどの大量テキストデータを解析し、広告代理店、リスク情報を早期検知したい会社、事故や犯罪を発見したい会社といったクライアントに提供しています。
たとえば広告代理店のクライアントであれば、商品がどのように消費者に受け取られているか、テレビCMのメッセージがどの程度伝わっているかといったことを、「ソーシャルメディア分析」として提供しています。 「風評リスク対策」のサービスも提供しておりますが、こちらはリスク情報をモニタリングするものです。何かしらの問題が起こったときに、ネットでその情報が広まっていることに気づくのが遅れると、重大な問題に発展しかねませんので、それをモニターして検知してお知らせしています。クライアントは、企業のリスク対策部門や保険会社などです。
そのほか、最近では深層学習を用いた画像や映像の解析サービスにも力を入れています。ドローンを飛ばして太陽光パネルの異常をチェックしたり、自動車に搭載されたドライブレコーダのデータを解析したり、様々に人工知能技術を活用しています。
――様々なサービスが現実的なものになっているのは深層学習の功績でしょうか。
かつては困難だった画像や文章のニュアンス判定などができるようになったのは深層学習の功績です。ただし、技術は進展しているものの、本当に人類の役に立つようなサービスが登場するのはこれからだと思います。車で言えば、良いエンジンだから良い自動車になるわけではなく、良いエンジンに合わせたデザインやサービスやセールスモデルを構築して、良い自動車が生まれます。人工知能技術を使った本当に革新的なサービスが生まれるのはこれからだと思います。
――人工知能はブラックボックスなので、ビジネスに応用するのが難しいという指摘もあります。
たとえば、人工知能がある対象をAにカテゴライズした理由がわからない、というようなことですが、シンプルに解決すると元々のデータを学習させる際に「Aに分ける理由」も含めてカテゴリ分けしておけば、「こういう理由でAに分けた」ということを答えられるようになります。学習データの作り込みによって、ブラックボックスをある程度解消できるケースも多いのではないかと思います。
また、今、別の方法として取り組んでいるのは、現象を解説する文章を人工知能に学習させて、データを解説する文章を自動的に生成する「AI記者」です。
――2016年に話題になったAI記者のプロジェクトについて教えてください。
このプロジェクトは、2016年に中部経済新聞が創立70周年を記念して企画されたものです。中部経済新聞に過去に掲載されたエッセイや新聞記事の大量のデータを学習し、70周年についての新聞記事を人工知能に書かせようというプロジェクトでした。
できあがった記事は3段落ありますが、段落ごとにテーマを複数指定し、そのテーマについての文章を自動的に作成しています。たとえば最初の段落は、中部経済新聞社創立当時のエピソードで、戦争当時のことを書くように指定して文章を自動生成しているわけです。
人工知能には過去記事データと記事内の代表的なワードをテーマとして紐づけて学習させました。文章生成には、マルコフ連鎖という考え方を使っています。学習データにおける文節ごとに次の文節が来る確率を計算していて、段落ごとのテーマを指定して条件を変えることで文節間の確率が変化し、多様な文章を自動的に生成させることができます。
たとえば「人工知能をめぐる研究成果」という文章でいえば、「人工知能を」に続くワードは無数にあっても、「研究成果」というテーマが指定されていれば、間に「めぐる」というワードが使われる確率は他のワードよりも高くなります。
この時はプロジェクト期間が2週間くらいしかなかったので、人工知能が作成した数十の段落文候補を人間の目で評価し、全体の記事としてすっきりするように組み合わせました。
――その組み合わせ作業は人間でないとできないのでしょうか。
このプロジェクト当時ではまだできませんでしたが、今では、そんなに大きくない記事であれば、段落ごとのつながりの確率を学習させて、ある程度、自動的に選択させることができます。たとえば起承転結のようなものでも、最初の「起」で生成された段落につながる次の段落を選び、最後の「結」の段落を生成していきます。
――人工知能が良い文章を作るために必要なことは?
大量につくられる文章候補から良い文章を選択するために、生成する人工知能と別に文を評価する人工知能を用意します。評価用の人工知能の学習データを準備するためには良い文章を大量に集める必要がありますが、何をもって良い文章であるかという価値基準がないとデータを集めることができません。人工知能を適切に学習させて、人間なみに良し悪しを評価できるようになると、より良い文章が期待できます。
――人工知能による文章生成はどのようにビジネスに応用できるでしょうか。
データに対して短いコメントをつけるという人工知能は、すでにワシントンポストなどの海外メディアが導入しています。たとえば韓国・平昌オリンピックでも、スポーツの結果データに対して、どのチームの誰が得点してどんなスコアでどんな試合運びだったかという記事を自動的に生成する人工知能が活躍していました。また、選挙速報などの分野でも、開票データから、どの選挙区で誰が何票とったのかという短い文章を一瞬のうちに作って発表するようなケースで有効だと考えています。
私たちも、スポーツや不動産、求人等の分野でいろいろなご相談をいただいています。例えば数百万件のデータやスペックに解説する文章やキャッチコピーを自動生成するといったようなことです。
――アイドルに代わって人工知能がTwitter投稿する実験もされたそうですね。
実在アイドルの過去のTwitterデータを学習させておき、「月曜日」「朝から雨」といったその日の状況に合わせた文章を自動的にツイートするというものです。このときは、実際に2週間ほど人工知能がアイドルの代わりにつぶやいていたのですが、ファンは気づかなかったようです。
――生産性が上がるオフィスデザインの設計のようなものにも、人工知能が活用されることがあるかもしれませんね。
私たちが人工知能を設計したり、いろいろなデータセットを作ったりするには、人間同士が相談し、意思疎通することが不可欠ですから、コミュニケーションはとても大事です。今までのように会議室でみっちりと議論するのではなく、「ちょっと話そうよ」と気軽に話ができるような場所から、新しい価値やコラボレーションが生まれてくるように感じています。
――オフィスワーカーの働き方も、今、変わりつつあります。
リモートワークなど在宅勤務を導入する会社も多いようですが、オフィスに来るのに1時間かかるとすると、往復で2時間かかるということは、勤務時間8時間の2割は移動にかかっていることになりますね。2割のコストを払ってまでオフィスに来るからには、家で仕事をするより2割以上の"メリット"がないと見合わないと思います。それがコミュニケーションということかもしれません。これからのオフィスはそういうメリットを求められるようになると思います。そのためにオフィスにいろいろな仕掛けがあると、すごくおもしろいですね。
――みんなの仕事で、面白いと思われた記事を教えてください。
オフィスのことだけでなく、人工知能やRPAのことも取り上げていて、興味深く読みました。オフィス訪問では、アットコスメさんの記事が面白かったです。とても素敵なオフィス空間ですよね。
【参考】
「@cosme(アットコスメ)を運営する株式会社アイスタイルのオフィスは、オープンでコミュニケーション豊かな空間(オフィス訪問[1])」
ディープラーニングがその真価を発揮するためには、優れたデータが必要だということがわかりました。人類が日々生み出している膨大なデータを処理するために、今、人工知能が期待されているのですね。そして私たち人間は何をすればいいのか。その鍵は、やはりコミュニケーションにあるのかもしれません。
プロフィール
データセクション株式会社 取締役 兼 CTO
1998年、慶應義塾大学総合政策学部を経て株式会社PFUに入社。2000年7月、データセクション株式会社を設立し自然言語処理、大規模データ処理技術を活用したビジネスモデルに従事。2005年からブログのクロールアーカイブを実施し、ソーシャルメディアを基にした大規模データの自然言語処理に強みを持つ。慶応義塾大学SFC研究所訪問研究員。
編集・文・撮影:アスクル「みんなの仕事場」運営事務局
取材日:2018年5月2日
2016年11月17日のリニューアル前の旧コンテンツは
こちらからご確認ください。