デジタル情報分析、不祥事洗い出しに貢献 調査会社へ依頼急増 AI活用で閲覧速度アップ

デジタルフォレンジックが行われているフロンテオのデータサイエンスラボ(同社提供)
デジタルフォレンジックが行われているフロンテオのデータサイエンスラボ(同社提供)

企業不祥事が発覚した際に第三者委員会がパソコンなどに残されたデジタル情報を解析する「デジタルフォレンジック(DF)」を活用する動きが広がっている。民事訴訟に備え、不正の証拠をつかむため、調査会社への相談や依頼が急増中だ。最近ではデータ分析技術が向上し、人工知能(AI)を使った調査も行われている。

DFは、東芝の経営陣が昨年の定時株主総会で株主提案と議決権行使を妨害した問題や、放送事業会社の東北新社による総務省職員の接待問題などを解明する際に使われ注目を浴びた。今では機密情報の漏洩(ろうえい)や談合、横領などの社内不正からサイバー攻撃による外部侵入に至るまで、痕跡を洗い出す手段として欠かせない存在となっている。

もともとは1980年代に欧米の警察機関が犯罪捜査で採用したのが始まり。2006年に米国の民事訴訟で、当事者が証拠として全電子情報を提供する「eディスカバリー」制度が創設されたのを契機に企業による活用が一気に拡大した。その後、日本でも知られるようになった。

不正調査で最も労力がかかるのが電子メールや文書など膨大な情報の閲覧だ。調査を行う弁護士が重要情報を抽出するまで、かなりの時間を要する。そこで活躍しているのがAIだ。

これまで1800件以上の不正調査を手掛けてきた国内調査会社のフロンテオは平成24年にAIエンジン「KIBIT(キビット)」を開発。東芝の株主総会の運営をめぐる問題でも使われた。

東芝の調査では約78万件に及ぶメールや添付ファイルをAIが分析したが、まずは1500~2000の文書をランダムに抽出。それを弁護士が「関連あり・なし」で仕分けた。

弁護士が怪しいと感じた「関連あり」の文書を20~30件選んで、AIが分析するための「教師データ」とした。これをベースにAIが残りの資料について関連あり・なしと判断。さらに関連度について、0~1万点まで採点した。

池上成朝取締役は「AIのおかげでスコアの高い文書から評価できるようになる。(この結果)時間とコストを大幅に削減できる」と説明する。フロンテオは東芝の調査時間を公表していないが、例えば、1万件の文書を5人で読み込むには6日かかるが、AIを活用すれば3日で済むという。

また、重要情報を見つけ出すには弁護士の勘もある程度必要だ。「関連あり」の抽出で、怪しい文書を選ぶことができるかどうかが調査結果を左右する。何気なく会食の日程についてやり取りしているようにみられるメールに不審を抱き、「関連あり」とすれば、AIは微妙なニュアンスの違いまでも読み込み、高い点を付けてくれる。

調査工程では閲覧作業でAIを活用しているが、池上氏は「それ以外に広げるのが今後の課題だ」と話す。

東芝の調査が話題となり、フロンテオには企業からAIの問い合わせが増えている。「最も多いのが情報漏洩で、毎日問い合わせが来ている」(フロンテオUSAの田中志穂氏)という。

企業向けセキュリティーサービスを展開するストーンビートセキュリティ(東京都千代田区)にもDFの相談や依頼が増えている。特に目立つのが中小企業からだという。サーバーなどに侵入してデータを暗号化して、復元する代わりに金銭を要求する「ランサムウエア」の被害が増えているためだ。

佐々木伸彦社長は「(在宅勤務が広がったこともあり)新型コロナウイルス感染拡大前と比べて、3、4倍の問い合わせが来ている」と明かす。DFの需要は大手だけでなく、中小でも活発になっている。(黄金崎元)

デジタルフォレンジック フォレンジックは「法廷の」という意味を持ち、犯罪や不正の証拠を見つけるために電子媒体に残されたデータを抽出・分析する技術のことを指す。犯罪捜査で活用が始まり、米国では民事訴訟で多用されている。日本でも企業の不正調査などで利用が広がっている。