(国内最大級のデータウェアハウス&データ活用コンファレンス「Teradata Universe Tokyo 2013」セッションより)

ヤフー株式会社 | 250名以上の現場担当者がデータ活用を実践、市場ニーズに応じたサービスを迅速に提供

ヤフーの「爆速」を支える Teradataデータウェアハウス(DWH)は、社内にあるさまざまなデータを収集し、各種サービスの利用状況や広告の効果検証などの可視化を実現しています。また、多くの社内ユーザーが自由にデータを分析し、活用ができる環境を整備する施策も行い、データ活用の促進を進めています。

「爆速」を支えるスピーディーな分析の実現を目指す

国内最大級のインターネットポータルサイト「Yahoo! JAPAN」の運営を通じて、約100種類にのぼるサービスを提供するヤフー。同社では、世の中の抱える課題を IT の力で解決する「課題解決エンジン」としての役割を担うべく、「爆速」をキーワードとする成長戦略を描いています。この成長戦略実現に向けて、「状況把握」から「意思決定」、そして「実行」というサイクルの迅速化を図るためのデータ分析環境を整備し、現場の広範なユーザーへの普及と定着化を推進しています。
ヤフーでは、2002年に Teradata DWH を導入しました。以降、システムの増設やリプレースを重ねながら、DWH によるデータ活用を進めてきました。当初は 4名で構成される専任チームが、各事業部からの委託を受けてデータを抽出・分析し、その結果をその都度レポーティングするというプロセスでした。しかし、各部門でのデータ分析ニーズが高まるにつれ、専任チームだけでは対応しきれなくなってきました。そこで 2009年、各事業部に Teradata を開放し、データ分析のセルフサービス化を開始しました。現在では、多くの従業員が必要に応じて、データの分析を行える体制が整っています。具体的な仕組みとしては、ターゲティングやレコメンドのための定型的な集計については Hadoop を、非定型的な分析・集計には Teradata を活用しています。
さらに 2012年11月末に、「爆速」を支えるよりスピーディな分析の実現を念頭に、Teradataプラットフォームを最新機種にリプレースしています。処理性能の強化を図り、従来比で 4倍のデータ容量、2倍の CPU性能、5倍のディスクIO性能をそれぞれ実現しています。これにより、クエリー数が全体で 18%増加し、現在では 1日当たり約12万のクエリーがシステム上で実行されるようになりました。

SQLの知識不要で容易に分析が行える環境を実現

データを分析、活用する環境は整備されましたが、現場におけるデータ分析の取り組みをさらに活性化するには課題も残っていました。それは、データ分析に必要な社員のスキルの問題です。定型的な分析ニーズに対しては、自社開発のクロス集計ツールやダッシュボードなどを用意し、誰もが手軽に分析を行える環境が整備されました。しかし、各事業部が実施する施策の効果検証やサービスの利用状況分析といった非定型的なデータ分析については、やはり専任の担当者に依頼する必要がありました。というのも、こうした高度な分析を行うためには、SQL の知識が必要だったからです。

そこでヤフーでは、「SQL のスキルはないものの、Teradata を使って非定型の分析処理を実行したい」という、いわば “中間層のユーザー” のニーズに応えるべく、テラデータが提供する Webベースの分析ツール「AccessNavigator Web」を導入しました。これにより、SQL の知識がなくても、直観的な操作によって、必要なデータの抽出・集計を行ったり、加工したデータを Teradata上に格納できるような環境を実現しました。またツールの導入にあわせて、ユーザーのデータ活用を支援するためのマニュアル類も整備しています。各事業部門が実際に行うさまざまな分析シーンに沿ったテンプレート・マニュアルを構築し、ユーザーがAccessNavigator Web上でガイダンスに従い、ステップ・バイ・ステップでデータの抽出・集計を実施できるようになっています。これにより、セルフサービスによるツールの展開、定着を図っています。

このような取り組みの結果、同社では現在、250名を超える従業員が幅広い用途でデータ活用を実践しています。検索やショッピング、オークションなどの利用状況の可視化、あるいは広告の効果検証、新サービス開発に向けたシミュレーションなどを行っています。今後もヤフーでは、Teradata と Hadoop を必要に応じて適材適所に活用し、ユーザーがシステムを意識することなく使いこなしていけるような環境を目指していく考えです。

(本事例は、国内最大級のデータウェアハウス&データ活用コンファレンス「Teradata Universe Tokyo 2013」のセッションで発表された内容です。)