テラデータが見ているもの

「テラデータは、データウェアハウスのサーバを提供している会社でなかったか?」
「クラウド経由で他社プラットフォームもサポートしているのか?」
「Open Source(OSS)のソリューションもサポートしているのか?」
「ビジネス・コンサルやデータサイエンスの分野までサービスを拡充しているのか?」
というような声をきくことが増えている。
このページでは、テラデータのテクノロジー、サービスの変革と、その先に目指している方向性について解説する。

日本テラデータ株式会社
プロフェッショナル・サービス本部ビッグデータ分析ラボ 部長 島田 茂

アナリティクスとは何?

アナリティクスとは、「データの中に意味のあるパターンを探索し、解釈し、そして伝えること」とされ、さらに最近のディープ・ラーニングにみられるような最新の予測モデル構築まで含むという。これは、日常で当り前のように繰り返している人の思考過程「出会った事象を構成要素に分解し、その構造を組み立て、次に同様の事象が生じた際にどう対処すべきか予測する」(*1) 行為と同じである。また、それは、広義の分析を意味し「思考、論理、(狭義の)分析」を含む一連の過程といえる。図1は、アナリティクスの典型的なプロセス・作業過程と各過程における必要な技術要素を示している。

図1. 人の思考と対応する技術要素

アナリティクスの歴史は、人類誕生までさかのぼれるかもしれない、人の生まれ持つ基本的な能力である。先を見通したいという本能的な欲求でもある。IT が普及する以前、その能力は個人に依存する限定的なものであったが、ITの進化・発展・普及が、その能力を飛躍的に拡大している。データが増えれば増えるほど、その分析後の予測精度は一般的に言って向上する。よって、今後、より大きく人の活動・社会生活に貢献するIT分野は、「アナリティクス」だといっても過言ではない。
テラデータでは、先進アナリティクスの拡大・成長・発展を図2に示すような5段階で示しており、その進化の過程に基づき様々な支援を行っている。その最終ゴールは、自律的に学習し自動的に判断処理できる段階まで昇華していくことである。例えば、自動運転の実現や自然言語処理、他言語翻訳などにみられるようなアナリティクス処理である。

図2. アナリティクスの5つのステージ

テラデータでは、先進アナリティクスの拡大・成長・発展を図2に示すような5段階で示しており、その進化の過程に基づき様々な支援を行っている。その最終ゴールは、自律的に学習し自動的に判断処理できる段階まで昇華していくことである。例えば、自動運転の実現や自然言語処理、他言語翻訳などにみられるようなアナリティクス処理である。

テラデータの変革を支える新たなソリューション、サービス

テラデータは、2016年に新たなサーバ製品「Teradata IntelliFlex™」を発表した。その名が示す通り、更にIntelligenceを増した高機能・高性能に加え、Flexibleで大規模なデータ分析処理が可能になっている。

図3. Teradata InteliFlex™

独自サーバに加えて、アナリティクス用のクラウド戦略も発表した。テラデータ独自のクラウド・サービス(「Teradata IntelliCloud™」という)、Amazon Web Services(AWS)やMicrosoft Azureというパブリッククラウドへの対応、そしてVMwareを活用したプライベートクラウドだ。つまり、どこでもテラデータのソリューションが稼働するようになっており、「Teradata Everywhere™」というハイブリッドクラウドが実現しているのだ。

図4. Teradata Everywhere™のラインナップ

また、アナリティクスに必要なソフトウェアソリューションも拡大・強化している。独自データベースであるTeradata Databaseは、JSON対応、カラムナーDB処理やマルチテナント対応など更に最新化・高機能化し、他社の追随を許さない製品を提供しているだけではなく、ディスカバリーソリューションTeradata Asterをアプライアンスサーバの他にソフトウェア、クラウドで提供し、幅広くフレキシブルに利用できるようにした。またTeradata Asterを補うAppCenterの機能を拡充し、アナリティクス結果を更に判り易く、管理しやすくしている。分析エコシステムを構築する要となるTeradata QueryGrid™においては、OSSのPrestoとの協調処理などが強化されている。

図5. Teradata QueryGrid™によるシステム間のクエリー連携

テラデータは製品をお客様に最適に活用していただくためのプロフェッショナル・サービスも強化・拡大している。マネージド・サービスを強化し、クラウド向けのサービスを開始している。また、各業種特有のビジネス・プロセスまで踏み込んだアナリティクスを提供するためにインダストリー・コンサルタントとデータサイエンティストを擁するアナリティクス・ビジネス・コンサルティング本部を立ち上げた。各スペシャリストの協業・協調による相乗効果で、アナリティクスの価値が最大化されるサービスをお客様に提供している。

加えて、特筆すべきは、テラデータが自社の製品のみならず、OSSとして提供されている先進アナリティクス・ソリューションを積極的に取り入れ、サポートし始めていることだ。OSS コミュニティに積極的に貢献し、Prestoなどいくつかのコミュニティではリードする立場を示している。さらにOSSに特化したビッグデータコンサルティングサービスを提供するThinkBig社を買収・統合し、OSS関連のサービスを強化している。


テラデータのこれらの新しいソリューション、サービスの展開はここ数年で一気に強化されてきている。これは、アナリティクスがビジネスでより重要な要素となり、包括的かつ先進的なサポートが求められているためである。

テラデータが目指すもの

ある統計によると2017年に世界中のデジタルデータは4ゼタバイト(*2)をこえるといわれている。2020年には更に拡大され40ゼタバイトに達するという予測もある。その背景・理由として、まずIoTの普及が更なるデータソースとデータの種類を増加させている状況がある。


また、CPU、メモリー、ネットワークなどのITを支えるテクノロジーは、まだまだ進化することに疑いの余地はない。1995年に始まったインターネットは、更に世界中の隅々までゆきわたり、今後はモノだけではなく、人や動物などの生体的な情報もつながっていくかもしれない。ビッグデータの時代は留まるところを知らず、更に拡大していくことは明白である。

今後、更に大きなデータを扱い、世の中により大きなアナリティクスの価値を生み出すために何ができるか、何が必要か、次世代の先進アナリティクスのテクノロジー、ソリューション、サービスのあり方が問われてきている。例えば、以下のような分野において、より先進的で新しい動きが出てくるだろうと考えられる:

  • アナリティクスは、伝統的なリアクティブなコンピューティング処理からプロアクティブな予測を意識した処理に、よりシフトする

  • 既存のベンダー独自のアナリティクス用システムの世界から、OSSを包含する様々なシステムが共存するエコシステムの時代へ突入、クラウドがそれを加速させる

  • リアルタイム性の高いアナリティクス処理がIoTの進化と共により注目される

  • 機械学習が更に充実し人間の思考形態をより意識した処理とその分析結果の見せ方が充実、AIが目指しているような世界が出現

 

アナリティクスにおいては、ITテクノロジーだけではなく、ビジネスデータサイエンスなど様々な要素が必要になるので、全体的なビジョンとアーキテクチャーをしっかりと持ち、統一的なガバナンスを持って、大きなシステム・サービス活動を推進することが肝要である。

テラデータは、米ガートナーのマジック・クアドラント”Data Warehouseand Data Management Solutions for Analytics”(2017 年)でリーダーと評価され、クリティカル・ケイパビリティ・レポート2017年版でアナリティクス向けデータマネジメント・ソリューションにおける全てのカテゴリーで最高スコアを獲得する(*3)などの外部調査会社の評価でも確たる地位を築いている。これはテラデータが、昔も今も、新たな状況に対して、より包括的な見方、アーキテクチャーを重視したソリューション、サービスの提供に重きを置いているからに他ならない。Teradata Unified Data Architecture(UDA)というアーキテクチャーを掲げ、ダイナミックに変化する先進アナリティクスの分野においても全体最適を実現する考え方を持っている。

図6. Teradata Unified Data Architecture™

この全体的なアーキテクチャーがテラデータの強みであり、今後の先進的なアナリティクス実現においても大きな価値を生み出す源泉である。個々のテクノロジー、ソリューション、サービスは、今後、自社だけではなく、社外のオープンな団体、アライアンス・パートナー各社と共に、いち早く実現し、世の中に新たな価値を出し続けていく。テラデータはビッグデータ時代の先進アナリティクスを支える集団であり続けることを目指している。

*1( 畑村式「わかる」技術、畑村洋太郎、講談社現代新書)因みに「アナリシス・ Analysis」は似たような意味をもつが、その意味するところは狭義の分析であり「事象を最小構成要素に分解していく作業である。」

*2 ゼタバイトは10の21乗をさす。TBの次に大きな単位はPB(ペタバイト)、次がEB(エクサバイト)、その次がZB(ゼタバイト)になる

*3 各レポートについては、プレスリリースを参照